
偷摸内卷,DeepSeek-V3深夜惊爆上新,将开源贯彻到底,R2发布指日可待?
导读 深夜突袭!DeepSeek-V3携6850亿参数“偷袭”代码界,Claude 3.7瑟瑟发抖?——AI基建再掀技术革命。 2025年3月25日,当全球AI巨头还在为发布会排期时,中国团队DeepSeek已悄然在Hugging Face...
导读 深夜突袭!DeepSeek-V3携6850亿参数“偷袭”代码界,Claude 3.7瑟瑟发抖?——AI基建再掀技术革命。 2025年3月25日,当全球AI巨头还在为发布会排期时,中国团队DeepSeek已悄然在Hugging Face...
作为一名制造企业软件内部的软件开发者,如何才能更好的助力公司的数字化转型?王嘉琪和他的团队走出了一条或许可以“复制”的道路。 王嘉琪是博世汽车电子事业部的数字化产品开发经理,他领导的团队善用 Mendix 低代码对工厂数字化项目进行规划与开...
2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推...
近日,浪潮信息宣布推出元脑CPU推理服务器,可高效运行DeepSeek和千问QwQ等新一代大推理模型。元脑CPU推理服务器NF8260G7和NF8480G7设计采用4颗高性能通用CPU和多通道内存系统,通过先进的张量并行策略和AMX加速技术...
在近日举行的主题为“有云处皆智能”的2025浪潮云战略发布会上,浪潮云率先发布分布式智能云战略,计划半年内完成现有分布式云节点的升级,今年内落地分布式智能云节点超过1000个,成为“智慧系统的全场景运营商”,实现“有云处皆智能”的战略愿景。...
导读 在人工智能狂飙突进的今天,神经网络模型的规模已突破千亿参数门槛,训练过程中所需的内存消耗呈指数级增长。以GPT-4为代表的多模态大模型,其训练内存需求甚至超过1000GB。然而,GPU显存容量受制于物理芯片规格,传统训练方法面临“内存...
导读 当Mamba遇上Transformer,计算效率与推理速度的革命性跃迁 3月21日,中国科技巨头腾讯与全球芯片霸主英伟达几乎同步发布基于Mamba-Transformer混合架构的新一代大模型,分别推出混元T1与Nemotron-H系...
近年来,AI Agent领域迎来了重大突破,Monica.im中国团队研发的通用型AI Agent产品“Manus”正式全球发布。这款产品在GAIA基准测试中表现卓越,性能超越OpenAI同层次大模型“Deep Research”。它不仅仅...
我是想都不敢想,英特尔前CEO,Pat Gelsinger,刚刚退休,就成为英伟达GTC 2025现场嘉宾,在Acquired 播客活动中发表演讲,美梦成真,英伟达梦里都会笑醒了吧! 英特尔前CEOPat Gelsinger(右一) 当然作...
当今世界环境越来越复杂,市场竞争也越来越激烈,想要成为领先的品牌越来越困难。对于企业家高管而言,他们不仅担心利润率、人才招募、相关培训技能的提高,还要担心供应链韧性、合规安全等大量潜在的风险。 对于大多数已经投入巨资建立了成熟数字化基础、具...