共 7 篇文章

标签：LLM

DeepSeek带来的机会，更多属于亚马逊云科技这种大型云厂商

虽然DeepSeek以较低的算力门槛，吸引更多小规模的云厂商和更多硬件厂商加入了AI算力建设浪潮。但长远来看，以亚马逊云科技为代表的大型云服务商将成为AI技术发展机遇中的更大受益者。 2025年1月20日开源的DeepSeek-R1模型不仅...

朱朋博2025-03-24业界动态

来源：AI寒武纪刚看完DeepSeek R1技术报告论文《DeepSeek-R1：强化学习驱动的大语言模型推理能力提升》，这篇论文最令人震惊的点在于： DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调（SFT）数据，仅通...

张妮娜2025-01-23业界动态

7月30日，DOIT将对话甲骨文公司中国区技术咨询部高级总监李珈，深入探讨大模型与数据库技术的融合及未来发展。

张妮娜2024-07-24AI与大模型

智源推出的第一个全流程开源持续预训练、监督微调（SFT）以及强化学习（RLHF）技术的医疗语言模型Aquila-Med LLM：开创性的全流程开源医疗语言模型

张妮娜2024-06-21业界动态

Dropbox 计划使用 NVIDIA 的 AI Foundry 构建自定义模型，并通过 Dropbox Dash 通用搜索工具和 Dropbox AI 改进 AI 驱动的知识工作

朱朋博2023-11-20AI与大模型

NVIDIA GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试，其运行了所有数据中心推理测试，进一步扩大了NVIDIA H100 Tensor Core GPU的领先优势。总体测试结果表明，NVIDIA AI平...

张妮娜2023-09-14业界动态

NVIDIA DGX Cloud 集成到 Hugging Face 平台将加速大语言模型（LLM）的训练和调优，简化了几乎每个行业的模型定制 NVIDIA 与 Hugging Face 宣布建立合作伙伴关系，为...

张妮娜2023-08-09业界动态