
DeepSeek-R1 :纯RL打造推理王者,AI 自主学习里程碑(技术报告解读)
来源:AI寒武纪 刚看完DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,这篇论文最令人震惊的点在于: DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通...
来源:AI寒武纪 刚看完DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》,这篇论文最令人震惊的点在于: DeepSeek-R1-Zero 作为一个完全没有使用任何监督微调(SFT)数据,仅通...
7月30日,DOIT将对话甲骨文公司中国区技术咨询部高级总监李珈,深入探讨大模型与数据库技术的融合及未来发展。
智源推出的第一个全流程开源持续预训练、监督微调(SFT)以及强化学习(RLHF)技术的医疗语言模型Aquila-Med LLM:开创性的全流程开源医疗语言模型
Dropbox 计划使用 NVIDIA 的 AI Foundry 构建自定义模型,并通过 Dropbox Dash 通用搜索工具和 Dropbox AI 改进 AI 驱动的知识工作
NVIDIA GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试,其运行了所有数据中心推理测试,进一步扩大了NVIDIA H100 Tensor Core GPU的领先优势。 总体测试结果表明,NVIDIA AI平...
NVIDIA DGX Cloud 集成到 Hugging Face 平台将加速大语言模型(LLM)的训练和调优,简化了几乎每个行业的模型定制 NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为...