DeepSeek AI最新发布的多模态大模型Janus-Pro,以及之前发布的大型语言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一经发布,就在AI领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。
2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验,欢迎广大开发者体验使用。
![1738745217662646.png 图片1.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051646571974375994.png)
下面以Deepseek-V3为例,演示在昇腾社区如何高效获取模型及使用
硬件要求:
部署DeepSeek-V3模型需配置4台Atlas 800I A2(8*64G)服务器资源
模型调用实践:
一、权重转换
GPU:
![1738745224698830.png 图片2.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647041582754258.png)
NPU:
![1738745230725649.png 图片3.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647101611968892.png)
二、加载镜像
在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,请使用docker images命令确认查找具体镜像名称与标签。
![1738745238346858.png 图片4.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647182115338091.png)
三、容器启动
提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。
![1738745244534382.png 图片5.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/20250205164724634212131.png)
![1738745252573408.png 图片6.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647321545538455.png)
四、服务化测试
配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性
![1738745261109849.png 图片7.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/2025020516474132140868.png)
修改服务化参数
![1738745267627829.png 图片8.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647471241521443.png)
拉起服务化
![1738745273405168.png 图片9.png](http://objectnsg.oss-cn-beijing.aliyuncs.com/default/202502/05/202502051647531070341215.png)
出现“Daemon start success!”,则认为服务成功启动。