易播报第14期关键词:华为AI存储上新、英特尔Gaudi2、京东“言犀”、AIGC监管、3D DRAM

1.  华为面向AIGC发布存储新品

7月14日,华为发布两款面向AIGC的存储新品OceanStor A310和FusionCube A3000。

其中,OceanStor A310是面向基础和行业大模型的深度学习数据湖存储,支持从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理,提供5U 96盘位,带宽可达400GB/s和1200万IOPS,最大支持4096节点扩展。利用全局文件系统GFS构建智能的数据编织能力(把不同数据连接在一起让我们看到更全面的信息),接入各地域的原始数据实现统一视图和调度;还有存储内嵌算力,这样就能降低预处理服务器等待时间,预处理效率提升30%。

FusionCube A3000为面向行业大模型训练和推理的训/推超融合一体机,面向十亿级模型应用,通过预置AI大模型,2小时即可完成开局,真正做到开箱即用。整柜采用存算分离架构设计,存算完全可以灵活独立扩展。

2、  京东发布千亿级大模型“言犀”

7月13日,京东发布千亿级大模型“言犀”,支持语言、语音、视觉、多模态等,融合70%通用数据与30%数智供应链原生数据。用京东原生数据集训练大模型,带来了商品推荐、金融政策、理财规则、物流体验等领域的能力。基于大模型,京东物流发布了“京东物流超脑”,针对供应链全链路提供辅助决策、运营优化以及一线作业智能助手等能力,实现降本增效。

3、  英特尔面向中国市场发布Gaudi2加速器

本周英特尔正式面向中国市场发布AI加速器Gaudi2,可作为英伟达H100加速器的替代品, Gaudi2可用于AI训练及推理。Gaudi2有24个可编程Tensor处理器核心(TPCs)、 21个100Gbps(RoCEv2)以太网接口、96GB HBM2E内存容量、2.4TB/秒的总内存带宽、48MB片上SRAM和集成多媒体处理引擎。在Stable Diffusion训练上,Gaudi2展示了从1张卡至64张卡近线性99%的扩展性。

4、七部门联合公布《生成式人工智能服务管理暂行办法》

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》,将于2023年8月15日起施行。最新出台的《办法》共24条,针对传播虚假信息、侵害个人信息权益、数据安全和偏见歧视等问题,办法规定了包括使用AI生成内容不得侵害他人肖像权、应对AI生成的图片视频进行标识等具体细则。同时《办法》中也明确了对生成式AI产业的支持和鼓励态度。值得关注的是,第七条中明确了对个人信息安全与知识产权保护要求。表明生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:

(一)使用具有合法来源的数据和基础模型;

(二)涉及知识产权的,不得侵害他人依法享有的知识产权;

(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;

(四)采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性;

(五)《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律、行政法规的其他有关规定和有关主管部门的相关监管要求。

5、  马斯克官宣自己的AI公司——xAI

本周,特斯拉、推特及SpaceX等公司CEO马斯克正式官宣了自己的AI公司——xAI,成立目的是“了解宇宙真相”。马斯克今年稍早在媒体访谈中提到,开发、训练的聊天机器人会说谎,因此他准备发展极力追求真相,名为TruthAI的AI聊天机器人。

根据xAI官网描述,xAI的团队由马斯克主导。团队成员之前曾在DeepMind、OpenAI、Google研究院及微软研究院、特斯拉及多伦多大学任职,参与过许多AI业界广为使用的技术方法,包括调整神经网路参数的Adam optimizer或资料正规化用的Batch Normalization及Layer Normalization,也有人发现AI模型的攻击方法。一些成员推出过创新AI技术如Transformer-XL,还有成员参与或主导过业界极具代表性的项目比如AlphaStar、Minerva、GPT-3.5和GPT-4等。

6、  比HBM带宽更高的3D DRAM出现了

近期东京工业大学的Takayuki Ohba 教授及其同事设计了一种3D DRAM堆栈用于处理单元和内存,命名为BBCube 3D,Ohba教授称已将其与两种当前最先进的内存技术——DDR5和HBM2E进行比较。其实验结果为BBCube 3D能够实现带宽为1.6 TB/s,比 DDR5高30 倍,比HBM2E高四倍,比特位访问能耗方面,BBCube则分别是HBM2E的1/20,DDR5的1/5。

BBCube3D削薄了每个 DRAM 芯片,去掉了晶圆叠层 (WOW) 设计中的微凸块。与DDR5 或 HBM2E(第二代高带宽内存)设计相比能让内存块以更高的速度和更低的能耗运行,因为前者运行温度更高,并且凸块会增加电阻/电容和延迟。