导读
12月25日,浪潮信息与智源研究院携手签订了战略合作协议,双方致力于构建大模型多元算力开源的创新生态系统,通过紧密合作,旨在提高大模型创新研发的算力利用效率,并降低大模型应用开发过程中的算力要求。
当前,智源研究院的Triton算子库FlagGems已成功融入浪潮信息的元脑企智EPAI平台,该平台专注于企业大模型的开发。这一整合将极大地促进企业在多元算力方面的适配与应用,实现更迅速、广泛且高效的算力利用。
文字编辑| 宋雨涵
1
元脑企智EPAI
技术特点
元脑企智EPAI的核心在于其深度学习算法和多模态AI技术。该平台通过深度学习算法,能够处理和分析海量数据,从中提取有价值的商业洞察和趋势。此外,EPAI结合了自然语言处理(NLP)和生成对抗网络(GAN)的优势,能够快速生成高质量的文本和图像内容,极大提升了企业的创作效率。
在数据处理方面,EPAI提供了高效的数据处理工具,能够帮助企业从复杂多样的数据中生成高质量的微调数据和行业/企业知识库。这些工具降低了数据筛选和处理的时间和成本,为企业大模型的落地提供了有力支持。
应用场景
元脑企智EPAI在多个应用场景中展现了其强大的功能。EPAI已成功应用于智能招投标助手场景,通过识别并抽取招标关键信息,构建企业知识库,实现了招标参数的自动识别,提高了招标参数分析的效率和准确性。
此外,EPAI还支持智能客服、智能编程等应用场景。在智能客服领域,EPAI能够为企业提供快速响应、高效解答的客服系统;在智能编程方面,EPAI能够自动化生成和优化代码,提高开发人员的编程效率和质量。
优势分析
元脑企智EPAI的优势主要体现在以下几个方面:
高效性:EPAI通过深度学习算法和多模态AI技术,实现了快速、准确的数据处理和内容生成,提高了企业的运营效率。
灵活性:EPAI提供了丰富的功能模块和灵活的交互方式,企业可以根据自身需求自由组合和定制功能模块,以适应不同的业务场景。
安全性:EPAI通过权限管理、数据加密、内容审查等工具,确保了数据的安全性和隐私保护,构建了一个安全可靠的数据处理环境。
易用性:EPAI的操作界面简洁易用,提供了丰富的开发文档和教程,降低了技术门槛,使得非专业研发人员也能轻松上手。
2
FlagGems基本介绍
技术背景与特点
开源与统一:FlagGems使用Triton语言开发,为多种AI芯片提供开源、统一、高效的算子层生态接入方案。旨在解决AI芯片生态割裂、算子库各自实现的问题,推动基于Triton的统一、开源的软硬件生态建设。
高性能与易用性:通过对PyTorch的后端aten算子进行覆盖重写,默认支持PyTorch的eager模式,实现算子库的无缝替换。Triton语言为算子库提供了更好的可读性和易用性,且针对多种算子可以带来良好的性能提升。
广泛的算子支持:提供大模型算子总数超过120个,是目前提供算子数量最多、覆盖广度最大的Triton算子库。支持多种类型的算子,包括基本数学运算、线性代数、科学计算、张量处理等。
应用场景与优势
加速模型推理与训练:FlagGems能够加速大模型的推理与训练过程,提高计算效率。在访存密集型算子上,有部分算子性能超越CUDA算子;在计算密集型算子上,基本追平CUDA算子;在融合算子上,全面优于CUDA算子。
支持多元化AI芯片:已有多家芯片企业适配FlagGems,为大模型提供更多算力选择。已在Nvidia GPU和其他非英伟达的全功能GPU上进行了训练和测试,证明了其支持多元化AI芯片的能力。
降低开发门槛:开发者只需付出较低的学习成本,即可参与FlagGems的算子开发与建设。提供了丰富的开发文档和教程,以及社区支持,帮助开发者快速上手。
深度融合 满足开发需求
此次,智源研究院携手浪潮信息,将FlagGems算子库与元脑企智EPAI内置的核心计算框架进行深度融合,旨在确保大模型应用开发能够使用高性能、跨硬件、多框架兼容的算子集合,顺利跨越各类硬件架构,满足多种开发框架的需求。现在,基于元脑企智EPAI大模型开发平台,企业可以利用针对大模型应用开发场景优化的先进算子集合,在多种算力平台上高效构建、优化和执行复杂的行业应用算法。在复杂的训练任务及实时性要求严苛的推理场景中,均能实现稳定且高效的运算性能。此外,企业也无需关心多元异构加速卡之间的软硬件差异,真正实现大模型应用在跨算力平台上的无缝开发与迁移。
3
开源开放
产业协作破解多元多模挑战
在大型模型技术浪潮的推动下,算力产业正经历着迅猛的发展。然而,硬件架构的多样性、指令集的不同以及算子库的独立构建,却为这一进程设置了重重障碍,显著提升了企业在应用大型模型时的算力要求。因此,构建一个开放源代码、统一标准且高效运作的多元算力系统生态,成为了当前亟需解决的问题。
“我们的元脑企智EPAI平台,能够为企业提供从底层算力到上层应用的全方位支持。同时,智源研发的FlagGems算子库,具备高性能、跨硬件平台以及多框架兼容的特性。这两者如同精密的机械部件,确保了大型模型能够在各种硬件架构上流畅运行,并满足多种开发框架的需求。无论是复杂的训练任务,还是需要高实时性的推理场景,主流大型模型都能通过我们的解决方案,跨越硬件壁垒,实现稳定且高效的运行,性能与原生模型相当。
——林咏华,智源研究院副院长兼总工程师
在多元化、多模态的产业背景下,AI的产业化关键在于推动其与各行各业的深度融合。浪潮信息的元脑企智EPAI企业大模型开发平台与智源通用算子库FlagGems的全面对接,正是我们双方为解决生态离散、降低大模型产业化过程中的算力转化和开发复杂度等挑战所采取的关键举措。这将为AI应用的创新提供更为强大且多元化的算力支持,推动构建一个协同、开放、共赢的多元算力系统生态,从而充分释放智能生产的潜力。”
——浪潮信息的高级副总裁刘军
结语
展望未来,浪潮信息与智源研究院将并肩前行,不断深化硬件的开放与软件的开源,通过开源开放和多元多模的策略激发创新活力,以多元算力系统生态加速创新的实践步伐,共同建设一个更加高效、灵活且开放的人工智能应用生态。