华存智谷成立时间并不长,从2022年1月18日开始,迄今也仅有两年多一点的时间,华存智谷立足全国最大的专业化存储研发机构(华为成都研究所)的技术积累,由高新电子、智慧交通集团、华鲲振宇、恒信华业等共同出资。
华存智谷诞生源于2021年出台的《四川省“十四五”存储产业发展规划》和中国存储产业生态合作发展要求,通过发挥股东在市场、政策和技术等方面的优势,华存智谷聚焦自主可控的绿色存储解决方案,成功走出了一条快速崛起的发展之路。
今年4月24日,2024数据基础设施技术峰会期间,DOIT总编宋家雨特邀华存智谷首席技术官杜小华进行了专访。
宋家雨:随着大数据、AI、云计算等数据采集、处理与分析技术的发展,数据已经成为新的生产资料,是数字经济和科技创新的关键要素。华存智谷成立的背景和意义是什么,发展现况如何?
杜小华:四川省于2021年出台《四川省 “十四五”存储产业发展规划》,以下简称规划,将存储作为全省下一个五年重点发展方向,打造立足四川、服务全球的中国“存储谷”,推动四川数字经济的新发展,致力于全面发展存储产业链上游、中游和下游,打造存储四川本地造品牌。
成都拥有得天独厚的存储产业资源和人才储备,华为的存储产品研发中心设立在成都,全国50%以上的存储专家在四川成都,为了积极响应四川省的存储产业发展政策,抓住这次产业大发展的机会,在省市领导的高度关注下,华存智谷应势而生,填补了四川省算存一体化产品空白。
通过与华为、华鲲振宇等公司紧密合作,搭载“鲲鹏”处理器,快速形成了存储产品布局,推出了计算型存储、全闪存存储、融合存储、海量分布式存储、超融合、备份一体机六大系列,共30余款产品,助力政府、安平、金融、教育等行业数字化转型。2023年,华存智谷联合华为发布了TGStor Cube 3900计算型存储,同时发布自研海量分布式存储产品TGStor 9600以及数据中心网络产品。华存智谷成立首年完成1个亿的销售目标,2023年签单金额高达5亿元。2024年4月份联合华为,发布AI高性能存储解决方案。
宋家雨:目前华存智谷在存储、服务器和网络方面发力,其中,存储在未来框架中的占比?
杜小华:首先明确一下,华存智谷的战略重心在自主可控的绿色存储产品研发制造和销售,在这个过程之中,客户在采购存储产品方案的同时,同样需要服务器、网络等产品。为了能够给客户提供一个完整的、全面的解决方案,华存智谷同步提供了服务器和网络产品,这些不是华存智谷研发,而是联合合作伙伴,一起提供完整解决方案。
华存智谷主要产品定位还是自主可控的绿色存储,存储的销售额将占绝大部分的比例。
宋家雨:华存智谷坚持自主可控,一路走来的主要心得?自主可控的产品未来是否会走向全球?
杜小华:在当前全球技术竞争日益激烈的背景下,只有掌握了核心技术,才能确保企业的长远发展。因此,我们始终坚持自主研发,不断提升技术创新能力,确保产品的核心技术掌握在自己手中。
其次,华存智谷注重与产业链上下游的紧密合作。自主可控并非闭门造车,而是需要与产业链上下游企业共同合作,形成合力。通过与供应商、合作伙伴等的紧密合作,我们能够及时了解市场需求和技术动态,不断优化产品设计和生产流程,提高产品质量和性能。
此外,自主可控需要一支高素质的技术团队来支撑,我们积极引进和培养人才,打造了一支技术实力雄厚的团队。这支团队不仅具备深厚的技术功底,还具备敏锐的市场洞察力和创新能力,这是我们坚持自主可控和自主研发的核心支柱。
关于自主可控的产品是否会走向全球,这取决于多个因素的综合作用。2023年,华存智谷就已布局扩展海外市场,其计算型存储产品远销意大利,经销范围覆盖欧盟国家。至于以后的全球市场战略,华存智谷需要积极参与国际竞争,加强与国外企业的合作与交流,提升品牌知名度和影响力,还需要关注国际贸易政策、知识产权保护等方面的变化,为产品的全球化布局提供有力支持。
宋家雨:华存智谷在金融、交通、能源等行业屡有斩获,其中的主要原因是什么?
杜小华:主要有两方面的原因,首先,华存智谷目前是80%国资控股,背靠强大的市场资源,对于华存的成长有很大的帮助,比如华存在交通行业,与成都交投信息科技有限公司达成战略合作,推进交通行业信创替代,联合开展科研攻关。
其次,华存智谷还积极响应国家政策和市场需求,不断推动数字化转型和创新发展,剑指存储5000亿市场,坚持自主研发,不断推出创新性的产品和服务,满足市场的快速变化需求,并且深入了解各行业业务需求和痛点,从而提供更加贴合实际需求的解决方案。综上,华存智谷凭借强大的技术研发能力、丰富的产品线、与用户的深度合作以及敏锐的市场洞察力,能够在金融、交通、能源等行业屡有斩获,后发先至。
宋家雨:在当前数字化、智能化的发展趋势下,特别是人工智能领域,华存智谷如何看待行业的未来走向?将如何应对?
杜小华:随着OpenAI的ChatGPT,以及国内一些大模型的成熟,人工智能未来在经济发展以及生活中,会有越来越多的应用。随着算法以及算力的成熟,人工智能未来的关键在于数据。
对于数据来说,人工智能大模型数据量越来越大,从TB级、PB级到EB级,与此同时,大模型参数规模也在扩大,参数规模现在基本上国际上达到万亿级别的参数规模。随之带来的是对数据访问性能或者是存储扩展性需求,这会成为人工智能的一个瓶颈。只有做到算力、存力以及模型协同发展,才能更大的发挥人工智能的效率和作用。
数据肯定是人工智能的载体,数据存储目前需要关注几个大的问题:
第一,存储系统的重要性。在没有人工智能的时候,数据存储是成本中心,现在有了大模型,有人工智能后,数据就变成了创新的动力中心,数据就像石油一样成为经济发展的重要资源。随着数据重要性提高,存储系统的读写压力也随之增加,存储的可靠性变得更加重要。
第二,存储系统的性能。随着AI大模型参数来到万亿级别,出现了超万张GPU卡的算力规模,从而也对存储访问性能提出更高需求,因为在这个过程中,大模型可能会经常发生故障,会涉及频繁保存中间状态的数据,产生大量存储读写的请求。如果存储性能跟不上,就会导致训练时间变长,其成本代价是非常高的,为此,必须满足对存储性能的需求。
第三,数据的安全性以及数据治理。数据作为关键生产要素,随着国家数据资产入表相关政策的发布,数据成为了企业重要资产,数据安全性以及数据治理的要求会更高,安全性涉及到数据安全可靠存储、数据安全访问,对数据加密、鉴权等更高层次的要求。
为了应对这些问题,我们今年也在跟华为做深度的合作,基于华存自研的高性能并行文件系统,以及高性能智能盘框,我们联合发布了AI高性能存储解决方案,这个方案的核心是TGStor 9800高性能并行文件存储。
这款产品基于全国产信创硬件平台,采用存算分离可组合式系统架构,可横向扩展的并行文件服务引擎和智能盘框各自独立扩展,可根据性能、容量需求配比组合。高性能客户端直连各文件引擎节点实现带宽聚合,完全消除了跨节点东西向流量,性能可以做到真正的线性扩展。TGStor 9800能够做到单文件服务引擎80GB/s带宽,300万IOPS的吞吐能力,达成全国产信创平台的最高吞吐性能,媲美DDN这类非信创软件,实现Checkpoint秒级吞吐,能够满足算力全速运作所需。
我们采用的智能盘框是新型架构的重要组件,是数据持久保存底座,是系统可靠性的重要支柱。它采用双控双活架构,双端口盘,硬件模块全冗余,链路秒级切换,保证业务持续在线。它采用23+2大比例EC,在保证数据冗余保护的前提下存储利用率达到91.6%。该款智能盘框还支持硬件亚健康监测和修复,慢盘隔离和慢IO快速返回,盘级故障防扩散和数据快速重构等系统修复能力,大幅缓减硬盘故障对业务影响。
我们希望跟合作伙伴,或者是行业客户合作,首先在某些行业取得领先优势,我们有大量基于行业的解决方案,去带动整个产品技术发展。未来我们的研发思路,比如说在人工智能领域,我们会跟行业上下游的合作伙伴一起,去对行业进行深度的研发,未来我们会跟成都智算中心合作,在智慧交通、大模型等领域,去解决客户痛点和问题,为客户提供我们特有的优势产品解决方案,满足客户的需求。
专访视频: