第二届中国国际进口博览会(以下:进博会)正在上海召开,对全球领先的一些人工智能(AI)的项目做了最为集中的一次展示。作为新一轮产业革命技术赋能的代表,AI在全球范围内蓬勃兴起,已经成为各个行业数字化转型阶段不容忽视的新趋势。AI技术已经广泛用于民生政务、社区生活、城市出行、城市管理、物流仓储、智能零售等等各个行业。
越来越多的企业管理者看到了AI在改善客户体验和提高企业运营能力的巨大潜力空间,但是对于引入AI赋能对企业现有IT基础设施能力的挑战上依旧认识不足。鹏云网络作为一直致力于为企业提供符合数字化时代发展需求的领先的存储解决方案服务商,不仅拥有自主可控、安全可靠的核心技术优势,更是拥有广泛的服务行业领先企业的资深经验,希望以此来回答广大企业管理者在布局AI能力时遇到的存储基础设施困惑。
AI平台在获取、处理和保留数据时都有别于传统数据存储架构,综合来看,鹏云网络认为企业需要注意好以下5点问题:
1、成本问题。成本是影响所有企业采购行为的关键因素,而AI技术将直接推动企业存储成本的高起。侧重于分析能力的AI,将加速企业的数据产生速度,推动企业数据量呈爆炸式增长。例如本次进博会上展示的智能出行项目,需要在车、人、场景等多处布控传感采集数据。为更好地控制IT系统的总体成本,会推动企业更加倾向采用标准化的商业硬件与IP网络。
2、弹性问题。受当下机器学习或人工智能模型训练对数据使用方式的限制,数据网络当中节点的资源与调用弹性是影响AI性能的关键因素,为此,具有横向扩展的分布式存储系统是解决AI数据负载灵活需求必不可少的基础设施。得益于分布式存储软件可将通用x86服务器上的存储设备抽象成为统一的存储资源池,企业会更加倾向这一同时具有高可扩展性和成本效益的AI存储基础架构。
3、性能问题。由于AI技术更加侧重数据分析阶段的数据处理,在读写模式、IO延迟、数据吞吐量上等诸多性能方面会对原有IT架构带来新挑战。例如,为了解决多阶段深度学习计算的效率问题,企业可通过分布式的灵活调度架构设计以及数据的并行处理,来解决AI计算时的遇到新IO瓶颈。
4、可靠性和稳定性问题。机器学习和人工智能学习模型可以长期连续运行,通过训练开发算法可能需要几天或几周的时间。在此期间,存储系统必须启动并持续可用。这意味着任何升级、技术更换或系统扩展都需要在不停机的情况下进行。为此,需要企业的存储系统不仅需要能够容忍节点的陆续故障,更加强调了零时间故障恢复的灾备保障能力。
5、智能管理问题。由于开发机器学习和人工智能算法既需要高性能的存储又需要高性能的计算,同时公共云服务提供商提供了可用于机器学习的私有云不易具备的GPU加速虚拟实例,这让企业的数据将会更多在本地云和公有云空间流动。为此,企业的存储基础设施需要具有按需调整的灵活资源配置能力,诸如快照、克隆、复制、在线迁移、分级存储的能力。
鹏云网络认为,企业选择正确的AI数据存储平台,是需要在可靠性、性能、弹性、成本和智能等指标之间取得新的平衡。这就要求供应商能够在将产品交付给客户之前测试和优化其产品的能力,从而可以企业降低采用AI存储的障碍。由鹏云网络独立自主研发的ZettaStor系统,采用了符合AI时代需求的领先的全对称分布式架构设计,可以有效解决企业存储在系统规模、IO性能、稳定性和可靠性等方面的新需求。同时,ZettaStor系统可部署在标准x86服务器上,利用软件定义存储技术,显著降低企业新技术采用成本。
自2012年成立以来,鹏云网络一直不断加强自主创新意识和提升核心技术力量,旨在促进以云计算、大数据、AI、物联网、5G为代表的先进计算的融合发展,建设智能存储应用和产业体系。拥有完全自主知识产权的ZettaStor系统,已广泛服务于运营商、金融、教育科研、互联网、广电、政府、司法、医疗、制造业等领域,成为包括中国移动、中国联通、神州数码、中原云、贵州广电传媒等50+行业头部企业的数字化新动能。