【行业观察】智算中心的冷热思考:建设热潮背后的挑战与应对

引言

人工智能浪潮方兴未艾,作为AI基础设施,智算中心被视为人工智能时代如同水和电一般的“新基建”,在全国各地落地开花。尤其自2022年底ChatGPT横空出世以来,各地智算中心建设纷纷提速,一大批智算中心规划密集出台,不少地区的智算中心已建成并进入投运阶段。

根据公开资料梳理,目前已有超20个城市建设了智算中心,其中既有北京、上海、深圳等一线城市,也包括郑州、武汉、长沙、南京、西安、成都、哈尔滨等地区中心城市,还不乏内蒙古呼和浩特、宁夏中卫、新疆克拉玛依等西部地区城市。不仅如此,智算中心还加速下沉至县城,湖北利川智算中心、涞源河北智算中心、重庆移动忠县大数据智算中心……近两年,一批县域级智算中心也如雨后春笋般涌现。

值得注意的是,按时间看,2024年上半年智算中心招投标相关事件791起,同比增长高达407.1%。这表明智算中心的建设在全国范围内得到了广泛的关注和支持。从2023年开始,各地政府加大了对智算中心的投资力度,推动了基础设施的发展,为人工智能产业提供了坚实的技术基础。

智算中心的建设热潮

当前,算力正在加速成为驱动生产力变革的关键力量,智算中心建设在全球呈现竞速状态。在此方面,国内建设热潮涌动,推进速度不断加快。据不完全统计,2023年全国新建智算中心项目超100个。

为了促进算力基础设施建设,我国于2023年一年中先后出台了《生成式人工智能服务管理暂行办法》和《算力基础设施高质量发展行动计划》。预计到2025年,我国算力规模将超过300EFLOPS,智能算力占比达到35%。

地方政府则通过制定相关政策、提供资金支持、规划区域布局,为智算中心建设提供基础保障。

奥飞数据、拓维信息等多家A股上市公司均披露了斩获算力基础设施建设服务相关订单,金额均在10亿元以上。

智算中心建设覆盖的城市十分广泛,据不完全统计的140多个项目所分布的省区市至少23个,其中以安徽、江苏、北京、山东、浙江等省市最多。

随着智算中心建设的大规模展开,算力市场规模也快速增长,IDC数据显示,2023年下半年,中国智算服务市场整体规模达114.1亿元,同比增长85.8%。

智算中心的挑战

建设智算中心并非“一锤子买卖”。相反,建成投运之后,真正的挑战才刚刚开始。从建起来到用起来,如何让智算中心真正服务当地产业发展、成为一笔有效的投资,这是每一座智算中心都要面对的问题。

目前智算中心的主要盈利模式主要包括算力租赁、技术服务、数据运营等。许多智算中心盈利模式单一,主要依赖算力租赁,不利于长期可持续发展。

实现可持续性的投资回报,主要取决于以下因素:

一是市场需求,即智算中心所提供的算力和服务是否能够满足客户的需求;

二是成本控制,包括建设成本、运营成本等;

三是技术创新,能否在硬件设备、软件平台等方面保持领先地位;

四是政策支持,政府是否有相关政策扶持智算中心的发展。

今年4月份,北京市发布《北京市算力基础设施建设实施方案(2024-2027年)》提出,改变智算建设“小、散”局面,集中建设一批智算单一大集群,到2025年,北京市智算供给规模达到45EFLOPS,2025-2027年根据人工智能大模型发展需要和国家相关部署进一步优化算力布局。

万联证券投资顾问屈放表示,目前算力闲置率较高,国内的算力中心整体利用率仅有50%,这种资源浪费问题需要得到重视。此外,当前算力中心比较分散,虽然各地都有各自的算力中心建设计划,但较难形成协同运转。

智算中心运行过程中出现的问题需得到重视。联想中国基础设施业务群战略总监黄山表示,算力基础设施建设目标,是高效可靠的承载计算工作负载包括通用、科学、AI计算。不同计算类型需要不同的算力基础设施软硬件架构来支持。尤其是日新月异的AI计算,对异构算力协同、大规模集群计算稳定性及集群计算效率、能效、算法与算力的匹配等各方面算力基础设施都提出新的要求。

值得关注的是,智算训练集群规模不断扩大的过程中故障率呈现指数级增长,故障难监控、难诊断、更难恢复;AI算力按需分配这一需求背后所需要的任务编排、监控和优先级管理、弹性扩缩容技术在业界还没完全成熟,需要大量的现场实践调优。

此外,智算中心作为大数据处理的核心设施,对能源需求较高。据统计,我国数据中心能耗已占全社会用电量的1.5%左右,且呈上升趋势。在高能耗背景下,智算中心如何实现绿色低碳发展,成为一大挑战。

智算中心的应对举措

针对当前我国智算中心能源消耗问题,我们应采取以下措施:

一、加大绿色能源使用比例

智算中心应积极响应国家节能减排政策,优先使用风能、太阳能等绿色能源。通过增加绿色能源在能源消耗中的比重,降低对传统化石能源的依赖,实现能源结构的优化。这不仅有助于减少环境污染,还能推动我国绿色能源产业的发展。

二、优化数据中心设计,提高能源利用效率

智算中心应从源头抓起,优化数据中心的设计布局,采用节能设备和技术,提高能源利用效率。通过智能化管理,实现能耗的实时监测和优化调控,降低整体能耗。

三、政府和企业共同发力,加大核心技术研发投入

针对智算中心的关键技术瓶颈,政府和企业应加大研发投入,集中力量进行技术攻关,实现核心技术的自主可控。这将有助于提升我国智算中心的竞争力,为我国信息技术产业的发展奠定坚实基础。

四、加强国际交流合作,提升技术水平

智算中心应积极与国际先进技术接轨,加强与国际同行的交流合作,引进国外先进技术和管理经验,不断提升我国智算中心的整体技术水平。

五、建立健全数据安全管理制度

智算中心应高度重视数据安全问题,建立健全数据安全管理制度,加强对数据安全的监管。确保数据在收集、存储、传输、处理等各个环节的安全可控。

六、采用技术手段,确保数据安全

智算中心应采用加密、备份等技术手段,对数据进行全方位保护。同时,加强对数据安全风险的监测和预警,及时发现并处理安全隐患,确保数据安全无虞。

通过以上措施,我们有望实现智算中心绿色、高效、安全的发展,为我国经济社会发展和科技创新提供有力支撑。

智算中心的未来发展趋势

一、技术融合与创新

随着人工智能、5G、物联网、边缘计算等技术的不断融合,智算中心将迎来技术创新的新高潮。未来的智算中心将不仅仅是数据存储和计算的中心,而是成为支撑多技术融合创新的重要基础设施。例如,智算中心可能会集成更多的人工智能处理能力,实现数据的即时分析和决策。

二、绿色低碳发展

面对全球气候变化和节能减排的压力,智算中心将更加注重绿色低碳发展。未来的智算中心将大量采用可再生能源,如风能、太阳能,以及先进的节能技术,如液冷、余热回收等,以降低能耗和碳排放。同时,智能化能源管理系统的应用将进一步提高能源利用效率。

三、智能化和自动化

智算中心将朝着更加智能化和自动化的方向发展。通过采用人工智能技术,智算中心可以实现自动化的资源调度、故障预测和维护、安全监控等功能,大大提高运营效率和服务水平。

四、安全性和隐私保护

随着数据安全和隐私保护法规的不断完善,智算中心将加强数据安全防护措施,包括采用更先进的数据加密技术、访问控制机制、隐私保护算法等,以确保数据的安全性和用户隐私。

五、边缘计算与分布式架构

为了满足实时性和低延迟的需求,智算中心将越来越多地采用边缘计算技术,将数据处理和分析的能力推向网络边缘。同时,分布式架构将成为智算中心的重要发展趋势,通过将计算和存储资源分散部署,提高系统的灵活性和可靠性。

六、行业定制化服务

智算中心将更加注重为特定行业提供定制化服务。例如,针对金融、医疗、制造等行业的数据处理需求,智算中心将开发专门的解决方案,以更好地支持行业数字化转型。

七、国际合作与竞争

在全球化的背景下,智算中心的建设和发展将加强国际合作,同时也会面临更加激烈的竞争。中国智算中心的建设和发展将积极参与国际标准制定,推动技术交流和合作,提升国际竞争力。总之,智算中心的未来发展趋势将是在技术创新、绿色低碳、智能化、安全性、分布式架构和行业定制化服务等多个方面的综合提升。这些趋势将共同推动智算中心成为未来数字经济的重要基石。

结语

总之,在智算中心建设热潮中,我们既要看到其带来的发展机遇,也要正视挑战,采取有效措施予以应对。只有这样,我国智算中心才能实现可持续发展,为我国数字经济注入强大动力。

今年的政府工作报告提出“适度超前建设数字基础设施,加快形成全国一体化算力体系”。受访者普遍认为,适度超前建设绝非盲目建设、重复投资,而是在做好规划的前提下,形成投、建、运、管、用协同发展的产业生态,持续提高智算资源的利用率。地方在规划智算中心时应充分考虑当地的产业发展需求和技术发展趋势,避免盲目跟风。同时,应加强与其他地区的沟通协作,避免重复建设。