引言
2024年11月6日,PPIO派欧云联合创始人、董事长兼CEO姚欣做客算力豹视频号直播间,与大家一同分享PPIO派欧云的故事。
以下内容是此次直播内容的提炼:
关键词
姚欣 PPTV PPIO 分布式云 算力资源 AI算力 AI推理 互联网 智算云 数据中心 公有云 大模型 GPU 计算中心 算力调度 云计算 生命周期 技术壁垒
摘要
成立于2018年的PPIO派欧云,专注打造分布式云服务,旨在整合分散的算力资源,为人工智能、音视频、元宇宙等新一代场景,以更低成本提供更快速、更灵活的一站式算力、模型及边缘计算服务。
姚欣分享了从首次创业到二次创业的心路历程,强调算力产业的快速发展、面临的挑战及巨大机遇。
当前,云计算市场需求与供给的不匹配,以及AI大模型驱动下的算力需求快速增长,显示出算力行业正面临新的挑战与机遇。
姚欣指出,未来推理算力将超越训练算力成为重点。PPIO派欧云致力于通过持续的技术创新,提供高效经济的算力解决方案。
观点
PPTV网络电视依托P2P技术,曾是中国最大的视频网络之一。随后,姚欣在2018年创立PPIO,专注于分布式云服务,利用碎片化和闲置算力资源,构建了全国性的分布式云计算网络,目前已在中国建立3700个算力节点。随着AI技术发展,特别是大规模AI推理需求增加,PPIO进军AI算力行业,提供分布式的推理算力服务。
姚欣回顾了云计算和算力建设的发展,指出早期互联网企业倾向于自建数据中心,但随着技术进步,公有云成为更经济的解决方案。他强调,当前智算行业处于早期发展阶段,面临资源浪费、重复建设等挑战,需要优化算力使用效率,推动算力资源的整合和共享,特别是在AI推理领域。
姚欣指出,算力的快速发展得益于大模型和AI技术的推动,自己从使用者变为供给者,这使得他能更好地洞察云计算市场,尤其是算力供需匹配方面的挑战。PPIO作为分布式云的定位,旨在解决市场上的调度、资源利用率和成本问题,通过应用反哺供给侧的“飞轮效应”来推动市场发展。
问答回顾
主持人:您对于当前算力市场的发展观察是什么?
姚欣:算力话题并非新事物,其发展与云计算紧密相连。过去十年间,从大家开始接触、接受并上云,到最近三年GPU为主的智算云发展,这两大发展过程有相似之处。早期企业倾向于自建数据中心,但随着技术和市场的发展,大家逐渐认识到使用公有云服务的优势。如今,智算业务正处在早期数据中心建设阶段,预计未来会面临资源浪费问题,需要整合碎片化算力资源以提高效率。
主持人:您如何看待目前算力行业供需匹配的问题?
姚欣:当前算力行业供需失衡的现象明显,部分小型数据中心因缺乏规模化效应而利用率不高,出现闲置和供大于求的情况。从长期看,无论是互联网、移动互联网、云计算还是AI应用及其基础设施,都经历过周期性的供需不匹配阶段,半导体元器件如服务器、GPU等底层硬件也会经历供大于求和供小于求的周期性波动。因此,作为算力行业,在面对短期市场波动时要有清醒的认识,同时也要看到长期来看,随着最终需求的持续增长,算力行业仍有很大价值和发展空间。
主持人:与云计算相比,智算有哪些相同和不同的地方?
姚欣:相同之处在于两者都对电力的需求较高,不同之处在于智算对电力的单位密度需求更高。在当前智算中心中,电费成本可能占到运营总成本的一半左右,而在云计算时代,电费仅占20%左右。此外,电力的价格在中国不同城市和地区间存在巨大差异,这种价差在智算时代对GPU算力价格的影响变得非常显著。
主持人:智算时代数据中心面临的挑战有哪些?
姚欣:智算时代数据中心面临的挑战主要有三个:一是面临重复建设的问题,各个企业都在建立数据中心,未来需要整合利用;二是能源价格的波动,需要进行算力调度以降低成本;三是如何延长GPU等计算设备的生命周期,实现其在不同任务如训练、推理等方面的高效利用,类似动力电池的梯次利用。
主持人:您为什么选择分布式云这个赛道,并如何打造差异化竞争力?
姚欣:选择分布式云赛道的原因是看中云计算作为天花板足够高的万亿级大行业,且增长持续。同时,在市场格局已经形成的背景下,寻找一条与众不同的独特路径,借鉴共享经济(如airbnb)的模式创新,整合闲置的算力和IDC资源,为客户提供新颖的服务模式,从而实现差异化竞争。
主持人:在2018年,中国建设了大量机房和机柜,但平均使用率却只有40%,存在大量闲置资源,能否详细说明一下这个问题以及背后的多种原因?
姚欣:当时全中国在一年内建设了300万个机柜,但第二年的平均使用率仅为40%,这意味着超过一半的机柜空间被浪费了。造成这一现象的原因有多方面:一是部分机房建在偏远地区,无法有效利用;二是有些机房建得较小,只能容纳较少的服务器设备;三是由于销售策略的问题,一些供应商在面对最小采购单位要求十个机柜起购时,导致剩余的少量机柜难以出售,造成资源碎片化和闲置。
主持人:PPIO采取了什么创新方式来应对云计算资源利用率问题?
姚欣:PPIO通过整合现有闲置资源,采用类似airbnb的整合模式来进行云计算创新的机会,无需额外投资建设新资产。我们致力于解决找到闲置机房资源和调度使用这些碎片化资源的技术挑战,以提高整体资源利用率。
主持人:PPIO是如何从早期集中式小集群向分布式的节点资源能力转变的?
姚欣:PPIO通过一系列推演发现,随着用户规模的增长,集中式小集群无法满足大规模分布式计算的需求。因此,逐步将产品演变为支持百万和千万级别用户访问的分布式节点资源架构,最终推出派欧算力云产品,集成大模型API、serverless和推理加速引擎等技术,以更高的性价比降低AI应用成本,简化搭建过程。
主持人:PPIO为何会选择进入这个领域,以及在这一领域的竞争优势是什么?
姚欣:PPIO凭借其在管理用户侧千家万户电脑应用服务的经验,能够有效管理机房和机柜资源。尽管2018年我们才开始创业并逐步发展商业化,但是利用已有的技术能力和团队,整合碎片化机房资源相对容易。特别是在疫情期间音视频需求激增的背景下,团队整合资源的能力得到了验证。
主持人:PPIO如何定位自己在云计算中的角色,并针对资源调度、利用率提升和成本问题推出的产品或服务有哪些?
姚欣:PPIO扮演着承上启下的角色,致力于提升算力资源的调度效率和利用率,降低使用成本。我们推出的PPIO产品和服务就是针对解决当前云计算中的调度问题、资源利用率问题以及成本问题,通过提供高弹性、低成本且方便使用的大型推理服务,以应对未来AI应用普及带来的挑战。
主持人:PPIO是否考虑了从需求侧出发,预测未来市场发展需求来构建基础设施?
姚欣:PPIO从需求侧出发,预判未来几年市场对计算需求的增长趋势,比如人工智能、5G、数字人、云游戏等领域的兴起。算力供给问题与应用场景落地问题应结合考虑,从而提供相应的基础设施,如分布式节点资源能力,以满足大规模分布式计算的需求,并确保服务的安全稳定性。
主持人:对于模型的应用厂商和使用者,如何通过一个平台实现GPU资源的弹性使用?
姚欣:我们拥有一个统一的算力平台,用户可以将模型加载上去,根据需求在全国各地弹性和按需使用GPU资源。这种模式下,用户只需为实际使用的资源付费,不再需要预先占用资源,相比目前的AI计算裸金属时代按月或按小时租用的方式更为灵活经济。
主持人:PPIO如何解决大规模应用推理的问题,并推出了哪些方案?
姚欣:我们推出了一种基于服务的分布式GPU网络,当大规模应用需要更多资源时,系统会自动调配更多GPU和服务器以满足十万、百万甚至上亿级用户的访问需求。这一方案帮助大规模应用推理更方便落地。
主持人:大模型技术对云市场和算力市场产生怎样的影响?
姚欣:我认为在未来两年内,AI应用将迎来爆发期,类似于2012年移动互联网出现拐点的情况。目前大模型推理成本已下降超过十倍,预计在未来两年内仍将持续下降。当推理成本降低到一定阈值时,将带来从量变到质变的重大机会,就像当年PPTV通过降低成本推动视频行业剧增一样,AI推理应用也将在免费时代经历用户量级的剧增,从而显著扩大整个算力市场的规模。
主持人:成本下降对于当前算力行业意味着什么?
姚欣:随着AI应用成本的大幅下降,行业从业者的盘子将会扩大上千倍甚至上万倍,这是值得大家高兴的。在规划架构和提供服务时,应重视从训练需求转向推理需求的变化,因为推理需求的增长将远大于训练需求。
主持人:您为何出售PPTV?
姚欣:出售PPTV是出于追寻内心的声音,尽管PPTV取得了成功并改变了人们的生活,但我始终怀揣着用技术改变生活的梦想,希望能够开创出具有时代意义、能够被写进计算机教科书的技术。最终我选择卖掉并创建了PPIO,成立一家具有底层技术创新并走向全球的科技公司。
主持人:AI行业是否存在泡沫?
姚欣:AI行业确实存在泡沫现象,每个行业在高速发展初期都会有早期泡沫阶段。目前的AI行业正处在泡沫破灭的过程中,例如大模型领域的泡沫正在逐渐破裂,这反而意味着模型之上应用生态开始起步。随着模型发布速度放缓,开发成本降低,模型的稳定性和迭代速度的变化有利于应用开发,所以大模型领域的泡沫正在破灭,但模型应用层面可能正形成新的泡沫。
主持人:算力共享经济模式是否可行?
姚欣:算力共享经济模式已经存在且是必然趋势。如同airbnb等共享经济模式整合利用闲置资源,PPIO也在运营模式中整合汇聚各类算力资源,实现算力的共享经济。
主持人:PPIO有哪些合作伙伴?
姚欣:PPIO拥有众多合作伙伴,包括上游的算力合作伙伴,他们帮助整合和寻找闲置算力资源;以及与拥抱开源的大模型企业紧密合作,通过开源模型进行针对性优化,以适应不同类型的异构算力资源,共同推动整个行业资源利用率的提升。
主持人:对于未来市场发展有何展望?
姚欣:预计2025年将是一个转折点,推理算力将超越训练算力,推动这一变化的动力来自多模态应用需求的增长,尤其是音频和视频化趋势的推进。同时,从2023年开始,信息相关行业将经历十倍降本的连续过程,预计到2025年,市场将看到日活跃用户过千万甚至月活跃用户达到亿级别的应用诞生和发展。对于算力建设方来说,需要及时调整建设策略以应对可能出现的资源闲置问题,抓住机遇迎接行业变化。