如今,芯片已是无处不在,在日常工作生活常见的各种物品中,除了普通手电筒以外,应该再找到不含有任何芯片的设备。
在个人电脑、智能手机、平板电脑以及服务器等电子设备上,芯片配置都备受关注的,新兴的智能汽车上,芯片也越发关键,芯片的供应状态会直接影响汽车厂的生产和制造。
其实,绝大部分人是不了解芯片设计的,普通人关心芯片纳米工艺制程和架构设计所带来的性能和功耗上的改进,因为这关系到设备的使用体验和使用年限。
芯片行业更新迭代非常迅速,可以说是“内卷”最严重的行业之一,今天我们,简单了解一下芯片设计行业正在面临的越发严重的数据挑战,看看EDA行业需要什么样的存储?
芯片设计行业面临的数据挑战
首先,作为高精尖产业,芯片从设计到产生再到交付的每一个阶段都非常复杂!芯片的开始始于设计,然后,用晶元将设计的电路呈现出来,经过制造,封装,测试的数千道工艺,持续数周时间,才会有成品芯片。
芯片行业“内卷”的标志就是摩尔定律,在摩尔定律的作用下,大概每两年时间,芯片晶体管的数量就会翻倍,过程需要芯片的设计者付出巨大智力劳动。
芯片设计阶段会用到EDA自动化设计技术,在芯片设计和芯片制造这两个环节会产生大量数据,而且,这些数据都是非结构化数据。
摩尔定律为芯片设计环节的IT基础设施带来了巨大压力。一方面,芯片每进步一代就至少需要2倍的CPU核数,用更强的算力来做芯片的仿真测试和验证,另一方面,数据存储所需的容量也将翻倍。
有数字显示,设计10nm的芯片,前后大概会产生600到700TB的数据,如果做7nm芯片,可能就会产出1到1.2PB的数据量了,对存储容量提出了新挑战。
芯片行业是智力密集型产业,对于存储本身的安全性和可靠性要求必然很高,同时,它对于存储性能的要求也很高。
从芯片的设计过程来看。
芯片设计工作复杂度高,前端设计需要数千台工作终端并行工作,有大量的小文件读写操作,通常一个芯片的小文件数量可能会达到成百万甚至是上千万的级别,这个文件可能是KB级以及以上的。这一阶段,对存储的要求就是要求有更高的随机IOPS。
后端设计时,需要进行大量的仿真模拟验证工作,在反复的迭代过程中,需要不断调整设计并且继续不断验证,事实上,仿真测试验证阶段通常需要一周甚至几周时间持续运行仿真作业。
这一时期,仿真验证会产生大量的大文件,通常是GB级甚至是百GB级规模,要求存储具有非常高的吞吐和带宽。同时还应该注意到,因为仿真验证阶段需要持续长时间运行,所以,对存储稳定性和可靠性也提出了非常高的要求。
设计完成后,产生的许多设计数据和历史数据就没用了吗?
当然不是,这些数据也同样非常重要,这些数据可用于后续新款芯片的设计过程,或者在芯片出现了某些质量问题时,进行一些回溯检查,许多芯片的生命周期都是很长的,所以,这些数据都需要长期甚至永久保存。
这些归档数据对于存储性能要求不高,但对于存储跨代兼容能力要求却特别的高。我们都知道,IT设备的寿命通常是5到8年,但数据需要永久保留,这就要求归档存储能无缝更新换代,来保证数据永远保存下去。
戴尔存储如何应对EDA数据挑战?
以上关于芯片行业数据挑战的介绍都来自于戴尔专家的介绍,不难看出,芯片设计领域对于存储的要求还是非常苛刻的,芯片每年都会更新迭代,某一个环节出问题,连锁影响都非常大,戴尔还是非常了解芯片设计行业的。
据了解,戴尔在芯片行业里深耕多年,并有非常不错的市场表现。全球范围内,排名TOP20的知名芯片设计企业中,大约有80%都在使用戴尔的分布式文件存储系统PowerScale,它可以很轻松地应对芯片设计各个环节所面临的数据挑战。
首先,很重要的一点在于,PowerScale拥有大规模横向扩展能力,芯片设计企业可根据性能和容量需求,进行线性扩展。在PowerScale灵活的横向扩展架构的支撑下,即使芯片设计企业无法准确预知未来的数据量究竟有多大,也无需进行太多具体的规划。
第二点,PowerScale能满足芯片设计不同阶段对存储的要求。
芯片前端设计阶段需要OPS性能,全闪存的PowerScale最合适。设计完成后需要归档存储,PowerScale也有归档节点可选,在全闪节点和归档节点之间,还有混合节点,在性能和容量之间实现了一个平衡,适合芯片后端设计阶段。
芯片设计企业可根据需求灵活组合使用,组合会形成一个单一的文件系统,文件系统对于前端应用来说,也是完全透明的,整个芯片设计中的数据生命周期管理完全是由PowerScale的自动分层来自动智能化地管理的,减少了管理负担。
仿真模拟阶段要求IT系统高度稳定可靠,PowerScale N+4冗余设计提供了高可用和高可靠性,芯片行业还是非常看重芯片产品上市规划的,高可靠的存储有助于避免可能造成的不利影响和巨大损失。
第三点,PowerScale可在不进行数据迁移的情况下进行更新换代,而且具备跨代兼容的能力,这些特点都非常适用于芯片设计数据要永久保留的需求,PowerScale可以让芯片企业轻松长期保留数据。
PowerScale还有许多特性都适用于芯片设计领域,比如,全线产品都支持数据缩减能力,芯片设计企业实际使用的数据显示,PowerScale上大概能够达到接近2:1的有效的存储效率,从而有效降低存储成本,同时有助于节省机房空间、能耗等各种成本因素。
戴尔存储助力行业构建创新引擎
戴尔存储在芯片行业的应用不限于设计阶段,在芯片制造阶段,一些企业在用PowerScale存储收集芯片产线的数据,比如,温度、湿度等各种各样的环境数据以及芯片制造数据,基于这些数据做大数据分析,通过大数据分析来提升芯片的良品率。
PowerScale支持原生的HDFS(Hadoop分布式文件系统),可以提供就地分析的能力,采集而来的数据无需迁移复制即可进行分析,以此来加快数据分析的流程,释放数据价值。
IDC预计,到2025年,全球数据量将增长到175ZB,其中绝大部分都属于非结构化数据,这些数据来自各行各业的数字化转型进程,这也意味着基于非结构化数据的创新也将继续涌现,下一期,我们将分享更多行业的数字挑战和创新故事。