近期,华为“天才少年”“天价高薪”吸引了很大关注。对于华为来说,爱才惜才,高调表露了致力于基础技术领域研究的决心。同时,对于基础技术领域的人才而言,也是莫大的鼓舞,为高端技术人才树立了楷模。吃瓜群众也别太羡慕,人家拿百万年薪其实不过分。
在四位天才少年中,有三位来自华中科技大学武汉光电国家研究中心的博士(武汉光电国家研究中心依托华中科技大学,是科技部首批批准组建的6个国家研究中心之一。通俗点说,它就是传说中,只有学霸中的学霸才能去的地方),该研究中心最擅长的是研究存储技术,所以,不出意外地:
张霁的研究方向是磁盘和数据库相关的智能优化方向,姚婷的研究方向是新型存储介质和键值存储系统方面,左鹏飞的研究方向是非易失性内存系统,都与云存储系统有直接关系,对于华为企业存储和华为云计算都非常有价值。
在历年来的中国存储峰会和闪存峰会上这种数据存储的主题大会上,经常能看到华中科技大学的影子,包括华中科技大学计算机学院冯丹院长,华中科技大学武汉光电国家研究中心谢长生教授,华中科技大学博导吴非研究员,华中科技大学在计算机学科培养了大量人才,作为中国顶尖学府之一,为数据存储领域输出了许多优秀人才。
2019年全球闪存半导体峰会上,由CCF-存储专委会挑选了中国十佳闪存论文中的6篇参加报告,第一位就是姚婷,此外还有程稳和王强也都来自华中科技大学,华中科技大学简直是存储专家的摇篮。此外还有来自清华大学的杨青霖,中国科学技术大学的田成锦,国防科技大学的徐尔茨,主题全都是跟数据存储技术相关。
当然,除姚婷以外的这几位同学也都非常优秀,自然吸引了许多求贤若渴的企业,值得一提的是,大会现场还有阿里云存储部门负责人吴结生,当时本以为这几位同学大概率会去到阿里云,没想姚婷去到了华为。徐尔茨同学的演讲主题是《阿里云数据中心固态盘存储系统的经验与教训》。下文提到的另一位天才少年张霁的Paper还与腾讯有关。
国内IT巨头对于人才的重视可见一斑。
有网友可能会好奇天才少年的研究方向和研究内容,为什么能斩获百万年薪?这里简单介绍下当时姚婷的演讲内容,看完之后你很可能会觉得华为这样做还是很有道理的。
2019年闪存峰会上,姚婷的主旨演讲内容是《GearDB:在瓦记录磁盘上构建无垃圾回收的键值存储系统(A GC-free Key-Value Store on HM-SMR Drives with Gear Compaction)》,有媒体采访时姚婷表示去华为做的工作就与这些内容有关。
那么,姚婷讲了什么?对华为有怎样的价值呢?
瓦记录磁盘说的是SMR(Shingled Magnetic Recording),是继续CMR(Conventional magnetic recording)之后的新一代磁盘技术。(注:在这次公开演讲前半年,姚婷在超有影响力的学术会议——USENIX文件与存储技术会议上用英文做了介绍,英文发音水平远高于大多数搞IT的人)
SMR能将磁盘的容量和性价比推向新高,但SMR性能与常用的CMR有不少差距,对于华为这样的IT厂商绕不开大势所趋的SMR磁盘,虽然闪存性能远胜于磁盘,但磁盘在容量上有优势。而且,磁盘在未来还有广阔的发展前景,在TDMR(二维磁记录)和HAMR(热辅助磁记录)出现之前,就靠SMR来不断提升性能了,也就是说谁能用好SMR磁盘就意味着掌握了发展的先机。最近UCloud就宣布在归档云存储上率先使用了SMR。
目前市场上,主流盘厂商希捷和西数都有SMR磁盘,一个新的技术方向是HM-SMR(Host-Managed SMR)和HA-SMR(Host-Aware-SMR),借助Host主机端的能力来实现一些更高级的功能,新型SMR可以解决SMR本身的一些问题,能让性能可预测,但使用的复杂度也水涨船高,在HM-SMR上构建高效的KV键值存储也是难上加难。
主要问题在于三方面,一个是垃圾回收的开销大,耗用的资源多。二是磁盘空间利用率低,这样一来就限制了大容量盘的优势。第三点,由于磁盘存入数据多,导致性能降低,同样也是用户不愿接受的。
用白话说,磁盘利用率只有非常低的60%,如果买一块现在最大的20TB磁盘,能用的就只有12TB,但是如果把利用率提升到到90%,那买一块盘就能比别人多用6TB,姚婷介绍的技术能做到这点。
这点有多大的商业价值呢?
西部数据预计,到2023年,数据中心SMR硬盘的占比将逐步增加到50%左右的比例,2023年,数据中心HDD的采用量仍将是SSD的6.5倍,也就是绝大部分的数据都要存储在磁盘上,市场非常巨大。
此外,另一位天才少年左鹏飞研究的是非易失性内存相关内容,这也是存储领域非常前沿和高端的方向,如何安全高效地使用非易失性存储能达到的效果也是降本增效。如需了解更多可以查看左同学的Github空间,上面列出了各种详尽的Paper信息。
最高档薪资的天才少年叫张霁,张霁的研究方向是磁盘和数据库相关的智能优化方向,用机器学习的能力预测磁盘并处理磁盘故障,磁盘故障轻则影响系统性能,严重的话可能导致数据永久丢失,能用机器学习处理故障的做法就很高级,当然,这一做法并非首创,目前在一些存储系统中已经有商用化案例了。
但从这张Paper(HDDse: Enabling High-Dimensional Disk State Embedding for Generic Failure Detection System of Heterogeneous Disks in Large Data Centers)介绍的内容来看,该方案的水平吊打一部分搞AI存储的厂商。因为,大部分磁盘故障预测都是面向同一厂商同一型号的硬盘来做的,而他的模型能针对各种类型的硬盘,他用的是长短期记忆神经网络(LSTM),哪怕是少数不常见的硬盘也能有很好的效果。更厉害的是,这一做法已经在实际使用中看到了效果。
另外一部分是用机器学习的能力做数据库性能调优,据说优化能力都比许多专业的人工优化还要好。机器学习代替人工做底层运维是大势所趋,不仅能减少人员成本投入,效果还比人工操作好,对华为这样的企业来说,也还是降本增效啊。
总之,技术都很前沿,价值都很大。
2020年上半年,身处逆境的华为再次完成高速增长,营收达到了4500多亿。对于华为来说,规模越大创新效益越明显,华为的企业级存储市场在快速增长,云计算业务势头也非常强,随着规模的扩大,技术创新带来的优势将成比例放大,所以,对于顶尖技术人才的需求是非常强烈的。
但,这样说还是有点片面。
天才少年计划其实还有一个标志性的意义,那就是,当中国企业开始争当行业技术标准的制定者时(比如5G的标准),当中国企业的技术水平发展到了一定领先阶段时,以往挖外企培养起来的经验型人才的道路越来越窄,关键是有些领域可能无人可挖,于是,不如索性直接高薪高调找应届生,走完全自己培养人才的道路,或许意味着新时代的到来,而这只是个开始。
这是我的个人观点,如果华为这么说就显得有点太张扬了。任正非对于天才少年的看法是,天才少年是鲶鱼,希望天才少年的加入能激活创新活力,有些敲打老员工的意思,保持紧迫感。