《易播报》第2期关键词:英伟达与芯片制造、Midjourney和洛神、D-ID、FireFly

欢迎来到DOIT最新打造《易播报》有声栏目,反套路汇总一周IT热点事件,每周五准时放送,小易与你相约。

1、英伟达如何助攻芯片制造

在3月21日的GTC23(GPU科技大会)上,英伟达CEO黄仁勋的演讲里get到的几个点:

英伟达面向半导体行业发布了一个计算光刻库Culitho,把光刻计算提速了40倍以上。我们知道的芯片代工厂台积电和EDA软件提供商新思科技正在把这个软件库整合到最新一代NVIDIA Hopper架构GPU的软件、制造工艺和系统中。光刻机制造商ASML正在计划把自己所有计算光刻软件产品里都加上GPU,当还有整合cuLitho。

光刻是在晶圆上刻图的过程,是芯片制造过程的起始阶段,包括光掩模制作和图案投影。光刻计算是芯片设计和制造过程里最大的计算工作负载,目标是提升芯片良品率,简单理解就是用算法预测晶圆掩膜板上的图案,模拟光通过光学元件并与光刻胶相互作用时的行为。感觉有点像郑渊洁的罐头小人,在米上雕刻万里长城,cuLitho作为一个包含优化工具和算法的软件库能加速芯片制造的优化设计,值得关注。

还有就是英伟达新发的超级芯片Grace CPU和Hopper GPU,两个相同芯片接口连接速度是900 GB/秒。Grace和Hopper都非常适合处理大型数据集,例如适用于推荐系统和大型语言模型的AI数据库。就是适用于类似GPT的语言模型

2、大批ChatGPT们成群而来

从生成式文本到生成式图像模型,前有DALL-E和Stable Diffusion,现在又出了新的AI绘画工具Midjourney。

DALL-E是OpenAI开发的文字生成图像的AI模型,本周新必应已经基于它推出了Bing Image Creator,是经过大量图像和对应的文本描述的数据集训练生成新图像。

Stable Diffusion是基于Transformer的生成模型,采一段图像数据然后直接加噪声知道数据无法识别,这个模型是把图像回退到原始形式,在这个过程中学习怎么生成图片,会训练和调参的话,出图效果会越来越好,如果是只会增加文本描述的小白,效果可能不会太明显。

好在有了MidJourney,它是用神经网络和计算机视觉算法的组合来理解我们输入的文字并生成符合需求的图像,语句的训练更精准。小白生成的图都很OK。另外注册的时候千万不要随机填岁数,至少不要写14岁以下,未成年不让玩,别问我是怎么知道的。

下面是一张小白基于《洛神赋》中描述洛神的外貌段落生成的图像,有点好看。

还有Firefly就是萤火虫,Adobe的手笔,这个萤火虫被称为AI绘画可能的终极形态,再也不用担心AI绘画的版权问题了。Firefly使用的是Adobe Stock中大量的专业授权图像、版权已过期的公开授权内容,以及公领域的内容训练而成。跟微软的copilit类似就是在你修图的时候,你只要输入修图的文字描述就可以辅助你编辑图片,也可以生成图片,而且更安全,是大厂们未来的最优选。

D-ID视频生成工具,首先是付费的,但你可以试用,上传明星图像不可以,自己的可以,并且五官轮廓要清楚,然后输入文字,就可以帮你生成一段人物讲话的视频,效果还行。