Facebook开发人工智能实现图文互译

一种由Facebook人工智能研究团队开发的神经网络,可以采用文字描述并运用自然语言界面生成精准图像。

20160229075536ff0dc_550

 

用文字画画

今年,Facebook的AI研究团队(FAIR)在GPU技术大会公布了他们的神经网络。在活动中,他们展示了其基于文字描述生成虚拟图像的技术实力。

演示过程中,团队展示了通过键入单词“beach”而形成的神经网络,AI由此生成一幅“天空下的沙滩”画面。研究团队输入“beach – clouds”,随即生成了一个类似的图像(只是这次没有云)。在此次演示的最后阶段,他们输入单词“sunset beach – clouds”,同时AI生成一幅落日、海滩与晴朗的天空交相辉映的唯美画面。

Facebook的AI研究团队已经能够训练神经网络特定用词与它们对应的图像联系起来。通过使用一台超级计算机来展示由神经网络生成的千上万个不同的图像。

Facebook的神经网络之所以如此特别,在于它将单词进行组合,并将这些组合与其适当的相应图像相关联的能力。人工智能是可以同时添加描述并除去某些方面的图像,以履行文本描述为最终目的。这就是所谓的自然语言界面。

虚拟世界

这种方式在2D图像效果上表现出色,但Facebook有更大的野心,包括由相同自然语言界面生成的3D图像。

从2D上升为3D并非易事,尽管它涉及到使神经网络识别三维空间,并训练它鉴定大量的3D资源,这一点确实不如2D图像那样丰富。幸运的是,随着最近VR和AR敞开大门,对外部资源的不断扩散,打赌在不久的将来,你就可以按照我们所说的这样方便快捷地创建一个完整的虚拟世界了。

【更多行业资讯,请关注DOIT官方微信(微信号:doitmedia),关注科技与数据经济,洞察IT走向DT。】