人脸识别的发展-DOIT-数据产业媒体与服务平台

8月29日下午，由七牛公司主办的主题为“数据重构未来”的“七牛·数据时代峰会”在上海国际时尚中心继续举行。Face++ CTO唐文斌分享了人脸识别的发展，以下为演讲实录：

        唐文彬：大家好，我是来自face++的唐文彬。

       大家对于我们的理解停留在face++，其实我们名字并不叫face++，我们名字叫Vision  Revolution，我们想做的事情，是让机器看懂这个世界。为什么说我们叫face++呢？因为大视觉这个事情，在开始的时候，很难讲一个大的梦想。连马云都说，这个梦想万一实现呢？所以我们让face++成为我们起点，让机器先看懂face，未来让机器看懂更多的东西。咱们这个会更多是在说大数据的事情，我们现在很多说的大数据，指的是那一些可以被结构化被数据化，被量化被计算机处理的数据的举个例子，比如说你在网上看一个页面的时候，跳转到下一个页面的概率是多少，这个地方用户量有多少，都是这样的数据，但是实际上我想说，这一些量化，已经被量化的数据，其实只是大数据的冰山一角，还有非常大的数据其实在我们生活当中，举个例子，现在在场这么多的人当中有多少人低头看手机，一定程度上反应我演讲有多无聊。就是数据存在拿来，但是并没有被量化没有被分析。

       我这里有一张图，左边是科幻美剧里面的图。每个经过的人，他的面部标清、穿衣是什么样的，包含非常多的数据。包括路口里面开的车，这个车里面坐的什么人，这个人做什么样的事情，包括体育比赛当中，有很多的数据，这些数据我们很难用大数据的方法被处理。因为它现在只是一个视频的数据，很难把它归结成一个一个的条度，变成计算机可以处理的数据。所以我们要把非结构化的数据能够看懂，能够变成大结构化的方法，增加机器的智商，成为智能的机器。我们想到人是怎么捕获数据的。靠的是五官。人获得信息更多是通过眼睛。我们想，机器能不能像人一样拥有眼睛。比如我看到这个信息，比如我看到前面两排沙发，知道前面的嘉宾都溜了，但是后面的同学还在。

       我们这家公司想做大的视觉，但是这个梦想太大了，我们很难让机器一上来就看懂数据的能力。所以我们希望从高价值的开始，让机器先看懂这些高价值的物体，我们人平时在看哪一些东西呢？我想这几个东西大概涵盖了我们平时生活当中主要看到的物体，我们大不时间在看人的脸，包括小孩会说的第一句话喊爸爸喊妈妈，是对着那张脸来说的。然后我们会去看人，会去看车，读书，看文字。还会看我们现在处在什么样的一个场景。这五个要素形成了在视觉里面，叫做，就是信息量最大，但是量又比较少五个单点，如果解决了这五个单点，就解决了大部分的场景。

       我们公司是希望机器能了解世界。我们第一个开放平台是face++。开始是希望看懂人脸，第二个是希望看懂图象，包括第二个高价值的品类。未来我们还会推出，因为其实还有一些动作不是靠一两张图象就能表示出来的。举个例子说，当我两只手分开，合拢，再分开，这个是视频里面一系列的动作，形成了拍手或者是故障，这个是我们的VIDO++，这个是我们的技术路线。千里之行始于足下，我们希望机器能看懂很多的东西，我们希望机器先进行第一步，先看懂人脸。看懂人脸就可以解决很多问题，比如刚刚说到，人脸可以帮助走失儿童。我想说这个技术特别难，我们解决得也不好。因为小孩的脸基本上是圆乎乎的样子，他明天跟今天还不太一样，因为小孩长得太快了。还有非常多的应用场景，包括可以帮助大家在美图的时候，帮助大家把眼睛放大一点，而不是把鼻子放大一点，可以帮助大家在数据里面找到与你喜好合适的妹子或者是帅哥。可以帮助大家做线上的身份认证。我们也可以帮助这种叫做安防的场景，使得可以有这种黑名单或者是白名单的识别的能力，包括可以放在公司或者是小区，变成门禁，大家不用老带门禁那张卡了。也可以在办公室里面对于重要人物做的迎宾。我们可以做非常多的场景。我想说的这个是我们的第一步，通过看懂人脸的第一步，未来能够具备更多看懂其他东西的能力，从而让机器能看懂世界。

       最后今天非常有幸跟七牛有个合作，七牛上有非常多的图象的数据，我们希望在七牛上让七牛也能有看懂人脸的能力。谢谢大家。

人脸识别的发展

zhoub

相关推荐

近期文章

热门标签