人脸识别的发展

8月29日下午,由七牛公司主办的主题为“数据重构未来”的“七牛·数据时代峰会”在上海国际时尚中心继续举行。Face++ CTO唐文斌分享了人脸识别的发展,以下为演讲实录:

 
        唐文彬:大家好,我是来自face++的唐文彬。
 
       大家对于我们的理解停留在face++,其实我们名字并不叫face++,我们名字叫Vision  Revolution,我们想做的事情,是让机器看懂这个世界。为什么说我们叫face++呢?因为大视觉这个事情,在开始的时候,很难讲一个大的梦想。连马云都说,这个梦想万一实现呢?所以我们让face++成为我们起点,让机器先看懂face,未来让机器看懂更多的东西。咱们这个会更多是在说大数据的事情,我们现在很多说的大数据,指的是那一些可以被结构化被数据化,被量化被计算机处理的数据的举个例子,比如说你在网上看一个页面的时候,跳转到下一个页面的概率是多少,这个地方用户量有多少,都是这样的数据,但是实际上我想说,这一些量化,已经被量化的数据,其实只是大数据的冰山一角,还有非常大的数据其实在我们生活当中,举个例子,现在在场这么多的人当中有多少人低头看手机,一定程度上反应我演讲有多无聊。就是数据存在拿来,但是并没有被量化没有被分析。
 
       我这里有一张图,左边是科幻美剧里面的图。每个经过的人,他的面部标清、穿衣是什么样的,包含非常多的数据。包括路口里面开的车,这个车里面坐的什么人,这个人做什么样的事情,包括体育比赛当中,有很多的数据,这些数据我们很难用大数据的方法被处理。因为它现在只是一个视频的数据,很难把它归结成一个一个的条度,变成计算机可以处理的数据。所以我们要把非结构化的数据能够看懂,能够变成大结构化的方法,增加机器的智商,成为智能的机器。我们想到人是怎么捕获数据的。靠的是五官。人获得信息更多是通过眼睛。我们想,机器能不能像人一样拥有眼睛。比如我看到这个信息,比如我看到前面两排沙发,知道前面的嘉宾都溜了,但是后面的同学还在。
 
       我们这家公司想做大的视觉,但是这个梦想太大了,我们很难让机器一上来就看懂数据的能力。所以我们希望从高价值的开始,让机器先看懂这些高价值的物体,我们人平时在看哪一些东西呢?我想这几个东西大概涵盖了我们平时生活当中主要看到的物体,我们大不时间在看人的脸,包括小孩会说的第一句话喊爸爸喊妈妈,是对着那张脸来说的。然后我们会去看人,会去看车,读书,看文字。还会看我们现在处在什么样的一个场景。这五个要素形成了在视觉里面,叫做,就是信息量最大,但是量又比较少五个单点,如果解决了这五个单点,就解决了大部分的场景。
 
       我们公司是希望机器能了解世界。我们第一个开放平台是face++。开始是希望看懂人脸,第二个是希望看懂图象,包括第二个高价值的品类。未来我们还会推出,因为其实还有一些动作不是靠一两张图象就能表示出来的。举个例子说,当我两只手分开,合拢,再分开,这个是视频里面一系列的动作,形成了拍手或者是故障,这个是我们的VIDO++,这个是我们的技术路线。千里之行始于足下,我们希望机器能看懂很多的东西,我们希望机器先进行第一步,先看懂人脸。看懂人脸就可以解决很多问题,比如刚刚说到,人脸可以帮助走失儿童。我想说这个技术特别难,我们解决得也不好。因为小孩的脸基本上是圆乎乎的样子,他明天跟今天还不太一样,因为小孩长得太快了。还有非常多的应用场景,包括可以帮助大家在美图的时候,帮助大家把眼睛放大一点,而不是把鼻子放大一点,可以帮助大家在数据里面找到与你喜好合适的妹子或者是帅哥。可以帮助大家做线上的身份认证。我们也可以帮助这种叫做安防的场景,使得可以有这种黑名单或者是白名单的识别的能力,包括可以放在公司或者是小区,变成门禁,大家不用老带门禁那张卡了。也可以在办公室里面对于重要人物做的迎宾。我们可以做非常多的场景。我想说的这个是我们的第一步,通过看懂人脸的第一步,未来能够具备更多看懂其他东西的能力,从而让机器能看懂世界。
 
       最后今天非常有幸跟七牛有个合作,七牛上有非常多的图象的数据,我们希望在七牛上让七牛也能有看懂人脸的能力。谢谢大家。