佚名 发表于:14年07月03日 14:41 [转载] DOIT.com.cn
看Facebook如何自动分析帖子是否“正能量”
据国外媒体报道,Facebook自曝其研究人员曾操纵Facebook的“信息流(News Feed)”,人为地向某些用户显示更多正面或负面的内容。那么,Facebook的研究人员是如何确定一个帖子为正面的或负面的?
他们利用一个被称为“语言获得和词汇计数”(Linguistic Inquiry and Word Count,LIWC)的自动文本分析软件程序。该软件收集了4500个以上的单词和词根,能够帮助研究人员挖掘和分析文本中包含的情感。
根据Facebook的研究报告,如果帖子含有至少一个被LIWC归类为正面的单词,则该帖子被确定为正面的;反之,如果帖子含有至少一个被LIWC归类为负面的单词,则该帖子被确定为负面的。
例如,LIWC将“哭泣(cried)”归类为悲伤情绪,而悲伤是几个负面情绪之一;像“恼怒(annoyed)”等单词归类为愤怒的情绪。而像“也许(maybe)、可能(perhaps)或者猜测(guess)”这类单词,则表明该帖子的内容是试探性的。
该软件能够通过分析词性,以评估单词被使用的上下文语境。这类软件的开发者称,他们正在努力,以使软件能在评估数十万个句子的基础上来解决歧义的问题。
越来越多地公司和研究人员使用LIWC这类软件,来分析社交化媒体上数量庞大的内容。营销人员想知道用户如何评价自己的品牌,而学者希望通过挖掘社交媒体内容,以研究人们的行为和社会发展趋势。
LIWC的网站显示,该软件开发于上世纪90年代初。该软件基于研究人员数十年的研究,他们发现人的生理和心理状态可以通过其所使用的词汇来预测。研究人员还发现,书写可以影响人的情绪状态。