借大数据兴风,欲无监督作浪
人工智能毁灭人类的流言再度四起,原因便在于大数据。随大数据而来的一系列变革在众多领域发生,人工智能在大数据的带动下也开始兴风作浪。
大数据的崛起对机器学习意义非凡
大数据的核心在于数据挖掘,机器学习便是数据挖掘时最常用的方法之一。因此,机器学习技术不断的完善,原本模仿人类大脑的三点先天不足已经逐渐不再重要。
首先,机器学习处理大量数据时所采取的分布式处理技术已经成熟,也就是说在处理大量的任务时,并非集中处理,而是将任务分块,采取多个组件同时处理运算,这样就大幅提升了计算效率,计算能力远远超过人类的大脑;其次,我们在机器学习时会给予其大量的样本,并设置相应的处罚函数,然后通过训练逐步减少处罚函数出现的概率,提高的机器的智能水平;
机器学习不再仅仅是一种数据挖掘的算法
最后,机器学习的方法也更加成熟,现在一般分为三种:监督学习,半监督学习和无监督学习。监督学习是指利用一组已知标注类别的样本调整分类器的参数,使其达到所要求性能的过程。简单来说就是给机器一堆有标记的数据,然后让机器学习后,推测得出新的未知的信息。这其中的代表方法就有神经网络、SVM、Nave Bayes、KNN和决策树等,目前与韩国棋手李世石挑战的谷歌AlphaGo采用的便是神经网络的学习方法。
半监督学习是指介于监督学习和无监督学习之间,利用少量的标注样本和大量的未标注样本进行训练,以得出新的位置信息的办法。这种方法更多的像是两种方法的结合,也是现在正在兴起的一种方法。
无监督学习则指设计分类器时,不给样本参数任何标签,让机器自行分析处理。目标便是让机器学会自主学习。曾经有人设计过一项电脑程序,让其利用无监督学习的方法玩一款游戏,在进行了多次游戏以后,这项程序的游戏水平不仅超过了使用监督学习方法学习的机器,比之人类最好的玩家也要出色许多。
逐渐脱离监督进行学习,是谁的愿望?
但是目前,由于无监督学习还处于起步状态,因此半监督学习和监督学习的改进版是现在人工智能的主流方法。无监督学习既然已经开始,这种更为优秀也更智能的方法必然会成为未来发展的主流,机器学习的自主性提升后,似乎已经比人类更胜一筹。