首页 > Python机器学习 阅读数:31

学习机器学习的好处有哪些

宏观上来分,基本上所有的机器学习算法都有两个层面的功效:面向过去(历史数据)找规律;根据归纳出来的规律面向未来(新样本)去预测,如图 1 所示。

机器学习算法的两层功效
图 1:机器学习算法的两层功效

在哲学上,前者重在归纳,后者属于演绎。前者是基础,后者是核心。毋庸置疑,机器学习算法的核心价值,被锚定在对新样本的预测上。

说到预测,我们日常生活中最常见的可能就是相面算卦了。抛开事物表象,它的逻辑同样适用于上述两个层面。很多算命先生能猜中(即预测)顾客的情况,这看上去很厉害,但实际上他们的秘诀并不是周易相术,而是归纳和演绎。

算命这个职业也是有门槛的,并不是每个人都能做的,算命先生同样需要学习。培训他们的秘传书籍之一,是一本叫作《玄关》的小册子。这本书里有很多好用的观察口诀,比如“父来问子,子必险”说的是,如果父亲来问孩子的情况,那么孩子的现状通常不好。再比如“老妇再嫁,谅必家贫子不孝”说的是,年纪大的妇女改嫁,差不多都是因为家穷且孩子不孝顺。

这些所谓的口诀,实际上都是对世间人情世故的归纳。大哲学家休谟说,归纳法是人类一切知识的基础。是的,归纳(从众多个体中抽象出一般特征)并不是知识的终点,通过演绎(从一般到个体)来实施预测,才能发挥知识的功效。

算命亦是如此。当一个顾客(新样本)来算命时,相面者通过观察、话术和一些实用的心理技巧,就能获得必要的信息,用机器学习的行话说,就是抽取特征。套用过去归纳出来的规律,就能比较准确地推测出来者的身份,用机器学习的行话说,就是分类。

前面我们以相面算卦为例,剖析了机器学习的方法论。当然,这只是一个类比,并不是让你去相信算命。如果你非常较真,不喜欢这个类比的话,我们还可以用马云先生在一次演讲中的话来辩护:“人算不如天算,天算不如云计算”。我们现在的所有机器学习应用实例,基本上都可以算作依据大数据(相当于历史经验)和大算力(比如云计算)实施的“大算命”。

为什么说是“大算命”呢?可以看到,不论是在电商网站购物,还是在头条阅读新闻,不论是在刷抖音,还是刷微博,智能终端推送的信息(包括广告)基本上是千人千面的,绝不雷同。

事实上,在数字世界里,你的一举一动,每次的屏幕点击,每条朋友圈的点赞,页面访问的停留时间,指尖滑动的轻重,都构成了机器学习算法学习的质料,从而帮助机器学习算法形成各个“顾客”的“用户画像”(user profile)。最终在大算力的加持下,分布式机器学习算法能够给成千上万的人同时“算命”,推测用户的喜好,如同相面先生一样,洞察人间万象,投你所好,送你所爱。