机器学习算法和图论算法有什么不同
或者,算法是怎么分类的?首先想到的,处理的数据量上的不同。比如传统的一个道路规划问题,涉及到的对象在百数量级上是很正常的现象,而现在数据产生的速度太快了,数据太多了,对于一个网络优化问题可能涉及的对象是几个亿,比如facebook。但是这还是不能回答我最开始的问题,即便是百万,十万对象的网络,比如约会网站吧,在这个数量级差不多,它会涉及到推荐算法,推荐的方法的话是用概率模型去做的,可以用机器学习的方法学习出一些结果;那么对一个同量级的对象,会需要一个图论算法去做解决什么问题吗?个人觉得机器学习主要在于解决问题的思路不同,态度更开放,我晓得的一些图论算法就是针对一个对于全局有了很稳定认识的解决方法,而比如一个线上的机器学习算法,它的预测结果直接影响新数据的产生。基本上这样的方法是可靠的,对于任意一个全局的算法,可以用开放的眼光看它,即用机器学习的方法适用它将它应用到新的有大量数据支持的适宜的问题中的。
这个时代的困难在于,我们不能用自己大脑在一瞬间可以理解的范围之内全面的理解一个问题,我们把大家的大脑都连起来了,我们也需要更强大的工具理解前所未有的问题。比如,从远古,理解若干个事件交织的复杂的问题是有困难的,我们利用文氏图清晰地显示多于4、5个事件之间的逻辑关联。现在是几十亿人,不知多少事件的关联,利用文氏图都不够了,但是我们总是可以找到合适的切入点提纲契领的理解总体的事物,我们的工具变成了高等数学,可靠的矩阵运算。所以,我自己倾向于将机器学习看成可靠地帮助我们理解新事物的方法,它使用的工具来自我们可靠的数学观点。
所以,机器学习的想法最重要,可以从任何一种现有的可靠的观点指导下,拓展我们理解世界的方式。我想把它解释为一种群体智慧的形成机制,为什么是群体智慧,我做为个人不需要识别一万张脸与他们的名字对应,但是做为一个公司却有需要在一秒钟之内认出自己的客户并且向他问好,提供服务。也就是说,我们生活的时代群体智慧起不可估量的作用,向四周一看你就明白你所用物品大部分不是来自认识和亲近的人。其实也是观念的成长,中国很长一段时间的小农经济自给自足,如果你吃的竟然是别人种的粮食,穿是别人织布剪裁,这在当时会是让你很不适应的。这个如今排斥Google的街景车来保卫自己的隐私这有啥差别呢?再到离我们更近一点的历史,更多的是群体智慧具象化的产品的传播,而如今呢更直接的就是群体智慧的传播。
机器学习背后的Philosophy应该是这样一种开放的面向未来的态度,我自己挺认同,也希望能把群体智慧开掘出来,产生前所未有商业价值。