文章来源:宜信技术学院|宜信支付结算团队技术分享第二期-支付结算机器学习技术团队负责人 刘创 分享《AI与性原理》
分享者:宜信支付结算机器学习技术团队负责人 刘创
原文发布于个人博客:动物园的猪
一、AI和性原理
AI,也就是人工智能,这几年非常火,但究竟AI的本质是什么呢?用性原理来探寻AI的本质,可能更容易理解。接下来我们一起探讨AI、性原理、以及如何使用性原理来理解AI的本质。
二、性原理
2.1 什么是性原理
性原理,这个概念来自于古代希腊先哲——亚里士多德。
“在任何一个系统中,存在性原理,是一个基本的命题或者假设,不能被省略,也不能被违反。” ——亚里士多德
听上去有些晦涩,但解释起来很简单,就是:任何事物,都有其内在存在的“性原理”。我的理解,就是其本质的东西,这个东西其实就在那里,是基于基本的假设,你必须要认可它,它不需要什么前提和证明,有了它,你就可以去推演其他别的结论出来,这些结论终形成了整个系统。
举几个例子吧。
我们初中就开始学习的牛顿的机械论,他的性原理就是万有引力,他所谓的“基本命题”就是万物之间有相互的吸引力,并在不受外力的时候,保持物体的运动惯性。这两个假设,构建出整个牛顿力学的整体大厦,指导着建筑、工业甚至天体物理的方方面面。
重新把这个概念推介给世人的埃隆马斯克,也是一位性原理的实践者。马斯克从小就有一个梦想:移min火星,所以他开始致力于民用火箭的开发。开始他去找俄罗斯火箭公司合作,对方给他的报价是6500万美元以上,这个价格对他来说太过昂贵了。于是他重新思考这个问题,马斯克潜心研究火箭原理达2年时间,了解火箭制造的原理和流程,思考在火箭制造过程中核心的成本在什么地方。经过不断思考和实践,马斯克的SpaceX公司将发射火箭的成本削减至原本的十分之一。
随后,他又开始思考如何降低其电动车制造公司Tesla电动车电池的高成本。当时储能电池的价格是每千瓦时600美元,这个价格对整车来说太过昂贵。马斯克带领团队仔细分析电池的组成,从性原理进行思考:电池组到底是由什么材质组成?这些电池材质在原料市场价格是多少?经过考察后他们发现,电池是碳、镍、铝和一些聚合物组成,如果从伦敦金属交易所购买这些原材料,只要 80 美元/千瓦时,与之前的价格相差8倍之多。也就是说如果他可以掌握制作电池的技术和方法,那就只剩下原材料的成本了。终他们做到了,大幅降低了电池的成本,从而使得整个电动车工业蓬勃发展起来。
2.2 性原理和演绎法
性原理和演绎法是相生相伴的,演绎法其实就是三段论的推导,三段论指的是“大前提、小前提、结论”,大前提,就是指一般性的公理,而小前提往往是一些特例性的事实,有了大前提,小前提就可以依据这个演绎法推导出结论。
举个例子:“人都会死的,亚里士多德是人,所以亚里士多德也是会死的。”这是三段论的一个很浅显易懂的例子。
看到这里你是否会觉得这个方法很简单,好像没什么用呢?其实这里蕴含着一些东西,不知道你是否注意到。那就是,大前提至关重要,如果大前提错了,或者大前提并不是一个很稳固的假设,那结论就有可能不正确。
如何保证大前提正确呢?这就要求大前提也是依据演绎法推导出来的。也就是说,大前提是另一个演绎推理的结论,大前提还有一个它自己的大前提,在另一个演绎推理中,它作为那个大前提的结论存在。这就形成了一个递归,可以不断地向前追溯,直至达到性原理。
就像上学时的证明题,给你一些假设条件,让你依据一些推理公式得到终的结论,这样得到的结论非常可信。
性原理和演绎法经典的一个例子就是欧几里得的《几何原本》,他从开始的5个公理、5个公设开始,推导出来476个几何结论,牢固坚实。
性原理,辅以演绎法,是我们思考这个世界的一个非常重要的方法。我们应该使用这种方法,建立我们看待这个世界的视角。对任何事物,我们都应该不断地去思索其根本的原因和本质是什么?找到了这个本源、本质、它的性原理,其他的现象、结论和问题,都可以迎刃而解。
当然这不是一件容易的事情,在这个过程中,我们需要不断学习、思考,去伪存真,不断地思索,是否已经探究到事物本真的东西,不断地质疑,求证,反复推演,直至我们确信已经寻到了它。
三、人工智能
回到AI这个话题。2016年,AlphaGo战胜李世石,AI开始再次火起来,以至于创业圈、产业界甚至国家层面,都在热炒人工智能,到处都在宣扬人工智能将超越人类,人类将面临灭顶之灾的言论。可是,真的是这样么?让我们思考一下,这个热的概念背后的本真是什么。
先举一个近很火的AI小栗子,ZAO~
首先,为什么AI会火起来?可能你看到的是AlphaGo的胜利,而我看到的是科技作为生产力的匮乏。
我们经历过的IT革命、互联网大潮,至今已经持续了30多年,可是现在这两大技术支撑点已经开始面临红利消失的现状,人们急需一种新的科技形态来接过生产力的接力棒。左看右看,区块链过于炒作、物联网也迟迟无法落地、5G目前只局限在通讯行业...唯独AI-人工智能,似乎可以作为科技作为生产力的下一棒。就这样,AI被推上神坛,尽管它还不成熟,它还经历过3次低谷,然而对科技生产力的渴望,让人们急不可耐地把它推上了舞台。
聪明的你可能会问:为什么需要新的生产力?这正是性原理的思考方式,你在试图探究事物更深处的本源了,很为你点赞。
这个问题其实很难回答,谈谈我的理解,是因为如果没有新的生产力,就无法更多更高效地创造商品和价值,而不断膨胀的消费欲望和信贷扩张,就会戛然而止,世界的经济就会陷入停滞和衰退,从而引发各种经济、社会、政治问题。金融界的乔布斯Ray Dalio,曾经制作过一个30分钟讲述经济运行规律的视频,简单易懂地阐述了这个过程,感兴趣的你可以去谷歌一下。
抛开网上这些吹捧之词,我们来看AI产业到底发展如何呢?了解了这些,可能你就不会人云亦云地去跟着“他们”狂欢,亦或为人类未来的“灭绝”恐惧了。
然后,这个问题就变成了:我有什么办法可以快速、高效和全面地了解目前的AI行业,而不是只听媒体上的片面之词呢。
我想到了一些办法:去36氪上查AI相关企业的融资情况,因为我坚信,投资人在理念、信息方面是远超一般人的,而且,真金白银投进去,他们一定会更谨慎更全面地考量。所以,观察他们对这些AI企业的投资情况、趋势以及额度,你就可以对这个行业的情况有一个基本了解。
我还找到了我认为目前在AI方向上做得好的百度(当然你可以认为是其他企业,没有关系,这个很主观),去这些你认为的AI巨头的网站上,观察他们的行业案例、解决方案、技术白皮书,就可以迅速地知道一线企业究竟在什么地方做到了AI落地。
我还会去找一些AI企业的行研报告,通过专业咨询师的眼睛,快速领略他们眼中这个行业的情况,要知道,一份行研的价值是浓缩了专业人士花费了时间和金钱之后的量化指标和主观感受的结晶。
还有没有更好的、更客观、更低成本高效率的方法,帮助你了解这个行业的真实状况,这是你应该思考的东西,这样得到的结论,你自己才会更信服。
再回到AI这个专业领域上,什么时候AI这门学科本真的东西呢?我开始学习的时候,没有解答这个问题,所以学习效率不是很高,花了很长时间才摸到门。
了解一个学科首先得了解整个学科的框架,然后理解每个大的分类后面本质的内容。人工智能这门学科确实太大了,就拿目前火的深度神经网络来说吧,它其实只是机器学习的一个分支,只不过,神经网络的效果出奇地好,因此它才得以从众多机器学习方法中脱颖而出。
如果我们继续往深处探究,整个机器学习本质上就是在寻找数据中的统计规律,这个规律需要被表示,要么是通过线性方法,要么是通过非线性的方法,更一般的意义上,可以通过概率分布的方法。概率分布的密度函数,本身就是一个函数,既然是函数,就可以被数学上表示和拟合,而拟合方法,就可以通过深度神经网络的无数个神经元组成的组合表达出来。
如果再往深探究,本质是数学中的优化理论,以及泛函中的逼近定理,包括寻找参数过程中的反向梯度下降等等,诸多理论,都是信息论、概率统计、泛函、优化以及随机过程诸多数学分支中的严谨的数学定理在做支撑。
熟悉么?仿佛又回到了欧几里得的那个5个公理和5个公设的支撑,是的,整个人工智能,都是建立在近现代数学基础之上的,这正是性原理的完美诠释!
结语
所以,不要被媒体和专家们所迷惑,自己深入其中,去探究所谓的人工智能到底是什么,探求到它的本质,一切迷雾都会烟消云散。这就是性原理的思维方法。
无论是了解AI的过程,还是工作生活中遇到的问题,都不要被表象和喧闹所迷惑,沉下心来,认真探究事物本真的东西,拨开一层层别人给涂抹的外衣,看到它内在的本源,这样,你就会少了很多迷茫,对工作、对生活,甚至对人生,多了一份自信和从容。