绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
【译】看清机器学习的真面目
2019-12-09 13:55:56


现在是201912月。好像现在的每一场技术讨论,如果一个人想让自己听上去很酷,就会说出“机器学习”这个词,期待着能够征服这场讨论。

我就是其中之一。我想让我的生活更精彩,所以放弃了高薪职业,转而去攻读机器学习硕士学位。我对这个决定并不后悔,但是我却发现机器学习非常令人失望,所以最终我改变了我专业方向。

当你在完全理解机器学习的那一天,你对于机器学习的幻想就会随之结束。根本就没有任何机器学会了任何事情。把这个领域称为“机器学习”真是一件神奇的事情。

你可能听说过,机器学习可以治愈癌症,可以开车,可以代替人类自己写代码等等等等。记住我的话——这些都是是辣鸡

截止2019年9月,机器学习主要只做了4件事。

1. 回归任务

给定一组数据,当有新的数据行被加入时,机器学习可以预测,这个新加入行的某些缺失值的可能值。

a b 2b c 3x d ?复制代码

2. 分类任务(监督学习)

给定一系列的对象和一系列的分类,我们已经知道哪些对象属于哪些分类。机器学习可以预测,一个未知类别的新元素,它是属于这一系列分类里的哪一类。

例如,奥迪和宝马属于“汽车”类别,波音和空中客车属于“飞机”类别,如果我现在给出了泰坦尼克号,机器学习有很大概率会把它分类为“飞机”,因为泰坦尼克号的重量,高度,成本等更像是一座飞机。可是机器学习永远无法判断它实际上是一艘船,因为我们最初给出的分类里没有一个叫做船的东西

3. 非监督学习(通常也用于分类)

给定一系列的对象,和想要分类的数量n。机器学习可以把类似的对象分为到一组,一共分为n类。

再例如。我现在要把奥迪,宝马,波音,空客以及泰坦尼克号进行分类,现在我告诉神经网络有2个分类集。他很有可能会预测奥迪和宝马属于一类,空客,波音,泰坦尼克号属于第二类。但是,它不能说出第一类和第二类实际上指的是什么,需要人指着他们说——嘿,这是汽车。当然我也可以告诉它我们要分为三类,泰坦尼克号很可能会被分到第三类,因为它的特征与其他物体完全不同,但是,机器学习永远不会告诉你,它是一条船。

4. 强化学习

如果你的问题有一个最终目标(像是赢得下棋比赛),你可以设法为每一个可能的步数设置分数,像是“好棋”和“坏棋”,好棋分配奖励点数,坏棋分配惩罚。那么你设计出了一个系统,它可以让你用最大的可能性赢得比赛。(至于如何判断好棋还是坏棋, 那就是算法上的事情了,和机器学习的本身没有什么关系)

以上可以说是目前机器学习的全部了。

那既然如此,人们说他可以帮助我们实现自动驾驶,或者检测癌症呢?

你可以在几千条人类的健康情况数据中,标记出某个病人患有癌症,或者某个病人是健康的。现在,如果给出了一个新的病人记录,那么我们就可以使用分类算法来预测它是属于癌症组或健康组。

或者,我们把驾驶汽车的任务分解成数千个子步骤,比如向右移动,向右移动,结合道路状况,机器学习就可以预测汽车下一步应该采取什么步骤。你可能想到了,和机器学习相比,这个任务更需要的是电子和机械工程方面的创新。

机器学习只是一台计算机执行一些算法,并提供一些输出,在任何时候,它都不能控制我们或者统治世界。

机器学习是计算机的算法,离散数学,和概率论的结合。如果我们把大量的数据喂给它进行计算,他可以给出一些模拟真实世界的概率值。但是,认为它会改变世界的假设,实在是太夸大其词了。

作者:如意同学

链接:https://juejin.im/post/5dbb9faa518825211d73fe21

来源:掘金

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

分享好友

分享这个小栈给你的朋友们,一起进步吧。

通俗易懂--机器学习
创建时间:2019-08-02 11:00:07
这里汇集了机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。 以各个模块为切入点,让大家有一个清晰的知识体系。 亦可拿来常读、常记以及面试时复习之用。 每一章里的问题都是面试时有可能问到的知识点,如有遗漏可联系我进行补充,结尾处都有算法的实战代码案例。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

栈主、嘉宾

查看更多
  • mantch
    栈主

小栈成员

查看更多
  • 栈栈
  • Jack2k
  • hwayw
  • 天上飘下来的人
戳我,来吐槽~