关于机器学习,你所知道的,可能都是错的

2018-6-28

雷锋网按,虽然机器学习已经成为一个高频名词,但是对于大众而言,它依然是一个遥不可及乃至模糊不清的概念。为此,著名投资人 Benedict Evans 在自己的博客上发表博文,针对这一问题表达了自己的看法;雷锋网对这篇博文进行了不改变原意的编译。

机器学习的风潮已经刮了四五年了,除了以 AI 为名如雨后春笋般快速崛起的新创公司们,各家科技巨头也希望围绕这个时髦词“重塑金身”。此外,通过媒体的大肆宣传,机器学习也已经成了一个家喻户晓的名词。总之,机器学习将成为下一个能帮“猪”起飞的风口已经是大家的共识。

在正式开始之前,我们先说说人工智能(AI),机器学习,神经网络和深度学习四者的关联。简单来说,人工智能的范畴最大,机器学习包含在内,它是带来人工智能的方法。至于神经网络,则是机器学习众多算法中的一类,而深度学习则是实现机器学习的技术,是它的一种延伸。

经过这么多年的知识普及,恐怕理解(理论上)神经网络是什么的人已经相当多,至少大家都知道它与范式和数据有关。机器学习让我们能在数据中找到那些暗示性和随机性的范式或结构,而在此之前能找到这些隐含属性的只有人类,因为我们会推理。

有了机器学习,那些原本对人类来说相当简单(或者说无法向计算机描述的问题)但却能难倒计算机的问题就迎刃而解了,各路公司也都拿出了相当炫酷的演示。

不过,笔者依然认为,对于机器学习的定义,整个行业依然没有一个固定的理解,一切都还未尘埃落定。对于科技公司或整体经济来说它到底意味着什么?机器学习到底能解决什么重要问题?它对于普罗大众又意味着什么?如何从结构上理解它的影响呢?

这时有人会抬出 AI 这个术语,不过它其实一个问题都回答不了,它就像《2001 太空漫游》中提到的黑色巨石(代表未解之谜),在它面前我们都是挥舞着拳头吼叫的猩猩,想解构 AI 几乎是不可能完成的任务。

事实上,我觉得现在大家能提出一大串无用的方法来讨论机器学习的发展程度。举例来说:

1. 数据是新的石油

2. 谷歌和中国包揽了所有数据

3. AI 将抢走所有工作

4. 只谈论 AI

也许,我们能找个更多有用的角度,比如:

1. 自动化

2. 为技术层赋能

3. 关系数据库

为什么要提到关系数据库呢?因为它们是新的基础赋能层,可以扩大计算机的能力范围。在关系数据库出现之前(上世纪 70 年代末),如果你想让数据库告诉你“住在这座城市里的人谁买了这件商品”,就必须专门搞个定制版的工程项目。也就是说,当时的数据库建立时没有结构,因此想实现任意的交叉引用查询可是个难事。如果你想问个问题,就得有人围绕这个问题下大功夫工作一番。当时的数据库只是一套记录系统,但关系数据库的出现让它们进化成了商业智能系统。

这样的改变也让数据库的重要性陡然增加,新的用例伴随独角兽们如雨后春笋般诞生。

1234阅读全文

相关游戏

最新合集

相关文章

网友评论

    加载更多
    回复 [1楼 ]取消回复