关于机器学习,你所知道的,可能都是错的

2018-6-28

关系数据库的诞生给了我们甲骨文和 SAP 公司,而 SAP 和竞争对手们又一同为世界带来了全球无库存式供应链,在这一技术的基础上,苹果和星巴克等公司缔造了自己的帝国。上世纪 90 年代,几乎所有企业级软件都换用了关系数据库,包括 PeopleSoft,CRM 和 SuccessFactors 都是基于关系数据库运行的产品。此役之后,再也不会有人傻兮兮的说“没用的,甲骨文早已吃掉所有数据库”这种话了。相反,这项技术几乎成了所有新事物的赋能层,它已无处不在。

因此,这一思路才是我们现在重新思考机器学习的最佳接地方式,它会给计算机能力带来巨大的跃升,成为不同公司不同产品中的一部分。最终,机器学习也会无处不在,成为大家习以为常甚至都不愿再提的一项技术。

值得一提的是,虽然关系数据库具有规模经济效应,但它提供的确实一个有限网络或“赢家通吃”的效应。也就是说,即使公司 A 和公司 B 买了同一个数据库软件,两家公司也不会从对方那里获益。机器学习也遵循同样的道理,它的一切都与数据有关,但数据又与特定的应用程序息息相关。更多的笔迹数据只会提高它任笔迹的能力,而更多的燃气轮机数据让系统能提前预测故障,但两者并不能相互扶持。这就是其残酷之处,数据是不可替代的。

上面这段话其实彻底攥住了我们对于机器学习普遍误解的核心,即在某种程度上来看,它是一个单一的通用的事物。同时,在理解什么是自动化时我们也犯了相同错误。在每一次自动化风潮到来时,我们都感觉自己在创造一种拟人的且有基本智力的技术。举例来说,上世纪 50 年代,人类开始畅想能做家务和上菜的机器人,结果我们没培养出机器人服务生,反而造出了洗衣机。

洗衣机也是机器人,不过它们并非“智能”机器人。它们不清楚水和衣服到底是何物。此外,即使是在洗涤这个分类中,它们也并非通用产品,要不然洗碗机也不会诞生了。简单来说,它们只是另一种形式的自动化,在概念上和传送带没什么不同。同样的,机器学习确实能让我们解决许多现在电脑搞不定的问题,不过这些问题肯定都需要不同的实现方式和不同的数据,甚至是不同的市场策略和开发公司,而这其中的每一环都是自动化的一块拼图,它们是一个个能执行不同任务的洗涤设备。

因此,在谈论机器学习时我们肯定会遭遇“拦路虎”,即我们要在数学的机械论解释和对人工智能的幻想中找到中间立场。

让我们回到与关系数据库的类比话题,现在我们确实能信心满满的说,这项技术能解决大量问题,但你并不知道是哪些具体问题。你能用机器学习进行令人印象深刻的语音和图像识别展示,但普通公司用它来干什么呢?就像一家美国媒体公司说的:“有了机器学习,我们确实能一次给十年的访谈节目做索引,但我们要在索引里找什么呢?”

那么什么才是有真正用途的机器学习洗涤机呢?要解答这个问题,我认为需要用到两种工具。第一种是按照数据类型和问题类型的队列进行思考。

1. 机器学习确实能在你所拥有的数据中快速找到问题答案,你甚至可以将它看做一种分析或优化技术。

1234阅读全文

相关游戏

最新合集

相关文章

网友评论

    加载更多
    回复 [1楼 ]取消回复