开启辅助访问
 找回密码
 立即注册

「认识AI:人工智能如何赋能商业」【13】机器学习能够 ...

折碎、楓 回答数0 浏览数800
作者|Harper
审核|gongyouliu
编辑|auroral-L

本期内容给大家带来的内容是来自《认识AI,人工智能如何赋能商业》,这本书是我们数据与智能创始人刘强翻译的,欢迎大家购买阅读。
上期内容对机器学习的不同类型做了一台介绍,分别是监督学习、无监督学习以及半监督学习。本期内容我就从机器学习能够解决的不同问题这个方面给大家做介绍。

在HBO的《硅谷》节目中,其中有一台角色使用机器学习来解决现实世界中的问题。他用智能手机对面前的食物拍照,然后手机APP告诉他该食物是不是热狗。他很形象地将自个的应用程序命名为 “Not Hotdog" 。他通过给应用程序一台较小的热狗图片训练集,然后从网上获取数百万张不同的食物图片并输人应用程序来创建它。
尽管这个应用程序是为了好玩,但它仍然是典型的机器学习问题的一台很好的例子。对于这个问题,开发人员使用监督学习来 做二分类,这意味着在本例中有两个类,分别为hot dog和not hotdog。
我们可以使用有监督的机器学习来解决各种问题,但问题通常分为两类:第一,分类:在分类问题中,机器试图找出新输人属于哪一组。 分类问题进一步细分为二分类和多分类。在二分类问题中,机器只有两个类可选,比如我们刚才说的hotdog和not hotdog问题。那在多类分类问题中,机器有两个以上的类,比如一张图片是否包含汽车、建筑物、小狗等等。
第二个是回归问题:在回归问题中,机器试图根据输人的数据得出输出数据的近似值。例如,你可能有一台预测股票价格的机器学习程序。在这里,问题的答案不是一台特定的分类或类别,而是一台连续值范围内的某个值。判定分类问题和回归问题之间区别的另一种方法是,分类的输出需要一台类标签, 而回归问题的输出是一台数字近似值或概率值。
那另一方面,无监督学习,这类学习方法通常应用于聚类。在聚类问题中,机器区别出具有相似特征的数据,并将它们放到(聚)类中。所以你要把数据分开,然后根据相似性进行分组。机器决定什么东西输人,会产生什么样的输出,聚类算法经常会产生我们无法想象到的类别。
每个机器学习问题都有一台或者多个算法求解,我们已经了解到,算法是一组规则,可以以固定的步骤解决特定问题。常见的机器学习算法包括决策树、k均值聚类、回归分析与朴素贝叶斯,所有这些算法我后面都会介绍。不管要解决什么类型的问题,我们都可以使用一台或者多个这样的算法,而困难在于决定使用哪种算法。
比如说二分类问题,他只有两种可能的结果,每一台问题都有且只有两种答案,非此即彼。而我们要解决二分类问题,通常使用的是决策树或者朴素贝叶斯。
几乎所有的二分类问题都使用监督学习。提供定义这两个类的训练数据:进行模型训练,然后将测试数据输人机器,对算法模型进行验证和微调,最终的模型用于对新数据进行分类,分为两类中的某一类。但是对于多类分类问题,类的数目没有上限。那我们可以使用各种统计算法将输人映射到固定的类,对于这类问题呢,最常见的算法是kNN、朴素贝叶斯和决策树。
而使用回归分析呢,预测值是连续区间中的某个值,回归问题通常使用的也是监督学习,在回归分析中,训练的结果可能是线性回归图中的那条趋势线。为了创建这样一台图,机器在图表上绘制代表历史数据的点,然后机器经过这些接近平均值的点画一条直线,线性回归图就是机器学习到的模型,当机器获得了训练好的模型后,再给他输入额外的数据时,他会微调模型以做出更准确的预测。
本内容来源于「数据与智能」创始人刘强翻译的畅销书「认识AI:人工智能如何赋能商业」,喜欢的读者可以点击下面链接直接购买。
使用道具 举报
| 来自黑龙江
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影