|
crybld
| 未知
这么来比喻吧,如果把大数据比作燃料,那么人工智能就是燃油机了。
不同功率的燃油机的发力不同,好的算法就是大功率的燃油机,有更快的速度和机动性。而做数据的人肯定知道,如果(大)数据足够纯粹,冗余少,那么这个数据分析起来解释性强且具有说服力。
在大数据领域和人工智能领域中,其实是互相交错的,很难说互不涉及,特别是现在这个动不动就“大”数据的时代,数据量大和AI已经成为标配,所以说转行还不如进一步学习人工智能部分知识。
至于如何学习人工智能,我这里有一份可供参考的指南。如果你想把机器学习更灵活的应用于日常工作,学习一些基础理论还是很有好处的,而且你并不需要完全弄懂。下面有几个学习机器学习理论的理由。
(1)规划和数据采集
数据采集真是一个昂贵和耗时的过程!那么我需要采集哪些类型的数据?根据模型的不同,我需要多少数据?这个挑战是否可行?
(2)数据假设和预处理
不同的算法对数据输入有不同的假设,那我应该如何预处理我的数据?我应该正则化吗?假如我的模型缺少一些数据,它还稳定吗?离群值如何处理?
(3)解释模型结果
简单的认为机器学习是一个“黑盒子”的概念是错误的。是的,并不是所有的结果都直接可以解释,但你需要诊断自己的模型然后改善它们。我要如何评估模型是过拟合还是欠拟合?我要向业务利益相关者如何解释这些结果?以及模型还有多少的改善空间?
(4)改进和调整模型
你的第一次训练很少会达到最佳模式,你需要了解不同的调参和正则化方法的细微差别。如果我的模型是过拟合了,我该如何补救?我应该花更多时间在特征工程上,还是数据采集上?我可以组合我的模型吗?
(5)驱动商业价值
机器学习从来不会在真空中完成。如果你不了解武器库中的工具,就无法最大化发挥它们的效能。在这么多结果指标中,哪些是优化的参考指标?哪个更为重要?或者还有其他的算法会表现更好吗?
带着这些问题,参考以下教材,你就可以很轻松地入门人工智能。
《深度学习》
http://download.csdn.net/download/zx2fzx2f/10024228
《机器学习》(周志华 著)
http://download.csdn.net/download/cser04/400323
《Spark机器学习》
http://download.csdn.net/download/yang198907/9838919
如果你对学习人工智能和深度学习感兴趣,可以订阅我的头条号,我会在这里发布所有与算法、机器学习以及深度学习有关的有趣文章。 |
|