老早就想写下这一篇文章了,对我来说这个意义很大。
以下是我开始真正学习机器学习的入门经历,在这个过程中我感到异常的轻松(在仅仅是了解学习机器学习知识的过程中),为何说是“真正的”开始学习呢?因为之前有过接触但是进度很慢…我相信有许多的人在选择如何入门的时候肯定也有这样的麻烦。废话不多说,开始说说如何以我的方法尽快入门吧。希望以此来帮助需要的人。
- 入门:看书,看视频,记笔记,回顾思考。
无非就是这样的套路。顺序不重要,但是在此间交叉切换的过程却很重要。你不可能在入门的过程中一直的保持看书或者是看视频,so,我的意思已经明了,明者自明,哈哈,但是学会记笔记的却是最重要的,这点我有亲身体验,相信你也是。
以kaggle为起点
我开始学习机器学习是因为我想着入数据挖掘的坑,我对kaggle早已有过了解,我在掌握一点点的机器学习概念(没错,仅仅是概念)之后就奋不顾身的投入到了kaggle的一个入门级比赛当中去了。补充一下,在这之前我是有写过数据分析的一些小程序的…
这个实践的入门级比赛即是:Exploring Survival on the Titanic,经典的泰坦尼克号预测入门级比赛。
现在需要的即是查找一些文章来参考模仿并且投入实践,一切学习都是从模仿开始的,静下心来,一步步实践,遇到问题利用好搜索引擎。有相关的错误出现一般可以将错误信息复制粘贴到搜索引擎上,一般都会有答案出现(一般都是英语答案)。不要畏惧英语。
具体哪些文章可参考:
2,python实现:https://zhuanlan.zhihu.com/p/33733586
3,python实现:http://www.jasongj.com/ml/classification/
文章是参考不完的,但是还有一个重要的推荐,那就是kaggle本身的资源利用,即在每一个比赛都有Kernel资源分享,那是做过的前辈分享的经验,务必利用好。
在这个过程中,你可能想放弃,因为你什么都不懂..但是,你也要坚持下去,至少把流程是怎么一回事搞清楚。期间你可能会遇到编码问题,还有一些意外的错误问题,还是一句话,利用好搜索引擎。
工具选择
Anaconda其中内嵌的notebook
非常不错,看起来很舒服,但是也有一些缺点,基本上可以忽略。notebook写python写R都是可以的,具体我有写过一篇文章介绍。另外,出现的错误我也有相关的记录,自行根据需求查找。一句话说得好,一切发明都是根据需求产生的。
入门,机器学习理论
视频
视频的话看这个基本上差不多做个了解,网易云课堂也可查到相关的视频。上面的链接里面有作者的笔记记录,可以看视频再来看一遍对应的笔记加深印象。记得做笔记。
笔记
以上链接为为上面说的笔记目录,再结合视频看是一个不错的选择,里面记录有每一节的核心内容,总结的不错。
书籍
暂时记得这么多,届时补充。视频书籍交叉看最好,记得做笔记。现在的首要任务是搞清楚概念理论以及出现了一系列问题该如何使用选择。
项目实践
自己找一些项目做做练手。最好是根据自身的需求,明者自明,话不多说。
最后
暂时说这么多吧,以后看时间看需要再进行补充。这是一篇简易的机器学习入门指南。
补充:这个指南可能不适合你,因为我确确实实是有过一点点准备才开始的这个计划流程…
以上。共勉。