关于Kaggle
大赛就不多说了,我打算进一步了解一下入门级的比赛之后再另作参加项目/比赛的打算,在此之前需要更多的实践才行。
以下是我学习的地址(在一个GitHub
大神分享的相关的资源):
https://github.com/apachecn/kaggle
里面有多种可以实现的算法的代码以及思想,我在此进行进一步的整理,进行一个简单的代码记录,以及会进行一点修改以符合我自身的情况。
KNN实现
首先应当理解这个数字识别数据集里数值表达的意思:每个标签即代表一个数字,而一个数字的每一个像素值是不一样的(在训练数据集中可看到),KNN的作用就是在以测试集中的数值与训练集中的数值做距离计算,最终以“K”值的多少得出像素值相近的数字标签(即为最终的数字选项)。
代码实现:
|
|
SVM
因为时间有限,并且是以学习为主,与我自己写的代码也大同小异,所以我也就不再重复贴上代码了。直接贴上Github的代码链接。
随机森林
神经网络
cnn算法
各种主流机器学习算法的区别与选择
可查看周志华《机器学习》一书得出各种算法的区别。
可参考:机器学习算法优缺点 & 如何选择
……