机器学习,一篇就够了
机器学习一篇就够了再说最后一个说说心态。学习最大的敌人不是数学不是编程是焦虑。看到别人会了这个不会那个就着急。着急就容易放弃。建议跟自己比不跟别人比。我写博客这几年看到新手踩最多的坑就是总想先把所有理论搞懂了再动手。后来发现这条路走不通。理论是学不完的。正确的顺序是反过来先动手遇到问题再回头学理论。这样学的理论才记得住因为你知道它用在哪儿。我学机器学习的时候比大多数人都菜。基本概念都搞不清楚。但几个月后从完全不懂到能做项目。现在把这些写成文章让更多人少走弯路。机器学习最常见的三种类型监督学习——给数据配好标签让模型学会预测。比如垃圾邮件分类。无监督学习——不给标签让模型自己找规律。比如客户分群。强化学习——做对了奖励做错了惩罚。比如 AlphaGo 下围棋。你不需要马上理解它们的数学原理但得知道它们分别解决什么问题。第三个月查漏补缺。做项目发现哪些没搞懂回头去补。这个时候学理论感觉完全不一样。因为知道它用在哪儿所以记得特别牢。行了就写到这儿。该说的都说了不该说的也说了。有问题评论区见。我常跟读者说一句话别怕犯错。我当年学编程的时候一个 bug 能搞我三天。三天就为了一个分号的位置。但每次修好 bug那种成就感也是真的爽。学习就是这样痛苦和快乐是绑在一起的。没有前面的痛苦就没有后面的快乐。这道理放哪都一样。说实话每次写这种文章我都得查好多资料。不是我不懂是想用最准确的话讲出来。我试了至少五六种方法这个最好用。第一个月打基础。看了一门系统课每天两小时周末做练习。不求快只求理解。基础不牢后面全崩。补充一句上面说的是一般情况特殊情况另说。我的学习路径分三个阶段。不信你试试就知道了。说白了机器学习就是让计算机从数据里找规律而不是被人告诉具体的规则。你给计算机看十万张猫的照片告诉它这是猫它自己就能学会认猫。不需要你写规则说猫有尖耳朵、有尾巴、有四条腿。当然如果你非要写规则也行但你得把全世界所有猫的特征都写出来这显然不现实。我公众号上有个读者叫阿杰深圳的。他私信我说看了我讲机器学习的文章从完全不懂到现在能用 scikit-learn 做简单的分类模型。他说他花了大概四百块钱买了两本书再加上我那些免费文章就搞定了。我当时看了挺感动的。因为我当年也是这么过来的——没什么钱买课程全靠免费资源硬啃。抱歉跑题了刚才那个话题后面有机会再聊。这个坑我踩过血的教训。就像教小朋友认动物。你不是背规则给他听是给他看很多图片告诉他哪个是猫哪个是狗。看多了他自己就学会了。机器学习差不多就是这个原理。只不过它看的不是几百张是几十万张。而且它不会累可以一天看一百万张。这是人类比不了的。第二个月做项目。找了几个入门项目照着教程做。第一个跟了三天才跑通第二个一天就跑通了。到第三个已经能自己调参了。这就是正反馈的力量。