本文总结2023年最适合的机器学习/人工智能学习路线及其资源,全文干货建议先点赞、收藏、关注三连后慢慢食用。

在讨论学习路线图之前,需要先了解机器学习及人工智能所需要的知识体系及能力,如果想要从事深度学习必须具备一下几个技能:
- 数学基础技能
- 编程技能
- 数据工程能力
- 机器学习基础算法
- 深度学习算法
- 开发框架及练手项目
数学基础技能
深度学习的第一步或技能是 数学技能。它可以帮助您了解深度学习和机器学习算法的工作原理。当你尝试着去理解一个像机器学习(ML)一样的交叉学科的时候,主要问题是理解这些技术所需要的数学知识的量以及必要的水平。这个问题的答案是多维的,也会因个人的水平和兴趣而不同。
当然并不是要求每个人都必须在理解全部数据知识之后才能着手进行机器学习、人工智能的工作,但是从业者一定要对数学知识有所了解,以便遇到实际数学问题可以从问题切入下手,以下数学知识应该有所了解:
- 线性代数
- 概率与统计
- 微积分
- 凸优化

线性代数
线性代数是 21 世纪的数学。在机器学习领域,线性代数无处不在。主成分分析(PCA)、奇异值分解(SVD)、矩阵的特征分解、LU 分解、QR 分解、对称矩阵、正交化和正交归一化、矩阵运算、投影、特征值和特征向量、向量空间和范数(Norms),这些都是理解机器学习中所使用的优化方法所需要的。
- 麻省理工公开课:线性代数
- 由 MIT Courseware 提供的线性代数课程(Gilbert Strang 教授的讲授的课程),备受广大学生的喜欢,精品中的精品,首推、强推。
- 线性代数的本质 – 01 – 向量究竟是什么?
- 3Blue1Brown出品的这个线性代数的本质系列视频就是开胃菜,总共14个小视频,视频控制在9-18分钟之间,很适合短时间快速温习
- 可汗学院公开课:线性代数
- 交互式线性代数学习
概率论与统计学
机器学习需要的一些概率和统计理论分别是:组合、概率规则和公理、贝叶斯定理、随机变量、方差和期望、条件和联合分布、标准分布(伯努利、二项式、多项式、均匀和高斯)、 矩母函数 (Moment Generating Functions)、最大似然估计(MLE)、先验和后验、最大后验估计(MAP)和抽样方法。
- Introduction to Statistics: Descriptive Statistics
- Probabilistic Systems Analysis and Applied Probability
微积分
当确立好一个算法模型之后,问题的最终求解往往都会涉及到优化问题。在探寻数据空间极值的过程中,如果没有微分理论和计算方法作为支撑,任何漂亮的模型都无法落地。当然如果不具备基础的微积分知识,在理解机器学习算法的优化上同样困难,
因此,夯实多元微分的基本概念,掌握最优化的实现方法,是通向最终解决方案的必经之路。
- Essence of calculus: 以动画的方式让你理解微积分,非常适合入门
凸优化
机器学习中广泛使用的凸优化方法主要分为梯度下降法和拟牛顿法,学习凸优化在机器学习中具有重要的地位,能够帮助我们更有效地训练模型、提高模型的性能,并且提供了坚实的数学基础和工具,用于解决各种优化问题
- 凸优化
- 最优化方法1: 介绍 (2022重录)哔哩哔哩bilibili
编程技能
Python 是迄今为止最流行、最好的机器学习语言,超过 60% 的机器学习开发人员使用并优先使用它进行开发。 Python 如此有吸引力有几个关键方面。 一方面,它很容易学习,这对于那些想要开始机器学习的人来说至关重要。 它还具有可扩展性和开源性。入门机器学习需要学习一门编程语言,这门编程语言主推python,如果有编程学习经验的同学可以自行学习,这里仅简单推荐几门课程。
- Python 编程简介
- Python 教程
- Python 3 教程
- Python 数据科学
特征工程能力
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程很少在机器学习相关的书中阐述,包括很多网络课程当中,这个需要很多实际经验才能得出处理数据的知识。这里推荐几本特征工程的图书,可以自行阅读
- Bad Data Handbook: Cleaning Up The Data So You Can Get Back to Work,这本书是 19 位机器学习从业者的论文与资料集,汇总了关于数据准备和管理的实用知识与技巧。
- Data Wrangling with Python: Tips and Tools to Make Your Life Easier,这本书的重点是帮助我们将原始数据转化为适用于建模的数据形式的工具和方法。
- A Short Guide for Feature Engineering and Feature Selection(撰写的特征工程和选择:预测模型的实用方法)。这本书描述了为建模准备原始数据作为特征工程的一般过程。
- Feature Engineering for Machine Learning(机器学习中的特征工程)。
机器学习基础算法
按照机器学习算法分类可以将机器学习划分为:
- 监督学习
- 非监督学习
- 半监督学习
监督学习
监督学习是指在给定的训练集中“学习”出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出,即特征值和目标值(标签),训练集中数据的目标值(标签)是由人工事先进行标注的,下面给出监督学习算法的发展时间线。

非监督学习
非监督学习是指在机器学习过程中,用来训练机器的数据是没有标签的,机器只能依靠自己不断探索,对知识进行归纳和总结,尝试发现数据中的内在规律和特征,从而对训练数据打标签。常见的非监督学习算法主要有三种:聚类、降维和关联。
算法名称 |
K-means |
Birch |
Dbscan |
Sting |
主成分分析(PCA) |
线性判别分析(LDA) |
局部线性嵌入(LLE) |
拉普拉斯映射(LE) |
半监督学习
从不同的学习场景看,半监督学习算法可分为 4 大类:半监督分类、半监督回归、半监督聚类和半监督降维,如图6所示。
半监督分类算法的基本思想是在无标签样本的帮助下训练有标签样本,获得比单独使用有标签样本更好的分类器,弥补有标签样本不足的缺陷。
半监督回归算法的基本思想是在无输出的输入的帮助下训练有输出的输入,获得比只使用有输出的输入训练得到的回归器性能更好的回归器。
半监督聚类算法的基本思想是在有标签的样本信息的帮助下,获得比只使用无标签的样本更好的簇,提高聚类的精度。

为了更友好帮助新手学习机器学习算法,主要课程时是基于Machine Learning (Coursera, Andrew Ng) 的课程内容。
- 目录结构:绪论线性回归逻辑回归神经网络打造实用的机器学习系统支持向量机 SVM聚类算法数据降维异常检测推荐系统大规模机器学习应用案例照片文字识别总结
也可以根据一些经典的课程项目进行练手,比如100天机器学习算法,还有一些经典课程推荐给大家:
- YouTube 上的机器学习斯坦福大学完整课程,作者:Andrew
- CS480/680 机器学习简介 - 2019 年春季 - 滑铁卢大学
- SYDE 522 – 机器智能(2018 年冬季,滑铁卢大学)
- 机器学习简介课程 - Udacity
- Hesham Asem - 阿拉伯语内容
- IBM ML with Python
- 从头开始机器学习 - YouTube(Python 工程师)
- 机器学习算法的实践
- 机器学习科学家
- 林轩田机器学习 强推!!
11.初学者机器学习 - 课程 超级清楚的入门级课程
深度学习
深度学习基础知识
- 深度学习基础知识
- 深度学习简介 - 麻省理工学院
- 深入研究深度学习(英文) | (Ar) 版本➡️第 1 部分和第 2 部分
- 深度学习加州大学伯克利分校
- 深入 DL 的 github
- 斯坦福讲座 - 用于视觉识别的卷积神经网络
- 滑铁卢大学 - ML / DL
如果想要实战深度学习建议参考这本书 https://zh.d2l.ai/, ⾯向希望了解深度学习,特别是对实际使⽤深度学习感兴趣的⼤学⽣、⼯程师和研究⼈员。
深度学习论文
如果你是深度学习领域的新手,你可能会遇到的第一个问题是“我应该从哪篇论文开始阅读?”下面是一个深入学习论文的阅读路线图!
这份深度学习论文阅读路线分为三大块:
- Deep Learning History and Basics
- Deep Learning Method
- Applications
开发框架及项目练手
开发框架
PyTorch:

PyTorch中文官方文档:https://pytorch-cn.readthedocs.io/zh/latest/。阅读上述英文文档比较困难的同学也不要紧,我们为大家准备了比较官方的PyTorch中文文档,文档非常详细的介绍了各个函数,可作为一份PyTorch的速查宝典。
这是一个比较偏算法实战的PyTorch代码教程,在github上有很高的star,https://github.com/yunjey/pytorch-tutorial。建议大家在阅读本文档之前,先学习上述两个PyTorch基础教程。
首推的是B站中近期点击率非常高的一个PyTorch视频教程:https://www.bilibili.com/video/av31914351/,虽然视频内容只有八集,但讲的深入浅出,十分精彩。只是没有中文字幕,小伙伴们是该练习一下英文了...
- PyTorch(加州大学伯克利分校 - Youtube)- Lec3(5 个部分)
- PyTorch - 数据科学博士 - Youtube
- Pytorch 教程 - Aladdin - Youtube
- PyTorch 课程 (2022) - Youtube
- 使用 Pytorch 进行深度学习
- 使用 PyTorch 和 Scikit-Learn 进行机器学习 -2022
TensorFlow:
- TensorFlow-Course:GitHub 13300+ Star

- TensorFlow-Tutorials GitHub 7600+ Star
这是 YouTube 视频的 TensorFlow 教程,非常生动有趣。有视频讲解,文字教程,还有代码供你学习和练习。

- tensorflow_cookbook:GitHub 5200 + Star这是一本 TensorFlow 英文书的代码,你在网上可以搜到这本书来看看,也可以在这直接使用这些代码进行学习。一共十一章,讲解十分详细

- tensorflow2_tutorials_chinese:GitHub 2900+ Star
中文课程,详解讲解了tensorflow的使用教程。

项目:
- Deena Gergis - 端到端项目
- 机器学习项目 - Youtube
- 适合初学者的十大数据科学项目
- 适合初学者和专家的 12 个数据科学项目
- 数据科学项目和想法
- 2023 年 310 多个顶级机器学习项目
- 10 个端到端指导数据科学项目
- 使用 Scikit Learn 的真实世界 ML 教程
- 使用 Docker、Github 操作和部署的端到端 ML 项目
- 数据科学中的 Python 代码
- 12个免费的数据科学项目来练习Python和Pandas(在线解析互动)
评论留言