为了给初学者快速入门机器学习/深度学习领域,先简单介绍下吧。
机器学习指的是一种从经验中学习或改进的技术,已经在多个领域广泛应用。机器学习技术的主要构成部分有数据集、模型、目标函数、训练算法等。如下式:
argmin_{\theta} loss(X,Y) s.t.Y = f(X;\theta) 其中,f表示模型,\theta为模型参数,(X,Y)为数据集,loss(X,Y)为目标函数,训练算法一般为优化算法,比如常见的随机梯度下降算法。
而深度学习是机器学习的子集,模型为多隐藏层的神经网络(如下图1)。常见的有多种深度网络结构,比如CNN,RNN,Transformer,GNN等。相比于一般的机器学习方法,深度学习的核心部分为表示学习与优化。近些年取得的很多进展很大程度上得益于深度学习模型本身强大的表示能力,比如AlphaGo、AlphaFold、ChatGPT等。
图1 简单的深度学习网络结构
机器学习方法大致可以分为监督学习、无监督学习、强化学习。当然,分类方式有很多,也有很多有趣学习方法,比如自监督学习、对抗学习、联邦学习、多任务学习、对比学习等。
常用的编程语言有Python等,也常用类似Tensorflow、Pytorch等框架编程。
除了了解常见的机器学习技术,也要多学习一些基础知识,比如微积分、线性代数、概率论、信息论等。
好了,先到这里吧,时间不够用了。后面再给大家介绍常用的Attention机制。
code/s?__biz=Mzk0NTYxODg4NQ==&mid=2247483681&idx=1&sn=d6bc38a529db05c17701ce67634f8173&chksm=c313eb8bf464629df0d662d9539b9f98c0820af2ea4a57b44db9b8a366bb66b36355432dde68#rd