大家都知道,大模型能处理人类的需求,但作为大模型“大脑”的神经网络,其背后的运行原理是什么?
下文给出大家都能理解的通俗易懂的讲解和例子,希望能帮助到您理解(大家都可以理解,不会有复杂的专业名词术语)。
简单的例子:神经网络如何识别手写数字?
假设有一个班级(神经网络),如何让学生们识别出一张手写数字呢?
数据准备:像“整理作业本”
首先需要一本“练习册”;
这本“练习册”里有成千上万张,现实中人类的“手写数字”的图片;
每张图都是28×28像素的“小格子”,就像把字写在田字格里。
扫描仪(输入层)
图片里,每格的颜色深浅,对应0-255之间的灰度值:颜色越黑,越接近255;
例如:0是白色,128是灰、210是深灰、255是黑色。
把28×28像素格子的图片,展开成784个格子数字(28乘以28),每个格子一个值,像把纸上的字扫描进电脑。
找特征的“学生”(卷积层)
每个“学生”拿着放大镜(卷积核),专门观察局部特征。
例如:
- 一个“学生”找到了“竖线”;
- 另一个“学生”找到了“圆圈”等等;
每个“学生”把自己发现“特征”,考虑传递给下一层的神经网络。
注:每个卷积核大小可设置,例如每次扫描3乘3个格子;
简化报告的学习委员(池化层)
学生们发现了多个局部特征:
- 右边有斜线(可能是‘7’)
- 中间有环形(可能是‘0’或‘6’)
- 底部有未闭合的圆(可能是‘9’)
但这些特征可能重复也可能互相矛盾。需要进一步筛选关键信息;
保留关键的特征(比如中间的环形、底部的尖角等),忽略次要细节。”
例如:学习委员对每个“局部特征”,用“取局部最大值”(最大池化)或“取平均值”(平均池化),提取最显著的特征,减少冗余信息。
综合判断的"班长"(全连接层)
“班长”把所有的报告汇总,分析哪些特征组合起来像某个数字。例如:
同时上面是“一条线”和“下面是一条斜线”→可能是数字7;
只有“一个竖线”→可能是数字1。
出结果(输出层)
最后给出识别出数字的概率,比如“97%是9,3%是其他”。
训练(老师纠错和调整)
如果最终结果错了(比如实际是‘0’),老师指出错误(调整参数权重层级等),并让学生们重新分析:
‘为什么忽略了中间环形的闭合?’
‘下次调整你们的‘放大镜’(卷积核参数)、更关注环形的闭合性等等’
通过不断纠正,模型逐渐学会更准确地识别数字。”
小结
手写数字识别通过分析图片中,每个格子像素的亮度(0-255)和局部特征(卷积核)完成的。
神经网络:学生们协作,分工合作并不断学习改进。
数据集:是“训练材料”,帮助模型训练及积累经验。
注意:为便于理解,上述是用简单通俗的方式说明基本的神经网络结构,主要以3维的方式讲解和类比;
并刻意忽略了一些细节(例如模型真实的训练细节,拟合度、神经元激活函数等等),避免陷入名词、代码堆砌;
先知晓全貌,再专注细节。
举一反三:人脸识别
举个人脸识别的例子:
和手写识别类似,也是经过提取特征、池化、全连接层等(这里统称为隐藏层),识别出这张脸是“谁”的概率。
第一层神经元:发现人脸的"边边角角";
第二层神经元:把边角拼成,"眉毛"、"眼睛"、“嘴唇”等图案;
第三层神经元:识别出人脸的特征;
每一层都在处理更复杂的信息,就像人脑从简单到复杂理解事物。
上面说法只是为了便于理解,所以只用三层进行说明(真实的神经网络通常拥有很多层);
疑问
大家可能好奇,本文只是列举了识别图像在神经元中的处理方式,并没有列举处理文字在大模型神经网络的示例,为什么?
因为,本文只是带大家首先领略神经网络基础结构的全貌;
但文字处理,在上述神经网络中发挥真正好的效果,还需结合大名鼎鼎的“Transformer”,将在下一篇文章中和大家探讨。
无论出现什么方案及名词,更多的是为了神经网络处理的更快更好,大模型神经网络的本质和思路不会发生根本的变化;
我们应该从认识基础的神经网络思想出发,一步步深入浅出。
个人观点
SoftmaxRNNCNN前/反向传播残差网络激活函数、拟合度、梯度下降- 等等
这些专业术语,之所以还未出现文章中,是因为文章目标,首先是用通易懂的语言,让大家能看得懂;
每条评论都会看,根据各位朋友的评论和疑问,会带着评论里的问题,在后续的文章中陆续做出讲解;
深入浅出、通俗易懂的和大家探讨人工智能大模型是如何一步步迭代、进化为现在的样子;
有一些专业的朋友评论中会带上专业名词和术语;
但个人的目的不是为了“拽”名词,不会堆砌晦涩的名词术语,将普通人拒之门外。
其实,很多事物都是从最简单的原理出发,一步步发展而来的;
个人观点:技术从来都不应该高高在上的,而应该让普通人也能看的懂,知其然,知其所以然;
写在最后
之前发布的文章,有不少朋友都比较感兴趣;
基于相关领域研发及知识积累,通过大白话形式,做到不堆砌晦涩难懂的技术名词和术语,通俗易懂的分享这些技术的原理以及个人心得理解;
计划出一个系列,在这个”人工智能时代“,让您对整个人工智能基础原理做到心中有数,面对这些场景也不用犯怵:
一,回答孩子的提问:‘AI为什么能听懂人说话’,别只会说“它很聪明”!
二,避开一些商家吹嘘所谓‘人工智能’,判断那些‘智能学习机’是不是“智商税”;
三,被老板催着用AI?做到心中有逻辑;
四,DeepSeek为什么能异军突起,背后的原理是什么?
等等...