醋醋百科网

Good Luck To You!

通俗解释:作为大模型“大脑”的神经网络,背后是如何运行的?

大家都知道,大模型能处理人类的需求,但作为大模型“大脑”的神经网络,其背后的运行原理是什么?

下文给出大家都能理解的通俗易懂的讲解和例子,希望能帮助到您理解(大家都可以理解,不会有复杂的专业名词术语)。


简单的例子:神经网络如何识别手写数字?

假设有一个班级(神经网络),如何让学生们识别出一张手写数字呢?

数据准备:像“整理作业本”

首先需要一本“练习册”;

这本“练习册”里有成千上万张,现实中人类的“手写数字”的图片;

每张图都是28×28像素的“小格子”,就像把字写在田字格里。


扫描仪(输入层)

图片里,每格的颜色深浅,对应0-255之间的灰度值:颜色越黑,越接近255

例如:0是白色,128是灰、210是深灰、255是黑色。

把28×28像素格子的图片,展开成784个格子数字(28乘以28),每个格子一个值,像把纸上的字扫描进电脑。

找特征的“学生”(卷积层)

每个“学生”拿着放大镜(卷积核),专门观察局部特征

例如:

  • 一个“学生”找到了“竖线”;
  • 另一个“学生”找到了“圆圈”等等;

每个“学生”把自己发现“特征”,考虑传递给下一层的神经网络。

注:每个卷积核大小可设置,例如每次扫描3乘3个格子

简化报告的学习委员(池化层)

学生们发现了多个局部特征

  • 右边有斜线(可能是‘7’)
  • 中间有环形(可能是‘0’或‘6’)
  • 底部有未闭合的圆(可能是‘9’)

但这些特征可能重复也可能互相矛盾。需要进一步筛选关键信息;

保留关键的特征(比如中间的环形、底部的尖角等),忽略次要细节。”

例如:学习委员对每个“局部特征”,用“取局部最大值”(最大池化)或“取平均值”(平均池化),提取最显著的特征,减少冗余信息。

综合判断的"班长"(全连接层)

“班长”把所有的报告汇总,分析哪些特征组合起来像某个数字。例如:

同时上面是“一条线”和“下面是一条斜线”→可能是数字7;

只有“一个竖线”→可能是数字1。

出结果(输出层)

最后给出识别出数字的概率,比如“97%是9,3%是其他”。

训练(老师纠错和调整)

如果最终结果错了(比如实际是‘0’),老师指出错误(调整参数权重层级等),并让学生们重新分析:

‘为什么忽略了中间环形的闭合?’

‘下次调整你们的‘放大镜’(卷积核参数)、更关注环形的闭合性等等’

通过不断纠正,模型逐渐学会更准确地识别数字。”

小结

手写数字识别通过分析图片中,每个格子像素的亮度(0-255)和局部特征(卷积核)完成的。

神经网络:学生们协作,分工合作并不断学习改进。

数据集:是“训练材料”,帮助模型训练及积累经验。

注意:为便于理解,上述是用简单通俗的方式说明基本的神经网络结构,主要以3维的方式讲解和类比;

并刻意忽略了一些细节(例如模型真实的训练细节,拟合度、神经元激活函数等等),避免陷入名词、代码堆砌;

先知晓全貌,再专注细节。


举一反三:人脸识别

举个人脸识别的例子:

和手写识别类似,也是经过提取特征、池化、全连接层(这里统称为隐藏层),识别出这张脸是“谁”的概率。

第一层神经元:发现人脸的"边边角角";

第二层神经元:把边角拼成,"眉毛"、"眼睛"、“嘴唇”等图案;

第三层神经元:识别出人脸的特征;

每一层都在处理更复杂的信息,就像人脑从简单到复杂理解事物。

上面说法只是为了便于理解,所以只用三层进行说明(真实的神经网络通常拥有很多层);


疑问

大家可能好奇,本文只是列举了识别图像在神经元中的处理方式,并没有列举处理文字在大模型神经网络的示例,为什么?

因为,本文只是带大家首先领略神经网络基础结构的全貌;

但文字处理,在上述神经网络中发挥真正好的效果,还需结合大名鼎鼎的“Transformer”,将在下一篇文章中和大家探讨。

无论出现什么方案及名词,更多的是为了神经网络处理的更快更好,大模型神经网络的本质和思路不会发生根本的变化;

我们应该从认识基础的神经网络思想出发,一步步深入浅出。


个人观点

  • Softmax
  • RNN
  • CNN
  • 前/反向传播
  • 残差网络
  • 激活函数、拟合度、梯度下降
  • 等等

这些专业术语,之所以还未出现文章中,是因为文章目标,首先是用通易懂的语言,让大家能看得懂;

每条评论都会看,根据各位朋友的评论和疑问,会带着评论里的问题,在后续的文章中陆续做出讲解;

深入浅出、通俗易懂的和大家探讨人工智能大模型是如何一步步迭代、进化为现在的样子;

有一些专业的朋友评论中会带上专业名词和术语;

但个人的目的不是为了“拽”名词,不会堆砌晦涩的名词术语,将普通人拒之门外。

其实,很多事物都是从最简单的原理出发,一步步发展而来的;

个人观点:技术从来都不应该高高在上的,而应该让普通人也能看的懂,知其然,知其所以然;


写在最后



之前发布的文章,有不少朋友都比较感兴趣;

基于相关领域研发及知识积累,通过大白话形式,做到不堆砌晦涩难懂的技术名词和术语,通俗易懂的分享这些技术的原理以及个人心得理解;

计划出一个系列,在这个”人工智能时代“,让您对整个人工智能基础原理做到心中有数,面对这些场景也不用犯怵:

一,回答孩子的提问:‘AI为什么能听懂人说话’,别只会说“它很聪明”!

二,避开一些商家吹嘘所谓‘人工智能’,判断那些‘智能学习机’是不是“智商税”;

三,被老板催着用AI?做到心中有逻辑;

四,DeepSeek为什么能异军突起,背后的原理是什么?

等等...


控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言