2025年06月03日
前两篇文章分别介绍了卷积层和池化层,卷积和池化是卷积神经网络必备的两大基础。本文我们将介绍一个早期用来识别手写数字图像的卷积神经网络:LeNet[1]。LeNet名字来源于论文的第一作者Yann LeCun。1989年,LeNet使用卷积神经网络和梯度下降法,使得手写数字识别达到当时领先水平。这个奠基性的工作第一次将卷积神经网络推上历史舞台,为世人所知。由于LeNet的出色表现,在很多ATM取款机上,LeNet被用来识别数字字符。
本文基于PyTorch和TensorFlow 2的代码已经放在了我的GitHub上:
2025年06月03日
在众多深度学习框架中,比如PyTorch、TensorFlow、MNN、Caffie等,PyTorch比较吃硬件性能,尤其在GPU显卡这块区分度非常大。
2025年06月03日
图卷积神经网络(Graph Convolutional Networks,简称GCN)是一种专门用于处理图数据的神经网络架构。它适用于各种基于图结构的数据分析和机器学习任务,如节点分类、图分类、链接预测等。GCN的核心思想是通过在图结构上进行卷积操作来学习节点的有效表示(embedding)。
2025年06月03日
MeshCNN引入了网格池化操作,使我们能够将cnn应用到三维模型中。
将机器学习应用于3D数据并不像应用于图像那样简单。3D数据有很多表示形式,但选择决定了您可以使用哪种学习策略。在本文中,我将介绍一个特别有趣的策略(至少对我来说是),叫做MeshCNN:一个有优势的网络。本文描述了一个用于处理3D模型的分类和分割任务的通用框架。也许它最有趣的特性是它的网格池化(mesh pooling)操作,它使我们能够在多个尺度上组合一个网格的特征(类似于视觉CNN)。这是一种学习操作,它逐渐将模型缩减到对给定任务提供最多信息的边缘。MeshCNN 结合了每个流行 3D 表示的许多最佳属性。 然而,在我们详细介绍之前,让我们通过对 3D 表示的简要回顾来了解这些属性是什么。
2025年06月03日
在本文中将介绍如何查找相似图像的理论基础并且使用一个用于查找商标的系统为例介绍相关的技术实现,本文提供有关在图像检索任务中使用的推荐方法的背景信息。 阅读本文后你将有能够从头开始创建类似图像的搜索引擎的能力。
图像检索(又名基于内容的图像检索Content-Based Image Retrieval 或 CBIR)是任何涉及图像的搜索的基础。
上图来自文章Recent Advance in Content-based Image Retrieval: A Literature Survey (2017) arxiv:1706.06064
2025年06月03日
近年来,基于深度学习的研究在材料领域不断发展,在材料的微观组织分析、加工制备设计、表面粗糙度预测以及缺陷检测等方面均取得了重要的研究成果。一方面,深度学习网络可以用于零件材料表面粗糙度的预测领域,从而实现表面粗糙度的准确预测。另一方面,利用卷积神经网络也可以进行材料行为和加工制备的方法设计。此外,深度学习在材料缺陷检测领域取得了飞速发展,在缺陷的分类、定位等方面均取得了一定的成果。特别是随着航空航天、汽车等相关领域迅猛发展,铸件的需求也在不断增长,其品质直接影响到生产生活的各个方面。在实际生产过程中,受不同制造工艺的限制,不可避免地产生大量具有缺陷的铸件。因此,提高缺陷检测的精度,降低工件缺陷率十分重要。目前,国内的汽车轮毂厂商大多采用人工评定铸件的品质。通过分析铸件X射线图像中的不同像素特征,对气孔、裂纹、噪声等缺陷进行分析。传统X射线图像的轮毂缺陷检测方法存在人工识别不稳定、误检率高、检测精度较低等问题。随着工业缺陷检测技术的不断进步,目前基于传统机器视觉和深度学习的检测法已经得到了广泛应用,提高了铸件缺陷的识别精度,大幅节省了检测成本。