2025年04月10日

科研生活365天，深度学习中的过拟合解析，常见解决方案大盘点

一、过拟合

过拟合的定义：由于模型过于复杂，模型学习能力过强，而用于训练的数据相对于复杂模型来说比较简单，因此模型会去学习数据中隐含的噪声，导致模型学习不到数据集的真正分布。

2025年04月10日

2021年，来自杭州医学院附属浙江省人民医院儿科的Wen-Lan Wang , Xiao-Ming Luo , Qin Zhang , Hai-Qiao Zhu , Guo-Qing Chen , Qin Zhou （通讯作者，音译周琴）在Autoimmunity 期刊发表了一篇论文，题目为：The lncRNA PVT1/miR-590-5p/FSTL1 axis modulates the proliferation and migration of airway smooth muscle cells in asthma。

2025年04月10日

从头开始绘制和编码18种RL算法(3/4)

接上文继续.......

DDPG（Actor-Critic for Continuous Actions）

2025年04月10日

图像回归:用照片预测年龄

在图像分类任务中，卷积神经网络 (CNN) 是非常强大的神经网络架构。然而，鲜为人知的是，它们同样能够执行图像回归任务。

2025年04月10日

近端策略优化(PPO)算法的理论基础与PyTorch代码详解

近端策略优化(Proximal Policy Optimization, PPO)算法作为一种高效的策略优化方法，在深度强化学习领域获得了广泛应用。特别是在大语言模型(LLM)的人类反馈强化学习(RLHF)过程中，PPO扮演着核心角色。本文将深入探讨PPO的基本原理和实现细节。

PPO属于在线策略梯度方法的范畴。其基础形式可以用带有优势函数的策略梯度表达式来描述：

策略梯度的基础表达式（包含优势函数）。

这个表达式实际上构成了优势演员-评论家(Advantage Actor-Critic)方法的基础目标函数。PPO算法可以视为对该方法的一种改进和优化。

2025年04月10日

GID:旷视提出全方位的检测模型知识蒸馏 | CVPR 2021

论文提出的GID框架能够自动选择可辨别目标用于知识蒸馏，而且综合了feature-based、relation-based和response-based知识，全方位蒸馏，适用于不同的检测框架中。从实验结果来看，效果十分不错，值得一看

醋醋百科网

Good Luck To You!

科研生活365天，深度学习中的过拟合解析，常见解决方案大盘点

一、过拟合

【机器学习】数据挖掘神器LightGBM详解(附代码)

杭州医学院附属浙江省人民医院儿科论文被质疑多处WB条带重复

从头开始绘制和编码18种RL算法(3/4)

DDPG（Actor-Critic for Continuous Actions）

图像回归:用照片预测年龄

近端策略优化(PPO)算法的理论基础与PyTorch代码详解

GID:旷视提出全方位的检测模型知识蒸馏 | CVPR 2021