醋醋百科网

Good Luck To You!

清华&旷视:让VGG再次伟大

丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI

【博士论文】深度卷积神经网络架构设计及优化问题研究

来源:专知本文为论文介绍,建议阅读5分钟近年来,深度卷积神经网络在计算机视觉领域取得了革命性的进展,并被广泛地应用到图像分类、物体检测、实例分割等经典的计算机视觉问题当中。


CVPR满分论文:2080Ti搞定数据蒸馏,来自上交大最年轻博导课题组

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

只要一块6年前的2080Ti,就能做大模型数据蒸馏?

中医AI论文正在“疯狂收割”EI指标!你的方向选对了吗?


全球顶刊《Nature》子刊已下场:

“AI+中医诊断”成2025年最高引用潜力领域!

● 算法方向:脉象信号处理、舌苔图像分割、证型分类模型;

● 硬核数据:至少需包含800例标注样本+交叉验证结果;

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

豆包大模型团队 投稿

量子位 | 公众号 QbitAI

字节

给我1张图,生成30秒视频!|DeepMind新作

编辑:Joey 桃子

【新智元导读】近日,DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架——Transframer。

视频编解码学习之二:编解码框架

\1. 压缩码流

  • 语法:码流中各个元素的位置关系

UT-Austin提出新型端到端深度学习编解码器,用图像插值压缩视频

图源:unsplash

原文来源:arXiv

作者:Chao-Yuan Wu、Nayan Singhal、Philipp Kr"ahenbühl

「雷克世界」编译:嗯~是阿童木呀、KABUDA、EVA

我们的数字通信、媒介消费和内容创作越来越多地围绕着视频展开。我们通过这些视频分享、观察和存档我们生活的许多方面,而所有这些都是由强大的视频压缩驱动的。传统的视频压缩是通过费力的手工设计和手工优化进行的。本文提出了一种端到端深度学习编解码器的可选方案。我们的编解码器建立在一个简单的想法上:视频压缩是重复的图像插值。因此,它得益于在深度图像插值和生成方面的最新研究进展。我们的深度视频编解码器性能优于当今流行的编解码器,比如H.261、MPEG-4 Part 2,并且与H.264的性能相媲美。

太原科技大学:基于图像处理的泡沫金属孔结构分析

【研究背景】

自回归模型 - PixelCNN

介绍

生成模型是近年来受到广泛关注的无监督学习中的一类重要模型。可以将它们定义为一类模型,其目标是学习如何生成与训练数据来自同一数据集的新样本。在训练阶段,生成模型试图解决密度估计的核心任务。 在密度估计中,我们的模型学习构建一个估计——pmodel(x)——尽可能类似于不可观察的概率密度函数——pdata(x)。需要说明的是,生成模型应该能够从分布中生成新样本,而不仅仅是复制和粘贴现有样本。 一旦我们成功地训练了我们的模型,它就可以用于各种各样的应用,从各种形式的重建,如图像填充、着色和超分辨率到生成艺术品。

<< < 87 88 89 90 91 92 93 94 95 96 > >>
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言