醋醋百科网

Good Luck To You!

爱可可AI论文推介(2020.11.4)

LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人

(*表示值得重点关注)


1、[LG] *Combining Label Propagation and Simple Models Out-performs Graph Neural Networks

OpenAI解析「AI算力」:3个半月翻一倍,6年超过30万倍

原文来源:OpenAI

「雷克世界」编译:嗯~是阿童木呀、KABUDA、EVA

导语:近日,OpenAI发布了一份分析报告显示,自2012年以来,在最大规模的人工智能训练中所使用的计算量呈指数级增长,3.5个月的时间翻一倍(相比之下,摩尔定律(Moore’s Law)有18个月的倍增周期)。自2012年以来,该指标增长了30多万倍(18个月的倍增周期只会增加12倍)。

计算方面的改进一直是人工智能发展的一个关键组成部分,因此只要这种趋势继续下去,就值得为远超出当今能力的系统所带来的影响做准备。

清华&旷视:让VGG再次伟大

丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI

【博士论文】深度卷积神经网络架构设计及优化问题研究

来源:专知本文为论文介绍,建议阅读5分钟近年来,深度卷积神经网络在计算机视觉领域取得了革命性的进展,并被广泛地应用到图像分类、物体检测、实例分割等经典的计算机视觉问题当中。


CVPR满分论文:2080Ti搞定数据蒸馏,来自上交大最年轻博导课题组

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

只要一块6年前的2080Ti,就能做大模型数据蒸馏?

中医AI论文正在“疯狂收割”EI指标!你的方向选对了吗?


全球顶刊《Nature》子刊已下场:

“AI+中医诊断”成2025年最高引用潜力领域!

● 算法方向:脉象信号处理、舌苔图像分割、证型分类模型;

● 硬核数据:至少需包含800例标注样本+交叉验证结果;

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

豆包大模型团队 投稿

量子位 | 公众号 QbitAI

字节

给我1张图,生成30秒视频!|DeepMind新作

编辑:Joey 桃子

【新智元导读】近日,DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架——Transframer。

视频编解码学习之二:编解码框架

\1. 压缩码流

  • 语法:码流中各个元素的位置关系

UT-Austin提出新型端到端深度学习编解码器,用图像插值压缩视频

图源:unsplash

原文来源:arXiv

作者:Chao-Yuan Wu、Nayan Singhal、Philipp Kr"ahenbühl

「雷克世界」编译:嗯~是阿童木呀、KABUDA、EVA

我们的数字通信、媒介消费和内容创作越来越多地围绕着视频展开。我们通过这些视频分享、观察和存档我们生活的许多方面,而所有这些都是由强大的视频压缩驱动的。传统的视频压缩是通过费力的手工设计和手工优化进行的。本文提出了一种端到端深度学习编解码器的可选方案。我们的编解码器建立在一个简单的想法上:视频压缩是重复的图像插值。因此,它得益于在深度图像插值和生成方面的最新研究进展。我们的深度视频编解码器性能优于当今流行的编解码器,比如H.261、MPEG-4 Part 2,并且与H.264的性能相媲美。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言