LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人
(*表示值得重点关注)
1、[LG] *Combining Label Propagation and Simple Models Out-performs Graph Neural Networks
2025年05月15日
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言 AS - 音频与语音 RO - 机器人
(*表示值得重点关注)
1、[LG] *Combining Label Propagation and Simple Models Out-performs Graph Neural Networks
2025年05月15日
原文来源:OpenAI
「雷克世界」编译:嗯~是阿童木呀、KABUDA、EVA
导语:近日,OpenAI发布了一份分析报告显示,自2012年以来,在最大规模的人工智能训练中所使用的计算量呈指数级增长,3.5个月的时间翻一倍(相比之下,摩尔定律(Moore’s Law)有18个月的倍增周期)。自2012年以来,该指标增长了30多万倍(18个月的倍增周期只会增加12倍)。
计算方面的改进一直是人工智能发展的一个关键组成部分,因此只要这种趋势继续下去,就值得为远超出当今能力的系统所带来的影响做准备。
2025年05月15日
来源:专知本文为论文介绍,建议阅读5分钟近年来,深度卷积神经网络在计算机视觉领域取得了革命性的进展,并被广泛地应用到图像分类、物体检测、实例分割等经典的计算机视觉问题当中。
2025年05月15日
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
只要一块6年前的2080Ti,就能做大模型数据蒸馏?
2025年05月15日
全球顶刊《Nature》子刊已下场:
“AI+中医诊断”成2025年最高引用潜力领域!
● 算法方向:脉象信号处理、舌苔图像分割、证型分类模型;
● 硬核数据:至少需包含800例标注样本+交叉验证结果;
2025年05月15日
编辑:Joey 桃子
2025年05月15日
图源:unsplash
原文来源:arXiv
作者:Chao-Yuan Wu、Nayan Singhal、Philipp Kr"ahenbühl
「雷克世界」编译:嗯~是阿童木呀、KABUDA、EVA
我们的数字通信、媒介消费和内容创作越来越多地围绕着视频展开。我们通过这些视频分享、观察和存档我们生活的许多方面,而所有这些都是由强大的视频压缩驱动的。传统的视频压缩是通过费力的手工设计和手工优化进行的。本文提出了一种端到端深度学习编解码器的可选方案。我们的编解码器建立在一个简单的想法上:视频压缩是重复的图像插值。因此,它得益于在深度图像插值和生成方面的最新研究进展。我们的深度视频编解码器性能优于当今流行的编解码器,比如H.261、MPEG-4 Part 2,并且与H.264的性能相媲美。