机器之心发布
机器之心编辑部
清华和UC伯克利联合研究发现,在不进行任何算法或者网络架构变动的情况下,用 MAPPO(Multi-Agent PPO)在 3 个具有代表性的多智能体任务(Multi-Agent Particle World, StarCraftII, Hanabi)中取得了与 SOTA 算法相当的性能。
2025年09月23日
机器之心发布
机器之心编辑部
清华和UC伯克利联合研究发现,在不进行任何算法或者网络架构变动的情况下,用 MAPPO(Multi-Agent PPO)在 3 个具有代表性的多智能体任务(Multi-Agent Particle World, StarCraftII, Hanabi)中取得了与 SOTA 算法相当的性能。
2025年09月23日
TMTPOST -- Apple has lost four high-profile artificial intelligence (AI) researchers in a development that highlights an ongoing trend: top talent in the AI sector is highly mobile, and high salaries alone aren’t the only reason engineers change companies.
2025年09月23日
Ray不仅仅是一个用于多处理的库,Ray的真正力量来自于RLlib和Tune库,它们利用了强化学习的这种能力。它使你能够将训练扩展到大型分布式服务器,或者利用并行化特性来更有效地使用你自己的笔记本电脑进行训练。
我们展示了如何使用Ray和RLlib在OpenAI Gym上构建一个自定义的强化学习环境。
一旦你用pip install ray[rllib]安装了Ray和RLlib,你就可以用命令行中的一个命令来训练你的第一个RL代理:
2025年09月23日
Actor-Critic方法结合了actor-only方法和 critic-only方法的优势,是一种广泛使用的强化学习方法.该方法的原理为:给定来自于actor的策略,利用critic学习值函数,同时actor可以估计基于critic得到的值函数估计策略梯度.如果actor是固定的,该策略在critic的更新过程中保持不变. 因此,可以使用 时间差分 (TD)学习方法来估计值函数.在critic的更新很多步以后,值函数的估计更加准确,同时也使得actor估计的策略梯度更加准确.
2025年09月23日
强化学习(ReinforcementLearning)灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、模拟优化方法、多主体系统学习、群体智能、统计学以及遗传算法。
2025年09月23日
No 1. 【“最萌”深度学习PPT】
No 2. 双曲线,抛物线,椭圆,圆,都可以通过圆锥切片得到
No 3. 2020进度:▓▓▓▓▓▓▓ 48% …
No 4. 【我怎么读机器学习论文:以DETR论文为例】
No 5. 《A Survey on Deep Learning for Localization and Mapping: Towards the Age of Spatial Machine Intelligence》
2025年09月23日
“水下拍到的照片糊成一锅粥,鱼都认不出自己,AI还能找得到?
”
刷到这条吐槽,潜水员集体点头。
别急,CEH-YOLO来了,4.4MB的小模型,156帧/秒狂飙,专治水下“找不着北”。
先说痛点:深海光线像被搅浑的牛奶,颜色跑偏、颗粒噪点、目标小得跟芝麻似的。
传统算法要么算力吃紧,要么直接摆烂。
CEH-YOLO把YOLOv8拆开重装,塞进三个外挂——
2025年09月23日
Github及Quora大神整理分享100篇NLP领域经典的论文,从1992年到如今,尽管年代久远跨度较大,但很多方法和模式在NLP领域至今都在沿用。原文无文件下载链接,小编给大家下载打包好(见文末)。由于头条限制英文内容原因,这里只给出几大论文方向。
Clustering & Word Embeddings 聚类和词向量
Language Modeling 语言模型
2025年09月23日
今年“元宇宙”概念下,VR头显产品热度居高不下,国产VR头显也不断更新迭代。大厂纷纷入局VR/AR赛道,该细分领域的人才缺口也较大。智联招聘数据显示,在2022年元宇宙企业细分领域中,VR/AR 领域是企业招聘需求最多的赛道。其次是元宇宙社交,占比为32.7%。
年轻人在“元宇宙”打工,月薪过万不是梦?智联招聘数据显示,2022 年 1-7 月全平台元宇宙相关岗位的平均招聘薪酬为 18515 元/月。深度学习岗位的招聘薪酬最高,达39971 元/月,其次是机器学习、数据架构师和移动开发,薪酬均超过3万/月。