醋醋百科网

Good Luck To You!

清华首创数据标准型,效率提升三倍,AI控制迎来新突破

在几乎所有工程领域,大数据都在悄然改变传统思维。控制理论,这门与制造、自动驾驶、机器人等高度相关的学科,也到了不得不“拥抱数据”的新拐点。

最近,清华大学李升波团队做了件很有想象力的事——他们首次为“数据驱动控制”设计了一种标准化的数据描述方式,不仅能为算法“瘦身”,效率更是直接提升到三倍。

过去做控制,讲究的是“模型驱动”:先把系统建模,搞清楚动力学方程,然后才能合成控制器。卡尔曼、约旦这些现代控制理论鼻祖们,把模型标准型玩得炉火纯青,什么可控标准型、可观标准型、约旦标准型……这些工具帮我们判别系统性能、设计控制器,效率那叫一个高。

但AI时代到来,数据成了主角。机器人、自动驾驶、具身智能系统每天产生海量交互数据,传统的模型驱动套路根本忙不过来。现在流行直接用数据“喂养”算法,跳过建模环节,这就是“数据驱动控制”。但新问题随之而来:数据怎么存、怎么用、怎么让这些数据高效服务于后续算法?没人给出一个标准答案。

你以为数据多了算法效率就高?未必。数据驱动控制范式下,一个大难题就是:数据没有统一的“标准型”,算法每次都要重复做大量无谓的比对和计算。比如强化学习,样本成千上万,算法每次训练都得算一遍状态距离、特征相似度,计算量爆炸,训练时间动辄十几二十小时,实用性大打折扣。

说白了,数据描述方式直接决定了算法能不能“快准稳”。如果没有像模型标准型那样统一的数据描述,算法永远在“体力活”里消耗资源。


李升波团队的思路非常简单直接:能不能像模型标准型那样,给数据也设计一个“标准型”?他们的答案是肯定的。这个“数据标准型”其实就两部分:

必要的转移部分,也就是“状态-动作-下一个状态”三元组,包含了系统动态的核心信息;

可插拔的属性部分,比如奖励信号或者任何自定义特征,可以根据算法需求灵活增减。

最妙的是,属性部分可以定制,比如提前存好和“锚点”的空间距离。这样,像最近邻搜索这种高频操作,就不必每次都从头算一遍。实际效果如何?实验数据很直观:在Hopper环境下,传统算法训练一次需要20小时,用上空间标准型后只要7小时,效率提升三倍,直接把研究推进了“实用级”。

团队还提出了一套“空间筛选条件”:预先选择n个锚点,把每个样本距离锚点的空间距离提前算好,存成属性。之后做最近邻搜索时,只用简单的筛查判断就能大幅缩小候选范围。无需每次全量遍历样本,算法速度飙升。


更关键的是,这种标准型不光省时还省空间,属性部分完全可插拔,按需添加,灵活适配各种控制算法。既可以减少存储压力,又能加速运算效率,非常适合大规模、复杂场景下的数据驱动控制。

清华这项新成果,其实是给数据驱动控制领域补上了关键一环。过去模型有标准型,现在数据也有“标准型”,算法效率和扩展性都得到了极大提升。

未来,随着AI和控制理论的深度融合,如何组织数据、描述系统、提升效率,会成为越来越多智能系统的核心课题。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言