Decart 推出 Oasis3:用于机器人训练的现实、低延迟世界模型
前沿人工智能研究实验室 Decart 推出了 Oasis3,这是一个旨在缩小合成模拟与现实世界人工智能部署之间差距的世界模型。
本月推出的视频输出引擎可加速机器人和自动驾驶车辆控制系统的训练,使它们能够在不可预测的现实条件下蓬勃发展。
机器人开发人员面临着训练能够在复杂的现实世界环境中导航的系统所需的高质量数据的缺乏。
虽然车辆可以学习在具有固定交通锥的静态停车场中行驶,但开放道路的环境要求更高,天气、照明和动态障碍物不断变化。
处理城市街道混乱(大雨、突然出现的障碍物、不稳定的交通)的训练系统是 Oasis3 应对的一个独特挑战。
机器人训练瓶颈
大型语言模型 (LLM) 突飞猛进,但通用机器人技术(或物理人工智能)却落后了,这主要是由于缺乏丰富的媒体资源。
Bessemer Ventures 指出,LLM 开发人员可以从抓取数十亿个公共网页中受益,这对于必须在物理空间中进行解释和操作的视觉语言动作 (VLA) 模型来说是一种奢侈。
VLA 模型摄取环境数据,对其进行处理,然后做出响应。培训他们提供了三种主要途径:
- 远程操作 ——人类操作员穿着受控套装模仿机器人的动作。虽然可以产生最高质量的数据,但其成本高昂且速度缓慢,使得大规模部署不切实际。
- 开放网络视频 —随时可用但混乱,缺乏一致的环境、空间遥测和直接动作调节。
- 综合数据 - 中间立场,但当前的物理引擎无法满足现实世界的细微差别,导致所谓的模拟与真实的差距 .
当现实世界的随机性(漏油、易碎包装、意外碎片)使自主系统失去平衡并暴露其局限性时,这种差距就会显现出来。
通过闭环生成模拟缩小差距
Decart 声称 Oasis3 通过将逼真的运动图形与强大的物理引擎融合在一起,弥合了现有的虚拟训练限制。
Oasis3 嵌入在单个高性能训练循环中,可生成动作条件视频流,几乎可以生成开发人员设想的任何混乱场景,从而创建一个紧密反映现实的训练环境。
该平台支持完全可控的多视图、超现实环境;自动驾驶汽车的横向偏差会触发生成流,在 200 毫秒内调整视角,完全符合强化学习的要求。
Oasis3 与 Nvidia 的物理 AI 生态系统共同设计,以 22fps 的速度在 CoreWeave 的专业云基础设施上运行,提供 512×768×3 分辨率的交互式虚拟环境。
它提供原生三摄像头视图,可从多个角度保持空间和时间的一致性,使自主系统能够准确测量深度和外围环境。
Oasis3 可通过 Decart 的 API 访问,允许开发人员将其无缝集成到现有的物理 AI 模拟管道中。
训练机器人征服未知领域
要实现科幻小说级别的人形机器人,需要训练机器人实时管理独特的边缘情况,而这些情况在实验室中是无法复制的,例如当自动驾驶汽车的摄像头被泥土遮住时,货物掉落在路上。
Oasis3 使开发人员能够使用简单的自然语言提示,跨越不同角度、天气条件和路面,创建此类事件的无限变化。
通过以经济实惠的方式将模型暴露在数百万种危险中,开发人员可以确保为任何可能的现实场景做好准备。
自动化控制系统
- 比黄金贵一倍的木头?真的吗?
- DHL 表示,自动化和数字化将重塑物流业
- UiPath 在 E 轮融资中筹集了 2.25 亿美元
- 通过公民开发人员自动化程序最大限度地提高业务效率
- 日立以 14 亿美元收购机器人系统集成商 JR Automation
- IE6 电机技术:彻底改变流程工业的能源效率
- Mecademic Robotics 凭借其微型机器人进军巨大市场
- ATI 工业自动化宣布新的机器人工具更换器
- 协作机器人:从简单开始,然后增加复杂性
- SICK microScan 安全扫描仪现在提供基于 EtherCAT 的故障安全功能
- reichelt elektronik 凭借巨大的增长扩大产品目录
- 消除遗留系统成本并提高您的利润