2026/1/10 11:17:38
网站建设
项目流程
网站建设及推广人员,公司如何建站,免费精准客户采集软件,wordpress 页面归类概述
机器人的双臂操纵对于装配操作、工具使用和物品运送等复杂的现实世界任务至关重要。然而#xff0c;在真实世界环境中进行大规模数据收集在时间和成本方面都很困难#xff0c;而且所学操纵策略的通用性也很有限。为了解决这个问题#xff0c;本研究提出了一个名为 在真实世界环境中进行大规模数据收集在时间和成本方面都很困难而且所学操纵策略的通用性也很有限。为了解决这个问题本研究提出了一个名为 RoboTwin 2.0 的大规模、高多样性数据生成和基准测试框架。RoboTwin 2.0 采用闭环方法利用多模态语言模型 (MLLM) 自动生成机器人操作程序然后通过模拟对其进行修改和增强。此外该系统还在背景、照明、物体摆放和指令文本等五个方面引入了强大的领域随机化功能从而显著提高了真实环境中视觉、物理和语言的多样性和鲁棒性。该系统支持 731 种物体类型和 50 个双臂任务并预先收集了 100,000 多个专用轨迹数据。实验表明代码生成的准确性、对不同机械臂的适应性以及在真实环境中的通用能力都得到了提高而且零误差。建议采用的方法RoboTwin 2.0 是自动生成高质量双臂机器人操纵数据的可扩展框架。该方法主要由三部分组成i) 多模态代码生成代理ii) 域随机化iii) 机械臂特定自适应模块。首先MLLM 根据以自然语言编写的任务指令自动生成初始代码。这些代码在模拟环境中各执行十次由视觉语言模型VLM分析操作日志和故障原因该模型与视觉和语言相对应。在此基础上对代码进行反复修改和持续改进直到成功率超过 50%。然后领域随机化引入了物体摆放、背景纹理、照明、桌子高度和指令的多样性。这样模型就能适应各种视觉和物理环境。此外为了适应五种不同类型的机器人如弗兰卡、UR5设计还包括为每个物体准备多种抓取候选方案并根据机器人的自由度自适应生成抓取行为。实验在这项研究中RoboTwin 2.0 的有效性从几个方面得到了验证。首先将 10 项不同任务中自动生成代码的成功率与传统方法RoboTwin 1.0进行了比较结果表明通过使用视觉和语言信息反馈自动生成代码的成功率有了显著提高最高达到 71.3%。接下来我们测试了有无领域随机化在鲁棒性方面的差异发现在 RoboTwin 2.0 上训练的模型即使在未见过的环境中成功率也提高了 20% 以上。在现实环境中对四项任务进行的零点验证也显示在未知背景和杂乱场景下成功率提高了 20% 以上。此外使用 RoboTwin 2.0 训练的模型在 RoboTwin 基准的 “硬设置”杂乱环境中成功率最高这清楚地表明了 RoboTwin 与其他方法之间的差异。这些结果表明RoboTwin 2.0 是一个多功能、实用的数据生成平台可显著提高在真实世界环境中的通用能力。