银河通用发布全球首个产品级端到端具身FSD大模型TrackVLA,搭载宇树机器狗实现儿童看护

AI资讯3周前发布 adminps
14 0 0
2025 年 6 月 1 日,银河通用发布全球首个产品级端到端具身 FSD 大模型 TrackVLA。以下是对它的详细介绍:
  • 模型特点:TrackVLA 是一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本(Zero – Shot)泛化能力的具身大模型。它是由仿真合成动作数据训练的 “视觉 – 语言 – 动作”(Vision – Language – Action,VLA)大模型,让机器人拥有 “听→看→懂→走” 的闭环运动能力,无需提前建图、不依赖遥操控制,真正实现语言驱动、泛化感知、自主推理、智能交互与运动。
  • 核心能力
    • 自然语言理解与目标识别:协同工作,用户发出指令如 “跟着妈妈”,机器人能迅速锁定目标,也可根据新指令如 “换成跟孩子” 立即切换跟随对象。
    • 空间理解和视觉记忆:在人流密集场所,面对复杂场景和穿着相似的人,能准确识别原始目标并长时自主跟随。
    • 实时空间智能和推理:目标走出视野,能通过分析目标运动轨迹 “分析出” 目标大致位置,并规划轨迹重新找回目标。
    • 纯视觉环境理解:不依赖建图,靠纯视觉输入理解环境,可直接部署在陌生商场、电梯、游乐区等环境,实现长时稳定自主跟随。
    • 复杂场景避障:在儿童游乐区、狭窄通道等复杂场景中,能实时识别障碍物,分析可通行区域,自主推理出合理路线。
    • 环境适应性强:从室外阳光到室内昏暗、从电梯镜面反射到超市货架夹缝,展现出极强鲁棒性,无需专门调参或切换模式。
    • 远程可视守护:通过 App,用户可以实时看到机器人眼中的第一视角,掌握家人动态,系统还能主动提醒风险行为。
    • 技能涌现:不仅能稳定跟随人类,还可以泛化至任意移动目标,如跟随路上偶遇的动物狗狗。
  • 儿童看护应用:TrackVLA 目前已搭载于宇树机器狗化身 “二宝保镖” 实现儿童看护,并在未训练过的真实场景中完成了严格的长程验证。如在超市中穿梭于人流和货架之间准确跟随母子,根据语音指令切换目标,在儿童玩耍时发出提醒,从电梯进入陌生商场完成连续跟随任务,在人群密集的服装店中稳定识别并避让他人干扰等。
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...