![]()
机器人会跑会跳会唱,但距离真正走入千家万户,仍有关键一步尚未迈出——理解真实世界。要做到这一点,必须为机器人的“大脑”提供海量、真实的物理世界数据,让其学会感知、决策与执行。
觅蜂科技董事长兼CEO、智元机器人合伙人姚卯青
4月16日,由智元机器人孵化的具身智能数据公司觅蜂科技正式亮相。新公司定位为一站式物理AI数据服务平台,试图补上这一长期制约行业发展的数据短板。
“AI从数字世界走向物理世界,正遭遇数据荒漠。”觅蜂科技董事长兼CEO、智元机器人合伙人姚卯青表示,此时组建具身智能数公司,正是希望推动高质量物理AI数据实现标准化供给,“像水电一样即取即用”,为具身智能产业筑牢根基。
姚卯青介绍,与大语言模型相比,具身智能的数据积累仍处于早期阶段。以当前主流模型为例,训练类似ChatGPT-5级别的系统所需语料达百亿小时量级,而具身智能可用数据仅在50万小时量级,不仅规模差距悬殊,还存在标准缺失、质量不一、供需错配等问题。
更关键的是,数据获取方式长期受限。传统物理AI数据采集方式往往依赖定制化机械臂、专用传感器、固定工位等,不仅设备成本高昂、部署周期漫长,也难以覆盖真实世界中复杂多变的场景。
为此,觅蜂科技推出MEgo系列无本体数据采集硬件,包含采集夹爪、头戴式采集设备等。设备具备超300全景感知与亚毫秒级数据同步能力,通过可穿戴设备,普通人也可以在工厂、商超乃至家庭环境中完成数据采集,由此大幅降低数据采集门槛,拓展采集场景。
觅蜂科技推出MEgo系列无本体数据采集硬件MEgo Gripper和MEgo View。
根据觅蜂科技的规划,相关硬件将于年内实现规模化量产。配套推出的一站式数据治理服务平台,可实现数据预处理、空间重建、数据质量评估、数据标注等功能,实现数据全流程自动化处理。
记者在觅蜂科技官网看到,其“数据市场”板块已上架467个具身智能训练数据,涵盖家居、工业、餐饮、办公等场景,其中既有真机数据,也有仿真数据,还有触觉数据。姚卯青表示,该板块类似数据展示“橱窗”,便于客户预览样本。今年,公司的数据采集规模有望达到千万小时,并在2030年前向百亿小时级数据产能迈进。
除了数据供给,如何推动数据流通与标准统一,也是行业关注的焦点。为此,觅蜂科技联合上电科、国家数据标委会、工信部赛迪研究院等机构发起“蜂巢数据共创行动”,北京人形机器人创新中心、上海国地中心等数十家海内外机构共同参与。
共创行动以“打破数据孤岛、统一数据标准、链接全球供需”为目标,打造开放高效的物理AI数据流通网络,让客户轻松找到数据,让服务商精准对接需求,实现数据价值高效流转。
同时,觅蜂科技还与京东云、百度云、阿里云、猎聘、贵州大数据集团、张江集团等达成战略合作,计划在数据生态、场景协同、算力支持与人才建设等领域展开深度合作,共筑物理AI数据产业新生态。
姚卯青说,通过这样的合作机制,一是推动行业标准和共识的形成,二是加强联合研究与交流,三是打通数据供给与需求之间的连接,让真正有价值的数据实现高效流转。