股市风云

具身智能开始卷内容生成了 智元推出 0 代码机器人内容创作平台

文章来源:财联社

《科创板日报》10 月 24 日讯 (记者 李佳怡)0 代码、0 门槛,智元推出普通用户也能 「一键上手」 的机器人内容创作平台。

10 月 24 日,智元机器人宣布推出全球首个 0 代码、0 门槛的机器人内容创作平台 「灵创」 平台。该平台支持用户在没有编程基础和专业设备的条件下,通过上传人类动作视频,便可直接生成可供人形机器人执行的动作指令,从而完成从真人演示到机器人动作的端到端转化。

自人形机器人技术进入快速发展阶段以来,其动作开发长期依赖于专业动作捕捉设备、算法建模、强化学习及工程调参等复杂流程,导致相关开发工作多由专业技术人员进行,普通用户难以参与。

根据智元介绍,灵创平台通过 AI 视觉动作提取、智能重定向算法与云端模仿学习框架,能够快捷将人类行为转化为机器人可执行的控制指令。该技术使普通用户无需编写代码或具备专业技能,也可为人形机器人生成动作内容。

智元机器人联合创始人兼首席技术官彭志辉解析到:「只需要上传一段真人视频,灵创平台能够通过 AI 模型智能解析,一键完成从 2D 视频到 3D 姿态轨迹的转换,并将动作重映射,然后进行强化学习的模型训练、端侧模型部署等等。」

「不需要昂贵的动捕设备,也不需要任何专业知识,只需要一部手机和灵创平台。」 彭志辉表示,「曾经一个的开发,可能需要数天的数据采集,反复进行调试训练。而现在,只要你愿意动起来,机器人也就能动起来。」

值得注意的是,灵创平台的动作模仿功能,目前还处于实现肢体动作复现的阶段,未来也将实现手指级别精细动作的模仿和展现。

此外,灵创平台还提供 「语音演绎」 功能,包含音频上传、在线录音和语音合成三种模式。用户上传文本内容或音频后,该功能能够智能识别语义,并利用多模态大模型生成与语音内容匹配的机器人肢体动作与表情。用户还可以根据自身需求,自由选择系统提供的男性、女性以及自定义音色类型。

智元机器人还在灵创平台中,集成了动作混剪、组合与故事线编排功能。用户可借助该功能,像剪辑视频一样对机器人的声音、动作与表情进行多轨道编排,并能够逐帧调整动作节奏,以生成流畅衔接的连续动作序列。

智元机器人表示,灵创平台提供的官方素材库,目前已有 11 类场景下的超过 180 套标准化动作及 140 套表情模板。该平台现已适配智元旗下的灵犀 X2 机器人,未来计划进一步扩展至远征 A2 等其他型号的机器人产品。

《科创板日报》 注意到,灵创平台目前处于公测阶段,用户需完成注册与信息审核方可使用,并计划于 2025 年年底全面开放。

另据智元机器人透露,计划在下个月将推出名为 「灵心」 的机器人个性化性格定义平台,旨在从技能与个性两方面推进智能体的 「人格化」 发展。