山东企业“互联网+”“移动营销”的优选品牌
数字应用开发倡导者
周一(3月10日)早晨,“好东西”准时到来,智元机器人官方账号正式揭晓了其首个通用具身基座模型——智元启元大模型GO-1(Genie Operator-1),这也是国内首个同类大模型的亮相。消息迅速引发关注,成功登上两大热搜榜单。 据官方介绍,智元的GO-1大模型创新性地提出了Vision-Language-Latent-Action (ViLLA) 架构,该架构融合了VLM(多模态大模型)与MoE(混合专家)技术,赋予了机器人类似于人类视频学习的能力,实现小样本快速泛化、一脑多形以及持续进化的优势。这一突破不仅扩展了机器的运动能力,更让其拥有了真正的AI智能,展现了巨大的应用价值。 在五种不同复杂度的任务测试中,GO-1大模型相较于现有最优模型,成功率显著提升,平均成功率提高了32%(从46%提升至78%)。特别是在“倒水”、“清理桌面”和“补充饮料”等任务中,GO-1的表现尤为出色。 此外,智元还验证了Latent Planner在ViLLA架构中的关键作用。作为MoE中的一组专家,Latent Planner基于VLM的中间层输出预测Latent Action Tokens,形成规划链(CoP),从而实现通用的动作理解和规划。实验结果显示,增加Latent Planner后,成功率可再提升12%(从66%提升至78%)。 智元方面认为,GO-1的推出标志着具身智能实现了从单一任务到多任务、从封闭环境到开放世界、从预设程序到指令泛化的重大跨越,将具身智能的发展推向了一个新的高度。同时,智元还计划在2025年第二季度推出首个基于强化学习的Foundation Model。 在GO-1大模型发布后,智元合伙人、具身业务部总裁、研究院执行院长姚卯青以及智元具身研究中心常务主任任广辉接受了网易科技的采访。对于发布具身基座大模型的初衷,姚卯青表示,AI能力将成为未来机器人产品竞争力的核心要素。机器人发展的最终阶段,将主要体现在AI能力的比拼上。因此,机器人公司若不做大模型,将难以拥有光明的未来。
烟台三明网络专注软件开发10年+,具备烟台APP开发、烟台小程序定制、烟台公众号定制、烟台网站建设、烟台商城开发、烟台分销系统开发、烟台康复系统开发,致力烟台互联网+行业的系统定制开发与运营,为企业发展提供助力。