由多模态大模型驱动的机器人“超级大脑”有了新的落地案例。
孵化自哈尔滨工业大学(深圳)计算与智能研究院的若愚科技,宣布推出若愚·九天机器人大脑,其中实现多模态大模型驱动下的群体智能是若愚·九天机器人大脑的一大突破。
群体智能,即“一个大脑,多个身体”,若愚·九天大脑可集中控制多台机器人(包括机械臂和AGV)。“多个机器人协同高效率执行复杂任务,这些不同任务之间有复杂的依赖关系。例如,两台机器人在炒菜的同时,另一台机器人去拿碗筷。如果因为菜品制作工序临时变化,导致炒菜时间延长,另一台机器人拿完碗筷后,可以自主决定继续拣选下一道食材。机器人大脑会自主规划任务逻辑,让所有机器人尽可能不停下,同时又确保协作的安全性。这是基于传统规则的示教方法很难实现的。”若愚科技首席产品官邓煜平表示。
据钛媒体App了解,目前,若愚·九天机器人大脑已经通过无人厨房环境的技术方案验证,驱动多智能体掌勺无人厨房。通过人类自然语言与多个机器人交互完成从点菜到上菜的全流程,将“炒菜”的长序列任务进行自主规划。
与当下市面上常见具身智能技术不同,若愚·九天机器人大脑能够实现人类意图理解、高频人机交互和复杂任务规划等功能。
当人类提出“来一份清炒生菜”的需求时,机器人能自主理解人类意图并规划任务,分解成“到食材区捡菜”、“到预备区称重”、“到制作区炒菜”、“到消费区上菜”等多个步骤。
若愚·九天机器人大脑也具有一定“举一反三“的泛化能力。例如,训练模型的时候,只是告诉它要加蒜,没有训练过加辣椒。但之后如果人要求机器人加辣椒,它可以自动理解蒜和辣椒都属于配料,知道该在加蒜的环节替换成辣椒。
若愚·九天机器大脑在控制机器人执行层面的小脑方面也做了技术优化。例如,针对多样环境感知难的挑战,若愚科技研发了大模型3D可供性感知技术,对物体功能可供性区域感知,可免注册、抗复杂光、抗堆叠地抓取多种物体。
针对“机器人从配料盒倒取蒜蓉”、“用铲子从锅中倒取成品菜”等复杂动作执行难的挑战,若愚科技提出了扩散模型驱动的模仿学习技术,实现复杂技能和动作的精准执行。同时,结合多模态大模型驱动的机器人多臂协同技术,大幅提升了目标任务的协作能力与执行效率。
深圳若愚科技有限公司成立于2023年,于今年3月完成超5000万天使轮融资。目前已与国际瓦楞纸包装智能装备龙头、水上动力设备头部企业东方精工集团达成合作,提升东方精工核心产品的智能化水平。
若愚科技联合创始人兼首席执行官孙腾博士表示:“若愚科技的九天机器人大脑以及机器人小脑的技术突破,可以进一步应用到工业领域的复杂工序,例如焊接、打磨、点胶,物流领域的分拣与混合码垛,商业领域的无人零售、无人药房、立体清洁,未来还可进一步延展到消费领域。目前,若愚科技也已经在某些特种领域,与产业伙伴针对特定场景,共同打造更加智能的机器人,把人从危险、繁重、重复的劳动中解放出来,为行业提质增效、打造新质生产力。”
根据《网络安全法》实名制要求,请绑定手机号后发表评论