AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

admin2年前生活百科7
󦘖

微信号

KTV115116

添加微信

  财联社3月8日讯(编辑 史正丞)过去几个月里,由ChatGPT引发的AI热潮向人类展现了通用语言模型的生产力前景。就在聊天机器人逐渐变成生产力工具之时,利用通用语言模型驱动真正的机器人也已经提上日程。

  本周老牌AI大厂谷歌与柏林工业大学的研究人员联合发布PaLM-E视觉语言模型,通过同时处理图像和语言文本,解锁人类与机器人交互的新篇章。

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

  顾名思义,PaLM-E模型源自于谷歌的大型语言模型PaLM,E指的就是具象化(Embodied)。通过将通用语言模型与视觉转换模型ViT相结合,PaLM-E成功实现让AI同时具备“理解文字”和“读懂图片”的能力,不仅能够输出文字,还能输出指令使得机器人的智能化跃上一个新的台阶。

  研究人员介绍称,PaLM和ViT的结合,使得PaLM-E的参数量最高可达5620亿组,也是全球已知的最大视觉语言模型。

  回归到资本市场最关心的问题,这个听上去很厉害的AI模型,到底能干什么事情呢?对此研究人员也给出一系列案例,帮助外界理解这个模型的妙处。

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

  首先,具备视觉属性的AI模型将拥有解读图片并进行思维推理的能力。例如可以通过一张禁行交通标志(除自行车外)的图片,来解答“我能否在这条马路上骑自行车”;通过OCR识别餐馆的手写菜单,能进行账单的计算;或是通过识别一系列烘焙材料的照片,向机器人传达“制作蛋糕胚”的流程。

  在AI模型与机器人结合的实验演示中,机器人得到“从抽屉里拿出米饼”的指令后,能够顺利地从十多个开放式抽屉中找到米饼,拿给研究人员。

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

  在后续的实验中,研究人员还要求机器人“将所有色块按颜色堆放到不同角落”的指令,以及将“绿色色块推到乌龟旁边”的指令,即便机器人之前没有见过这只乌龟摆件,也能顺利地完成任务。

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点?

  虽然从演示视频中来看,受限于演示机器人较为简单的设计,执行指令的时候仍显得“笨手笨脚”。但随着PaLM-E模型赋予机器思考如何执行人类指令的能力,工业应用和工业设计上的突破也指日可待。或许在不久的将来,就会出现一款风靡全球的智能机器人硬件。

  值得一提的是,作为AI大战的老对手,微软也已经在“图像+语言模型”的路数上有所布局。在今年2月底发表的研究中,微软就展现了如何使用ChatGPT为大疆Tello无人机编写“找饮料”程序的案例。

相关文章

天睿祥盘中异动 早盘股价大跌6.22%

北京时间2024年12月05日22时32分,天睿祥(TIRX.us)股票出现波动,股价大幅跳水6.22%。截至发稿,该股报0.690美元/股,成交量1184股,换手率0.04%,振幅0.00%。 最近...

深赛格(000058.SZ):公司电子市场业务经营情况正常

来源:格隆汇 格隆汇7月24日丨有投资者向深赛格(000058.SZ)提问:公司在电子市场业务板块经营情况如何?有没有电子商务业务?如何维护与客户关系? 深赛格回复:公司建立了以深圳华强北为中心,覆盖...

新致软件(688590.SH):目前公司未与特斯拉有相关合作

来源:格隆汇 格隆汇11月16日丨新致软件(688590.SH)在互动平台表示,目前公司未与特斯拉有相关合作。...

有家保险盘中异动 股价大跌5.72%报0.623美元

北京时间2024年10月04日00时37分,有家保险(UBXG.us)股票出现异动,股价快速跳水5.72%。截至发稿,该股报0.623美元/股,成交量30.8627万股,换手率1.04%,振幅6.25...

金科服务(09666.HK)6月14日耗资118万港元回购10.5万股

来源:格隆汇 格隆汇6月14日丨金科服务(09666.HK)公告,6月14日耗资118万港元回购10.5万股,每股价格为11.36-11.16港元。...

pp是什么材料-pp材料是什么?

pp是什么材料-pp材料是什么?

本文目录一览: 1、pp材料是什么? 2、pp材料是什么 3、PP是什么材料? pp材料是什么? pp材料一般指聚丙烯。聚丙烯pp是什么材料,是由丙烯聚合而制得pp是什么材料的一种热塑性树脂...

微信号复制成功

打开微信,点击右上角"+"号,添加朋友,粘贴微信号,搜索即可!