工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

admin2年前生活百科6
󦘖

微信号

KTV115116

添加微信

  近期,中国工业互联网研究院(简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

  工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材等七大行业均获国内第一。

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

  五大院士,八大IEEE Fellow,共十三位顶级专家构成了专家委员会。评测对象涵盖GPT4、GPT3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。评估结果选取性能前六名的模型进行公布。

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

  百度文心一言在国内“最懂工业”

  本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。

  评测结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

  在客观题环节,评测结果显示,GPT4与文心一言表现好于其他大模型。但评测结果也同时指出,大模型普遍准确率有较大的提升空间。

工联院大模型测评:文心一言在工业领域表现超过GPT3.5,居国内大模型首位

  主观题方面,国内大模型的基础能力、语句能力与GPT4接近,概括能力、逻辑能力与GPT4有一定差距。

  在大模型的自我认知能力和污染问题分析能力上,GPT4相较于其他大模型表现出更好的能力。

  大模型发展新热点:丰富特定行业专业知识

  虽然国内大模型在本次评测表现较好,甚至在部分行业赶超GPT3.5,但工联院评测报告也指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,国内大模型与GPT4有差距,比如行业间的泛化能力有待加强。

  实际上,工联院评测报告揭示出通用大模型落地垂直行业的痛点,缺乏特定行业的专业知识。

  关于解决难题的方法,工联院评测报告给出的建议是,进一步丰富相关专业领域的数据训练集,进一步进行专业化的微调。

  当前,国内科技公司纷纷加强与工业企业合作,期望通过在实际场景中探索应用大模型,弥补差距,赶超GPT4.0。

  比如在本次评测中位居国内模型第一的百度文心一言,与南方电网电力调度控制中心在电力调度场景探索使用调度AI大模型。在汽车行业,长安汽车基于百度文心大模型正在开发生成式人工智能产品,赋能一款量产车型,实现提升用户体验的目标。除了能源、汽车制造,百度智能云还在建筑、采矿、物流、纺织等领域,探索使用大模型提升运营效率和用户体验效果。

  通过在实际场景的探索应用,科技公司可以积攒更多的行业Know-how,扩展相关领域的数据训练集。这种外部真实反馈有助驱动大模型更加快速的实现迭代升级。

  未来,工联院将持续开展通用大模型在工业领域更多维度的性能评测,包括但不限于大模型的鲁棒性、安全性以及人类大价值观等。

相关文章

中粮势赢交易:甲醇箱体震荡 等待上破

中粮势赢交易:甲醇箱体震荡 等待上破

专题:中粮期货势赢交易【期货每日投稿】   中粮期货势赢交易是各大平台常驻研投团队,沉于市场精研K线、以资金管理为核心,对交易底层理念有独到领悟。创立模块化交易体系,及S·Ying量化模型,不通过对...

第一共和银行暴跌近30% Q1存款流出超1000亿美元

第一共和银行暴跌近30% Q1存款流出超1000亿美元

   格隆汇4月25日 | 第一共和银行(FRC.US)暴跌28.84%,报价11.33美元,总市值21.2亿美元。该行第一季度存款减少近720亿美元,降幅达41%。截至季末,还有1045亿美元的存款...

翡翠有几种颜色-翡翠有几种颜色

翡翠有几种颜色-翡翠有几种颜色

本文目录一览: 1、翡翠有几种颜色 2、翡翠分几种颜色 3、翡翠的颜色一共几种颜色 4、翡翠玉石有几种颜色 5、翡翠有多少种颜色 翡翠有几种颜色 翡翠有几种颜色 翡翠颜色最常见的是绿...

北京行程码摘星-北京行程码摘星

北京行程码摘星-北京行程码摘星

本文目录一览: 1、北京行程码摘星 2、2024北京摘星时间是什么时候北京行程码摘星条件是什么 3、行程卡“摘星”意味着什么 4、北京什么时候摘星 5、北京行程码什么时候去掉星号202...

华润啤酒(00291.HK):1H23业绩符合预期 啤+白模式开始运转

1H23 业绩符合我们预期 公司公布1H23 业绩:1H23 营业额/归母净利润同比+14%/+22%,其中1H23 啤酒业务营收/销量/ASP/吨成本/核心净利润同比变动+9.0%/+4.4%/+4...

20年老牌机构股权“生变”!两大股东争相增持,监管“拷问”七大方面

20年老牌机构股权“生变”!两大股东争相增持,监管“拷问”七大方面

  来源:资事堂    成立于20年前的泰信基金,将再次出现股权变动。   6月9日,监管部门披露了对“泰信基金变更股东申请”的反馈意见。这从一个侧面验证了,泰信基金的股权即将发生变动。   对于,泰...

微信号复制成功

打开微信,点击右上角"+"号,添加朋友,粘贴微信号,搜索即可!