国产版GPT接踵而来,算力平台谁来支撑?

admin2年前生活百科18
󦘖

微信号

KTV115116

添加微信

  在国产版GPT接踵而至的背景下,目前国内的算力平台还不足以提供支撑,这也成为制约我国大模型发展的重要瓶颈。

  上周,百度推出基于大模型的AI聊天机器人“文心一言”,成为国内首个冲进GPT赛道的互联网企业。3月18日,第一财经记者从达观数据获悉,该公司自主研发的大型语言模型“曹植”系统也取得突破性进展,有望成为国内大规模语言模型中首批可落地的产业应用级模型。

  在国产版GPT接踵而至的背景下,目前国内的算力平台还不足以提供支撑,这也成为制约我国大模型发展的重要瓶颈。

国产版GPT接踵而来,算力平台谁来支撑?

  垂直大模型也需要上千张GPU

  据介绍,“曹植”与ChatGPT和“文心一言”这类更加通用的大语言模型不同,是专注于垂直、专用领域的模型,目标是赋能金融、政务、制造等多个垂直领域。

  达观数据创始人CEO陈运文对第一财经表示:“‘曹植’在垂直领域内的理解和生成的任务上都达到了很好的效果。目前在一些技术细节方面还在调优,未来达观数据将建立多个垂直领域的专用语言大模型,整体功能会很有特色。”

  他举例称,基于达观AIGC智能写作能力,可适配各类材料申报业务场景,基于已有各结构化类数据,快速撰写各类制式和非制式文档,应用于公文、招投标、投行申报文档、法律文书等专业写作场景。

  华为公司创始人任正非近期也对ChatGPT发表看法。他表示:“未来在AI大模型上会风起云涌,不只是微软一家,人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进,大家要关注应用。”

  ChatGPT带动了自然语言处理整体上下游以及芯片的思考和发展,某种程度上大模型也很可能成为下一代技术发展的基础设施。中国建立自己的基础模型体系已成为必然需求,在这一发展过程中,目前国内企业面临的普遍问题是算力不足。

  陈运文向第一财经记者坦言,训练一个垂直的大模型可能需要上千张GPU芯片集群。“现在面临的问题是,我们需要的GPU数量还远远不够,远水解不了近渴。”他对第一财经记者说道,“集群需要的GPU数量很多,建设周期长投入大。”

  目前支撑包括ChatGPT大模型在内的95%用于机器学习的芯片都是英伟达的A100(或者国内使用的替代产品A800),该芯片的单价超过1万美元。此外,英伟达最新一代的H100芯片的性能也远超A100,但价格也更高,约合25万元人民币。

  除了单个的芯片之外,英伟达还出售一个包含8个A100的服务器系统DGX,售价接近20万美元。分析师和技术专家估计,训练GPT-3等大型语言模型的耗资可能超过400万美元。

  这对于大多数中小企业而言几乎是不可能承受的开支。在陈运文看来,如果有超大中心能够提供算力租赁的模式,将会解决中小企业很大一部分算力不足的问题。“国内现有的租赁平台的问题是算力规模还太小,而且价格太高。”陈运文告诉第一财经记者。

  企业探索减少对算力的依赖

  在GPT这类大模型问世前,国内几乎没有任何应用场景需要用到如此大的算力。第一财经记者了解到,商汤科技等国内企业都拥有自己的超算中心,但这些平台仅向定向合作客户开放;而阿里巴巴等对外出租的超算平台的的算力仍然不足以满足目前大量的大模型需求。

  复旦大学自然语言处理实验室邱锡鹏教授此前也表示,该实验室开发的大语言模型MOSS受制于算力资源不足的问题。据介绍,MOSS是基于32张英伟达A100芯片算力。相比之下,ChatGPT模型背后拥有约3万块A100芯片,差距接近1000倍。

  对此,邱锡鹏认为,在资源有限的情况下发展大模型的方向是“用规模较小的模型找到特定的应用场景”,例如可以在企业内部私有部署,经过一些数据微调就可以转化为生产力。

  作为GPT算力最重要的提供者,英伟达已经在探索新的商业模式。黄仁勋已经表示,英伟达愿意将人工智能的算力放在云端共享给企业。

  “我们提供的价值是将原来需要投入10亿美元运行CPU的数据中心缩减为仅用1亿美元就能搞定的数据中心,现在将该数据中心放在云端共享,意味着可以由100家公司来分担这一成本,因此每家公司支付的实际上是非常少的费用。”他说道,“现在企业可以花一两千万来构建一个类似GPT的大型语言模型,这是可以支付得起的。”

  不过也有业内人士指出,解决算力问题只是开发大模型的第一步。澜舟科技创始人CEO周明对第一财经记者表示:“虽然现在算力平台不足是行业面临的普遍问题,但是即便算力问题解决了,还是会有其他问题,关键在于对大模型本质的理解需要提升。”

  周明表示,在美国现在大家也是一窝蜂地去搞大模型,其实很多人对大模型的机理理解还停留在比较初步的认知,包括大语言模型的工程化管理,缺乏独立思考的精神。

  周明也同意,未来大模型的一个发展方向是,在算法上进行优化,从而减少对模型和算力的依赖。“比如用很小的GPU也可以做大模型,这个方向值得关注。”他对第一财经记者表示。

相关文章

AI颠覆药品研发,也可以颠覆电池?

  来源:华尔街见闻   生成式AI技术的应用正在各行各业崭露头角。在医药领域,凭借AI强大的算力,药品研发近几年的效率大幅提高,成本显著降低。   上月英矽智能旗下第一个由AI研发的小分子药物以80...

#中行纪念币进不去#上热搜,网友称一直提示“稍后再试”

  1月3日金融一线消息,龙年纪念币今日22点开放预约,#中行纪念币进不去# 冲上热搜。不少微博网友反应,中行App一直提示“预约火爆,请您稍后再试”。...

刚刚,融创重大进展!

刚刚,融创重大进展!

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   11月20日,融创中国发布公告,宣布境外债务重组各项条件已获满足,并于当日正式生效。   图片来源:融创中国在港交所...

穆迪下调多家美国银行信用评级,美国三大股指下跌

穆迪下调多家美国银行信用评级,美国三大股指下跌

  【文/观察者网 李泽西】   当地时间7日,国际评级机构穆迪下调了十家美国地区银行的信用评级,并警告可能下调更多银行的信用评级,称美国银行业存在普遍“对利率上涨缺乏准备”的问题。受此报告影响,华尔...

美联储等6央行出台措施提高美元流动性,外媒:想起全球金融危机

美联储等6央行出台措施提高美元流动性,外媒:想起全球金融危机

  【环球网报道】在美国硅谷银行等倒闭后,瑞士联邦政府19日宣布,瑞士信贷银行将被瑞银集团收购。在这种情况下,据法新社报道,美联储等6家中央银行当地时间19日晚些时候宣布一项提高美元流动性措施,以试图...

俄罗斯总统普京与多国领导人通电话

俄罗斯总统普京与多国领导人通电话

  当地时间24日,俄罗斯总统新闻秘书佩斯科夫表示,俄罗斯总统普京已分别同白俄罗斯总统卢卡申科、乌兹别克斯坦总统米尔济约耶夫、哈萨克斯坦总统托卡耶夫、土耳其总统埃尔多安通电话,介绍了俄国内发生的相关情...

微信号复制成功

打开微信,点击右上角"+"号,添加朋友,粘贴微信号,搜索即可!