阿里巴巴达摩院陈海青:模型体系并不一定是参数越大模型越好

admin1年前生活百科6
󦘖

微信号

KTV115116

添加微信

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  8月11日,AI大模型资本产业论坛暨第九届新浪财经上市公司年会在北京举行。吴晓求、田轩、周鸿祎、冯俊兰、武超则、余兴喜、胡锡进、赵伟、盛丰衍、于海宁等专家学者、企业掌舵者、金牌分析师、明星基金经理齐聚。深入探究人工智能赋能与发展、活跃资本市场、后市投资机会等热门议题。

  阿里巴巴达摩院创新业务中心负责人陈海青表示,参数是带来智能涌现的充分条件,但不是必要条件。是不是在真实的场景中越大的参数越好呢?这涉及到场景和数据本身的结合。从阿里本身的研究来讲,开源的中小模型基本上参数是以60亿参数和70亿参数为主的。模型体系中并不一定是参数越大模型越好。

  早期在GPT的整个方法体系下就是大量的技术人员做排序,生成函数和部分,最后应用到了线上的机制,结合线上大规模C端用户对于模型的反馈自动形成反馈提升和模型,本身的标注规模大,训练相对不稳定,并且需要大量的核心算法人才和部分,所以在初期的落地下我们不建议做,并且在当下中国法律法规体系下无法做泛化领域的大规模强化,未来初始化任务结束之后,在专业领域的强化和部分是可以被展开的。

  在未来长期来讲开源模型和闭源模型终将会长期存在,而它所分化的整个领域中是小的、专属的或者小参数的模型,甚至是逐步参数更大的模型,或者社区化一定会发展,因为社区会带动整个技术能力的发展。

  是不是在这样的驱使下闭源的模型就没有发展空间和部分了呢?我认为是有的,在专业领域中我们看到对于效能的提升,包括这里从数据的壁垒,算法的壁垒,我们可以举一些例子。比如说金融行业大模型,我认为它存在于相当复杂的场景和体系,是值得今天从基础模型上构建无论是闭源还是开源的基础大模型领域的,因为金融领域足够复杂,从研报,银行的业务,客服等等的业务,有多复杂的下游业务和体系。从今天一个金融量化的角度讲有常规的量化指标也有非常规的量化指标和部分影响这个部分,在大模型角度来讲内容足够丰富。开源必然会更加灵活,成本更低,能够让大家更普惠的使用。

  长期来看,闭源模型更多的会走向高效果、高价值,包括高效率的三个方向,这里列举的是当下开源模型不是主流,闭源是主流。过两三年,可能开源模型逐步回成为大家应用的主流和部分,闭源模型会在特殊的领域和行业中体现出我刚才提到的三高领域分化和体系。

  在当下务实的大模型方面,包含了问答推理、内容生成、代码生成、文本分析,这是我们在阿里云的基础上在探索的,从助理、客服、内容生成、代码、金融、零售、媒体、能源等等场景看到的整个部分和体系。我们具体列一些我们对行业部分以及深度做的案例和体系。

  阿里云已经落地和即将落地的一些场景:

  第一个部分从新闻媒体场景来看,除了要做场景以外,刚才我讲了两阶段的模型和体系,对于右边大家看到的内外部实时数据的接入是第一阶段,通过大模型在海量数据(维权)中查找和生成今天看到的核心数据。在这个基础上再来做精准的基于新闻结构,无论是金融新闻还是政务新闻、娱乐新闻的结构生成,一定程度上从大模型两阶段部分完成整个新闻摘要写作的部分,还有对字数、文风的控制。

  第二个部分从问答体系中,客服会成为今天首当其冲的部分,在大模型的基础上控制好知识幻觉的基础上,可以更多的支持“yes or no”的问题,提高我们离线知识管理的效率以及客户体验的能效提升,作用于平台上称为一次性解决率的提升。

  第三个部分是知识文档问答的增强,这里有一个具体的案例。我们通过一个财报的读取和部分,通过文档检索和整个部分去实时回答今天讲的欧莱雅大的财报体系,这三个我认为是当下我们看到在阿里云上主流的场景,包括我们列举了一些案例和落地的部分。

  最后做个总结,在大模型的趋势下,大模型的多结构化和推理成本的降低,今天我们采用MOE的架构还是围绕一个、多个模型,这都是很重要的。第二个开源、闭源将来会很长时间内并行产生,以效果化提升为主。第三个以围绕实际业务落地中,以Agent构建,包括上下文的计算,API的对接,一定会成为未来主流的在企业上对接的三种主要的方式,包括落地的整个性能。

相关文章

广汽曾庆洪:碳酸锂价格低于40万元 电动车就有机会赚钱

  作者: 李溯婉   [ Robotaxi被认为是汽车界最有可能成为下一个类似ChatGPT的风口。IHS Markit预测,到2030年,中国共享出行的总市场规模将达2.25万亿元,其中Robot...

锋龙股份(002931.SZ):目前来看今年液压零部件的客户需求下滑程度在20-30%之间

来源:格隆汇 格隆汇12月20日丨锋龙股份(002931.SZ)于2024年12月19日接受特定对象调研,就“最近看公司今年液压零部件的需求有多大下滑?”,公司回复称,目前来看今年液压零部件的客户需求...

造车新势力4月排名巨变,零跑、理想销量环比高增,小鹏、蔚来竟垫底

造车新势力4月排名巨变,零跑、理想销量环比高增,小鹏、蔚来竟垫底

  造车新势力4月排名巨变,零跑、理想销量环比高增,小鹏、蔚来竟垫底   来源:华尔街见闻 王眉   埃安持续突破4万辆,理想再创新高超2.5万辆,哪吒稳定破万,零跑、极氪还挺能打,小鹏反超蔚来,深蓝...

中国开国十大将军-开国十大将军是谁

中国开国十大将军-开国十大将军是谁

本文目录一览: 1、开国十大将军是谁 2、开国十大大将 3、开国十大将都是谁? 4、开国十位大将 5、开国十大将? 6、中国十大开国将军 开国十大将军是谁 1955年中国人民解放...

京新药业:地达西尼胶囊获批上市

京新药业:地达西尼胶囊获批上市

证券时报e公司讯,京新药业(002024)12月5日晚间公告,公司近日收到国家药监局核准签发的1类创新药“地达西尼胶囊”的《药品注册证书》。此次地达西尼获批上市,是该药品全球首次上市,也是公司首个小...

权益新发困难重重 二季度4只基金募集失败 多只延迟发行

权益新发困难重重 二季度4只基金募集失败 多只延迟发行

  界面新闻记者 | 纪瑶   二季度,市场进入震荡回调状态。公募基金新发市场尽管已有所回暖,但资金都“躲在债基里”。   Wind数据显示,以基金成立日计算,公募新发市场自4月以来,每个月的发行份额...

微信号复制成功

打开微信,点击右上角"+"号,添加朋友,粘贴微信号,搜索即可!