AI 大模型的语言不平等:英语最便宜,其它语言要贵得多

admin2年前生活百科5
󦘖

微信号

KTV115116

添加微信

IT之家 7 月 31 日消息,用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示,由于 OpenAI 等服务所采用的的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。

IT之家注意到,推特用户 Dylan Patel(@dlan522p)分享了一张照片,展示了牛津大学进行的一项研究,该研究发现,让一个 LLM 处理一句缅甸语句子需要 198 个词元(tokens),而同样的句子用英语写只需要 17 个词元。词元代表了通过 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)访问 LLM 所需的计算力成本,这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。

AI 大模型的语言不平等:英语最便宜,其它语言要贵得多

词元化模型(即人工智能公司将用户输入转换为计算成本的方式)意味着,除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构(无论是从语法还是字符数量上),导致它们需要更高的词元化率。例如,根据 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符(你的爱意),而英文有 14 个字符。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

协鑫集团董事长朱共山:绿色低碳发展既是必由之路,更是重大的转型机遇

协鑫集团董事长朱共山:绿色低碳发展既是必由之路,更是重大的转型机遇

  6月17日,2024年APEC工商领导人中国论坛在北京举行,本次论坛的主题为:创造更高质量的可持续发展。以“能源科技革命赋能绿色零碳产业新生态”为题,全球绿色能源理事会主席、协鑫集团董事长朱共山进...

大烨智能BOLL值出现异动,持有5天上涨概率较大,技术面值得关注!

大烨智能BOLL值出现异动,持有5天上涨概率较大,技术面值得关注!

策略之王监测到,2024年08月17日大烨智能收盘BOLL值创下阶段新低,同时开口收窄,预示下跌趋势或将反转,是个不错的抄底信号。该组合曾持有大烨智能相关个股,点击跟踪查看 布林线(BOLL)利用股价...

中国罕王:Mt Bundy金矿项目最终可研报告确认矿石储量为164万盎司

中国罕王:Mt Bundy金矿项目最终可研报告确认矿石储量为164万盎司

  中国罕王(03788)发布公告,Hanking Australia Investment Pty Ltd(罕王澳洲)的全资附属公司 Primary Gold Pty Ltd所100%拥有的Mt...

地府人物排名-地府都有哪些人物?详细介绍一下

地府人物排名-地府都有哪些人物?详细介绍一下

本文目录一览: 1、地府都有哪些人物?详细介绍一下 2、地府有几大判官,黑白无常算什么? 3、地府官职排名 地府都有哪些人物?详细介绍一下 地府人物详细介绍一览表酆都大帝:地府最高统治者,主...

重大变化!美股结算T+1即将启动

重大变化!美股结算T+1即将启动

  美股交易结算制度下周将发生改变。   当地时间5月24日,美股三大股指集体收涨。截至收盘,道指涨0.01%,纳指涨1.10%,标普500指数涨0.70%。   从当地时间5月28日(下周二)开始,...

锅巴热量-非油炸锅巴热量

锅巴热量-非油炸锅巴热量

本文目录一览: 1、非油炸锅巴热量 2、锅巴的热量 你知道吗 3、油炸锅巴的热量 4、100克馒头和100克锅巴的总热量是多少? 5、兆辉藤椒锅巴热量 6、小零食一袋100克的锅巴...

微信号复制成功

打开微信,点击右上角"+"号,添加朋友,粘贴微信号,搜索即可!