AI大模子的语言不同过错等:英语最重价,此外语言要贵良多

7 月 31 日新闻,言不英语言贵用户所运用的同过语言对于大型语言模子(LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的最重家养智能边界。最近的外语一项钻研展现 ,由于 OpenAI 等效率所接管的良多的效率器老本掂量以及计费的方式,英语输入以及输入的大模的语用度要比其余语言低良多,其中简体中文的言不英语言贵用度约莫是英语的两倍 ,西班牙语是同过英语的 1.5 倍,而缅甸的最重掸语则是英语的 15 倍。
IT之家留意到 ,外语推特用户 Dylan Patel(@dlan522p)分享了一张照片,良多揭示了牛津大学妨碍的大模的语一项钻研 ,该钻研发现 ,言不英语言贵让一个 LLM 处置一句缅甸语句子需要 198 个词元(tokens) ,同过而同样的句子用英语写惟独要 17 个词元。词元代表了经由 API(如 OpenAI 的 ChatGPT 或者 Anthropic 的 Claude 2)碰头 LLM 所需的合计力老本,这象征着缅甸语句子运用这种效率的老本比英语句子逾越 11 倍 。
词元化模子(即家养智能公司将用户输入转换为合计老本的方式)象征着 ,除了英语之外的其余语言运用以及磨炼模子要贵良多。这是由于像中文这样的语言有着差距 、更重大的妄想(不论是从语法仍是字符数目上),导致它们需要更高的词元化率 。好比 ,凭证 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中惟独要两个词元,但在简体中文中需要八个词元。尽管简体中文文本惟独 4 个字符(你的爱意),而英文有 14 个字符。
【源头:IT之家】返回搜狐,魔难更多
责任编纂 :
相关文章
终于追罚,中超季军狂飙5人退赛,3主力无缘亚冠决战,金靴又倒下
亚冠小组赛接近尾声阶段,随着三镇的出局,中超仅剩下2支球队,泰山基本锁定了一个出线名额,主要看能否以小组第一的身份晋级,另一支球队是上赛季季军浙江队,后者状态起伏,不过上一场3-2拿下关键战后,积分也2025-03-18兢兢业业!泰特10中6患上14分1板1助1帽 正负值为+16
直播吧11月9日讯 今日,NBA老例赛火箭128-94战败湖人。此役,泰特替补出战28分钟,他10投6中,三分6中2,患上14分1板1助1帽,正负值为+16。2025-03-18着落!火箭本季场均27次助攻同盟第10+ 上季场均22.4次同盟垫底
直播吧11月9日讯 今日NBA老例赛,火箭主场128-94战败湖人。据统计,火箭本场角逐共送出26次助攻,本赛季7场角逐6场助攻20+。当初他们场均助攻27次排名同盟第10,而上赛季他们场均惟独22.2025-03-18原创 勇士主教练:威金斯的表现确实不太理想,但我对他依然充满信心
原标题:勇士主教练:威金斯的表现确实不太理想,但我对他依然充满信心 在此前的一场NBA常规赛中,主场作战的卫冕冠军丹佛掘金经过苦战后以108比105战胜了金州勇士。本场比赛后,拿下了4连胜的掘金2025-03-1814分完胜!快船喜提3连胜!全队6人上双,小卡爆砍41分哈登7助
北京时间12月9日,NBA常规赛继续展开,快船客场挑战爵士。快船近期状态不错,这次面对爵士也是早早占据主动,半场比赛取得13分领先,之后快船一直保持着领先,爵士也是苦苦追赶,末节快船一波12-0攻势再2025-03-18- 11月11日讯 NBA季中锦标赛太阳主场对于阵湖人的角逐正在妨碍中。第一节角逐中:当初太阳16-15争先湖人,湖人命中率50%太阳70%,拉塞尔患上到8分,比尔患上到9分。源头:2025-03-18
最新评论