登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
专栏 人工智能

中美大语言模型竞逐:全球视角下的机遇与挑战

蒋镇辉、李佳欣:随着大语言模型被应用到越来越多领域,如何在中美两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。

随着大语言模型被应用到越来越多的领域,如何在中美两国的竞争动态中找到平衡点并推动合作,将成为未来几年的发展关键。

自从 ChatGPT 问世以来,大语言模型LLM(Large Language Model)迅速成为全球科技竞赛的焦点。这些模型不仅在对话类比、数据处理、创意任务等方面展现出非凡的能力,更被视为迈向通用人工智能AGI(Artificial General Intelligence)——即具备人类般认知和推理能力的人工智能—— 的关键一步。 这场技术革命激发全球投资热潮,也将中美两国在人工智能领域的竞争推向新的高度。根据斯坦福大学发布的《2024人工智能指数报告》,美国在基础模型研发方面持续大幅领先,而中国无论在AI专利申请和成功获取专利数量上均位居榜首,反映两国在技术创新发展中有不同路径与策略【注1】。在这一背景下,深入了解并比较中美两国大语言模型的发展现状,不仅有助于洞悉这场竞争的格局,还为未来国际合作提供了新的视角与机会。

中美LLM竞争格局:中英文环境的比较

大语言模型的多语言表现是衡量其全球竞争力的重要标准。虽然ChatGPT在英文环境中表现出色,但在其他语言环境中的能力仍需进一步验证【注2】; 同样,源自中国团队或原生于中文的大模型在本土语境中表现优异【注3】,但在英文测试中可能仍有不足,全面了解这些模型在不同语言环境中的表现尤其重要。为此,我们通过系统性的评估框架,在2024年上半年对16个具代表性的大语言模型进行了中英文表现的比较【注4】【注5】。这些模型来自中美两国的技术巨头、顶尖大学,以及人工智能领域的新锐初创企业。

在英文环境的测试中,GPT-4 Turbo凭借其卓越的自然语言能力和学科专长排名第一; 而Gemini Pro和Llama 2则分别位列第二和第三。中国的文心一言4(ERNIE Bot 4)是英文测试中表现最佳的国产模型,综合排名仅达第五位,略高于Claude 2和GPT-3.5 Turbo,唯未能超越GPT-4【注5】。 在中文测试中,文心一言4则超越GPT-4 Turbo排名第一,整体表现最佳【注4】。总体来看,中国的领先模型在中文环境中的表现强劲,但在其他语言环境下仍有较大提升空间。

新动态:多模态与跨领域应用的兴起

随着大语言模型技术不断成熟,LLM正迅速向多模态与跨领域应用扩展,成为AI发展的新蓝海。多模态能力让模型不仅能够处理文本,还能理解和生成图像、音频和视频内容,大大拓宽了其应用场景。例如,OpenAI最新推出的GPT-4o能够同时处理文本、语音和视觉信息,为增强现实、智能监控和自动驾驶等应用提供了新的可能性。

与此同时,LLM的跨领域应用也在不断加速。微软与OpenAI合作,把GPT-4深度集成到办公软件中,帮助用户提高工作效率; 百度的文心大模型不仅用于搜索引擎,还被广泛纳入企业客服和智能家居等场景。此外,垂直领域LLM也层出不穷。例如上海人工智能实验室(上海AI实验室)与瑞金医院合作推出“浦医2.0”(OpenMEDLab2.0)医疗多模态基础模型群,旨在赋能智能影像诊断、虚拟手术、智慧临床决策等应用场景建设,为未来的“AI医院”提供支持。这些应用案例不仅充分展示LLM的多样化潜力,也催生市场对高性能、高安全性AI模型的强烈需求。

未来发展方向:中美差异与合作机遇

展望未来,大语言模型的发展将重点围绕多模态能力的进一步深化、跨领域应用的扩展,以及安全性与伦理责任的提升。目前,美国在基础技术开发和创新应用上具有明显优势,其模型往往在技术前沿上表现出色; 而中国的模型更强调针对本土语言环境的优化和实际应用的适应性。随着LLM被应用到越来越多领域,如何在两国的竞争中找到平衡点并推动合作,将成为未来几年的发展关键。

中美两国的竞争和合作不仅影响着各自的科技生态,也对全球AI产业的发展方向产生深远影响。在此背景下,香港凭借其独特的国际化背景,以及金融、科技和区位优势,有望成为全球竞争与合作中的重要桥梁。通过推动技术、人才和政策的多方协作,香港将会在国际研究交流、技术转移和产业合作中发挥重要作用,带领探索人工智能的无限潜力。

注1:https://aiindex.stanford.edu/wp-content/uploads/2024/05/HAI_AI-Index-Report-2024.pdf

注2:http://arxiv.org/abs/2302.04023

注3:https://cevalbenchmark.com/static/leaderboard_zh.html

注4:https://www.hkubs.hku.hk/aimodelrankings/report

注5:https://www.hkubs.hku.hk/aimodelrankings/report/en

(作者介绍:蒋镇辉系港大经管学院创新及资讯管理学教授;李佳欣系港大经管学院创新及资讯管理学博士生。本文仅代表作者观点。责任编辑邮箱:tao.feng@ftchinese.com)

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

读者评论

用户名:
FT中文网欢迎读者发表评论,部分评论会被选进《读者有话说》栏目。我们保留编辑与出版的权利。
用户名
密码

明德商论

本双周专栏是由港大经管学院的专家教授撰写,将为读者提供对商业、金融、经济和科技领域最新趋势和创新的独特见解。港大经管学院致力于培养一流的商业领袖和推动学术和相关研究,在亚洲导向经济发展的世界大潮流之下,为香港、中国乃至世界各国的发展提供不可或缺的动力。

相关文章

相关话题

从台北到布达佩斯:寻呼机爆炸的神秘轨迹

黎巴嫩真主党遭遇的大胆袭击事件所涉设备的供应链跨越三大洲。

Lex专栏:无论如何衡量,私募股权基金的表现都很糟糕

投资者急于回笼资金,迫使私募股权基金不得不降低标价以售出资产。

欧盟新任竞争事务专员:必须“改进”合并规则

特雷莎•里贝拉在接受FT采访时表示,欧洲企业需要具备规模才能与全球对手竞争。

铺设中国太阳能板的热潮威胁巴基斯坦负债累累的电网

电价飙升促使巴基斯坦企业争相在工厂屋顶铺设超低价的中国太阳能板。

针对特朗普的明显暗杀企图:到目前为止我们知道什么?

嫌疑人被捕引发了人们对美国总统选举最后阶段候选人安全的担忧。

技术能源正在重塑世界

拥有化石燃料储备的传统权力掮客将看到他们的全球影响力减弱。
设置字号×
最小
较小
默认
较大
最大
分享×