随着Deepseek等高性能AI模型的涌现,一场激烈的AI竞赛正在世界范围内打响。5月7日,加拿大人工智能研究所发布的一份《2025年人工智能指数报告》显示,高性能中国AI模型的数量和质量不断上升,对美国领先地位构成了挑战,顶级模型之间的性能差距正在缩小。
调查人员使用近两年内“聊天机器人竞技场排行榜”的信息,收集到了用户对各种聊天机器人的表现进行的投票数据。结果显示,排名首位的模型在2024年初比第十名高出约12%,而到了2025年初这一差距缩小至仅5%。“前沿领域正变得越来越具有竞争力——也越来越拥挤”,报告中提到。
值得注意的是,报告认为生成式AI模型平均而言仍在变大,它们使用了更多的决策变量、更强的计算能力和更大的训练数据集。但开发者们也证明了较小、更精简的模型同样可以取得优异成果。
美国康奈尔大学的Bart Selman表示,看到像中国的DeepSeek这样相对小型、低成本的项目证明了自己具备竞争力是一件鼓舞人心的事。“我预测我们将看到一些由五人或两人团队组成的小组提出的新算法思想会带来变革。这是好事,我们不希望世界只被几家大公司掌控。”
目前,美国仍然是最显著模型的主要生产国。在2024年发布了40个模型,相比之下中国发布了15个,欧洲发布了3个。
美国在模型质量上的先前领先优势已逐渐消失,作为发表最多AI论文和专利的国家,中国现在开发的模型在性能上可与美国竞争。“大约在2015年,中国就为自己设定了成为AI领域顶级参与者的道路,他们通过在教育方面的投资实现了这一目标,这开始取得了成效。”Selman说。
此外,在2022年ChatGPT公开发布后,开发人员将大部分精力投入到通过扩大系统规模来提升性能。而许多公司也在发布小型模型,它们训练更快,响应更快,使用的能量也比大型模型少。例如,在2022年能够在MMLU上得分超过60%的最小模型使用了540亿个参数,而到了2024年,只需38亿个参数即可达到相同的分数。
尽管在多个常见基准测试中取得了显著改进,但生成式AI仍然存在诸如隐性偏见或输出虚假信息等问题。Selman说:“有时它们犯下的基础错误让我感到非常惊讶。”
相关论文信息: 10.1038/d41586-025-01033-y
0 条