今日实时汇率

1 美元(USD)=

7.2912 人民币(CNY)

反向汇率:1 CNY = 0.1372 USD   更新时间:2025-04-22 03:00:01

微软反击谷歌:GPT-4在多个方面超越Gemini Ultra

今日,微软发布了一份研究报告,称其最近推出的GPT-4在语言理解基准测试MMLU中的表现优于谷歌的Gemini Ultra。这一发现表明,微软在人工智能领域的研究已经取得了新的进展。

在MMLU基准测试中,GPT-4的表现达到了历史新高,得分率达到了90.10%,超过了Gemini Ultra的90.04%。这一结果显示出GPT-4在语言理解方面的优势。

据微软的研究人员介绍,他们通过使用改进版的Medprompt运行GPT-4,实现了这一突破。Medprompt是一种提示策略,最初是针对医疗挑战而开发的。然而,研究人员发现,它也适用于更广泛的应用。

通过使用Medprompt运行GPT-4,微软在MMLU基准测试中获得了新的技术水平(SoTA)分数。这一结果证明了GPT-4在语言理解方面的强大能力。

此外,微软的研究人员还发布了其他基准测试的结果,使用这些基准测试中常见的简单提示来显示GPT-4与Gemini Ultra的性能比较。据称,GPT-4在使用这种测量方法的多个基准测试中表现均优于Gemini Ultra,包括GSM8K、MATH、HumanEval、BIG-Bench-Hard、DROP和HellaSwag。

微软表示,虽然系统化的提示工程可以产生最高性能,但其仍在探索使用简单提示的前沿模型开箱即用性能。微软称,重要的是要关注GPT-4的原生功能,以及如何利用零次或少量提示策略引导模型。

此外,微软还发布了Promptbase GitHub中的Medprompt和类似的提示策略,包含脚本、通用工具和信息,可帮助重现上述测试结果。这些工具和资源将有助于开发人员更好地利用GPT-4的能力。