今日实时汇率

1 美元(USD)=

7.178 人民币(CNY)

反向汇率:1 CNY = 0.1393 USD   更新时间:2025-07-09 03:00:01

实测通义千问大模型:基础错误较多,公众开放不抗打

作者|星奈

编辑|方奇

媒体|AI大模型工场

阿里刚过完24岁生日,9月13日上午,阿里云宣布通义千问大模型已首批通过备案,终于正式向公众开放。

通义千问应该是属于比较晚的一批开放的大模型。

用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。

通义千问,此次面向全社会开放,能力到底如何?这就来试试它的真实水平。


通义千问测评,效果如何?


首先,在账号登陆方面,仅需要手机号注册就可以使用。但有一点比较“鸡肋”,AI大模型工场观察到,同一账号仅限同一设备使用,不支持跨设备同时使用。也就是说你在电脑上使用通义千问的时候,手机或平板不能登陆使用。

AI大模型工场就数学能力、语言理解、专业知识、热点信息收集、商业文案创作等向通义千问提问。

数学能力

在数学表现方面,通义千问还是个“初中生”。我们分别问了它经典的小学鸡兔同笼问题、初中数学题和高中数学题。

鸡兔同笼和初中数学题通义千问给出了正确答案,但是到了稍微复杂一点的高中数学,通义千问显然驾驭不了,跟正确答案相差较大。