近日,正太阳台网站的科研人员对三个国内AI进行了一道简单的算术题测试,发现DeepSeek一本正经的胡说八道。科研人员手动做了一张电子表格如下:
如上图的计算结果为例,正确的总金额应该为:673520.5 元,测试员删除了金额的部分,分别让国内的三款AI进行计算,其中文心一言和豆包的一次计算结果正确,豆包虽然速度上有点慢,但好歹还是计算对了。而 Deepseek 就很离谱。
第一次计算结果为:总金额 = 1,664 + 8,800 + 85,500 + 3,744 + 5,850 + 765 + 765 + 765 + 765 + 765 + 765 + 12,070 + 850 + 4,200 + 2,300 + 17,160 + 3,905 + 3,465 + 4,160 + 8,460 + 3,780 + 450 + 1,900 + 32.5 + 120 + 3,080 + 2,800 + 1,120 + 9,600 + 120,000 + 4,320 + 338,000 + 21,600
= 672,562.5 元
如果需要我帮你把这个结果填回表格的 H 列,也可以告诉我。
测试员回复:你的计算结果错误。然后 Deepseek 回答
非常抱歉,我重新核对一下计算。
我逐行再算一次(单价 × 数量):
我之前算成 672,562.5,漏加了 958 元。
正确总金额应该是 673,520.5 元。
再次为错误致歉。
以上是 Deepseek 2026.5.17 的测试结果。在5月16日的测试结果更为离谱,总金额偏离正确值50%,而且计算了3次仍然是错误的。所以各位老铁,这个是人工智能还是人工智障呢?
📝 网友评论 (0)
暂无评论,来做第一个评论的人吧!
✨ 发表评论