数学|智慧教育

不要以为现在的AI大模型无所不能了，我来泼一点冷水吧。

作者sailing 2024-08-112024-08-11

今天分别用通义和文心一言两个现在国内比较广泛使用的AI大模型来进行了一个小测验。考考这两位在解决最基本的数学问题时，是不是比人要快要更AI。

先卖个关子，你们先猜猜结果会怎样？

题目就是两道凑24点的数学问题。

本人非常喜欢玩一些数学游戏，比如凑24。为此，我专门分别用python和 Geogebra编写了24点游戏。记得我几岁的时候就很喜欢用扑克牌和小伙伴们玩这个游戏。一般四个人玩，每人出一张牌，算出来就拍桌子，然后马上说出答案。如果说对了，牌桌上的扑克牌就由其他人收走，看最后谁手里的扑克牌最少，谁就是最后的冠军。印象中，我都是冠军，是打遍周边无敌手的存在。其中我最得意的一个角題是是白天有5，5，5，1四个数，大家都没有算出来。我晚上翻来覆去睡不着，总算算出来了。当时的成就感就像现在运动员得了奥运冠军一样吧。

一、通义

我很直接，问他用6，9，2，2四个数凑24。

3×4=24！没想到他给出这样明显错误的答案。一点也不人工智能呀。

我提出疑问，他经过多次的尝试，最后还是坚定的认为3×4=24。还说这是正确的解法。我有点抓狂了。干脆直接告诉他答案，看看他好不好意思。

再继续难为一下他，看看有没有长进。

他不停的用实际上，正确的解法，但最后都没有算出来。我在怀疑他是否真正明白凑24的规则，或者我的表达是否让他误解。

看这个情况，他还是解不出来。我就让他先休息了。

二、文心一言

换到百度的文心一言。（因为不是会员，是会员的话可以升到4.0，不知道会不会好一点。）

我先确认他是否明白规则。看来没有问题，对规则门清。

我的天！他居然给出了和通义类似的错误答案。这是要改写数学基本计算规则吗？

(9 – 2) × 2 + 6
= 7 × 2 + 6
= 14 + 6
= 24

还说这就是正确答案。接着看我俩的对话。就看你觉得他是不是AI应有的水平。

看来他对错误的式子有执念呀！

算了，可能上面这个题比较难，那不妨再一个更难的？呵呵。

叫他继续挑战5，5，5，1四个数凑24.

有点难为他了。算了，我告诉他正确答案。

所以，你觉得是我的问题太难，或者这样的问题AI大模型学习得还不够。留待时间来回答吧。

人名以姓氏笔画为序的规则

智慧教育

人名以姓氏笔画为序的规则

作者sailing 2023-02-102023-02-10

经常在一些人选公布文档中，是以姓氏（名）笔画来对人员排序的。具体规则为：先比较两个人的姓名第一个…

试试Deepseek求解一个简单数学问题

智慧教育

试试Deepseek求解一个简单数学问题

作者sailing 2025-01-262025-01-26

DeepSeek，一家中国AI大模型创业公司，近期发布了DeepSeek-R1大模型，其性能在数学、代码、自然…

ChatGPT有多厉害，跟随sailing老师一起来体验一下

智慧教育

ChatGPT有多厉害，跟随sailing老师一起来体验一下

作者sailing 2023-03-032023-03-05

近几个月，由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT火出了圈。但国内目前普通用户是无法…

重庆第八届青少年科学素养大赛复赛算法竞赛（图形化编程）高段模拟题5-10关算法

我的软件作品|智慧教育

重庆第八届青少年科学素养大赛复赛算法竞赛（图形化编程）高段模拟题5-10关算法

作者sailing 2024-04-112024-04-11

这次比赛的模拟题目还是有一定难度，图形化编程中没有像Python语言那么多的数据结构和语法特性。只能使用基本的…

体验一下重庆市第八届科学素养大赛小学组的算法竞赛练习

智慧教育

体验一下重庆市第八届科学素养大赛小学组的算法竞赛练习

作者sailing 2024-02-242024-02-24

竞赛练习环境是简化版的scratch。一共有十个关口。主要考察了变量、赋值、判断、循环语句和数学运算与字符和列…

分数除法“颠倒相乘”的算理

小学数学|数学

分数除法“颠倒相乘”的算理

作者sailing 2022-12-232023-01-18

小学阶段，我们学习了分数除法，总结出了分数除法的计算法则：除以一个不为零的数，等于乘这个数的倒数，法则非常简单…

发表回复取消回复

要发表评论，您必须先登录。