您現(xiàn)在的位置：首頁 > 資訊 > 國內(nèi) > 正文

五大模型解高考數(shù)學(xué)：阿里通義千問、360智腦10題全錯(cuò)得0分；訊飛星火答對一半|世界新視野

時(shí)間：2023-06-08 22:09:16 來源：搜狐科技

一年一度高考季，高考試題是大眾關(guān)注的焦點(diǎn)，也成為了AI能力的試金石。AI大模型數(shù)學(xué)功底到底如何？比人類“聰明”嗎？搜狐科技使用五款A(yù)I大模型對2023高考上海數(shù)學(xué)試卷進(jìn)行了同題測試。

(相關(guān)資料圖)

在測試中，搜狐科技選取了高考試卷前10道填空題，讓百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT進(jìn)行回答。

測試結(jié)果顯示，這五款大模型在答數(shù)學(xué)題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題，正確率50％。百度文心一言和ChatGPT“緊跟其后”，答對了4題，正確率為40％。

360智腦和通義千問則“全軍覆沒”，一道題也沒答對，交了白卷。

值得一提的是，昨天搜狐科技也用五款大語言模型產(chǎn)品，對高考作文全國卷（甲）進(jìn)行了測試，并邀請了5位語文名師打分。

打分結(jié)果顯示，ChatGPT高考作文得分最高，文心一言、訊飛星火得分稍低，但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語文作文題和數(shù)學(xué)計(jì)算題，對大模型能力考察的維度并不盡相同。但巧合的是，不擅長寫作文的360智腦和通義千問，似乎也不擅長做數(shù)學(xué)題。

通過這兩次高考題測試，也能從側(cè)面反應(yīng)出各家大模型的能力確實(shí)是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學(xué)霸”，那么360智腦和通義千問則是妥妥的“學(xué)渣”。

附測試中使用的高考數(shù)學(xué)題題目：

1.不等式|x-2|<1的解集為__

2.a=(2,3)，b=(-1,2)，則a·b=__

3.首項(xiàng)為3，公比為2的等比數(shù)列的前六項(xiàng)和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域?yàn)開_

6.復(fù)數(shù)z=1-i，則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π，則m=__

8.三角形的三邊長為a=4，b=5，c=6，則sinA=__

9.某地一年四個(gè)季度的GDP(億元)，第一季度GDP為232，第四季度GDP為241，且四個(gè)季度的GDP逐季度增長，中位數(shù)、平均數(shù)相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正數(shù)k的最大值為__

責(zé)任編輯：

關(guān)鍵詞：

相關(guān)新聞

丰满人妻熟妇乱又伦精品,最新国产精品精品视频视频,天堂а√中文最新版在线,成年网站未满十八禁