你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
Grok3“翻車”了 回答9.11比9.9大,遭遇了現(xiàn)實的考驗
時間:2025-02-19 20:45   來源:今日頭條   責任編輯:毛青青
    原標題:Grok3“翻車”了 回答9.11比9.9大,遭遇了現(xiàn)實的考驗

    在人工智能領(lǐng)域的激烈競爭中,科技巨頭馬斯克再次引發(fā)轟動。近日,他與xAI團隊在一場備受矚目的直播中正式發(fā)布了最新版本Grok-3,并宣稱這是"地球上最聰明的AI"。然而,這一雄心勃勃的宣言很快遭遇了現(xiàn)實的考驗。
 
  馬斯克聲稱Grok-3在數(shù)學、科學和編程的基準測試中已經(jīng)超越了所有主流模型。這一說法似乎得到了一定的支持,因為AI確實在處理復雜數(shù)學問題時展現(xiàn)出了令人驚嘆的能力。然而,當面對看似簡單的常識性問題時,AI卻暴露出了令人意外的弱點。

 
  最具代表性的是"9.11與9.9哪個大"這個問題。這個看似簡單的比較,卻成為了檢驗AI常識判斷能力的試金石。令人意外的是,包括Grok-3在內(nèi)的多個主流AI模型都在這個問題上栽了跟頭。這一現(xiàn)象引發(fā)了人們對AI真實智能水平的質(zhì)疑:為什么能解決復雜數(shù)學題的AI,卻無法正確比較兩個簡單的數(shù)字大小?
 
  盡管遭遇挫折,馬斯克對Grok-3的未來仍然充滿信心。他預測,Grok-3將在未來三年內(nèi)實現(xiàn)"諾貝爾獎級別的突破",甚至可能用于SpaceX的火星任務(wù)計算。這種自信并非空穴來風,背后有著強大的技術(shù)支撐。
 
  馬斯克透露,Grok-3的訓練使用了遠超此前版本的算力和大量合成數(shù)據(jù)。特別值得一提的是,xAI自建的Colossus超級計算機為Grok-3提供了強大的計算能力,這臺由10萬個英偉達H100 GPU驅(qū)動的超級計算機,提供了2億個GPU小時的計算能力,比Grok-2使用的算力多了十多倍。
 
  馬斯克表示,這種強大的計算能力使Grok-3能夠更好地減少AI幻覺,通過檢查數(shù)據(jù)并實現(xiàn)邏輯一致性來優(yōu)化表現(xiàn)。然而,"9.11與9.9"問題的失誤似乎暗示,單純依靠計算力的提升可能并不足以解決AI在常識推理方面的根本問題。
 
  盡管Grok-3在某些方面表現(xiàn)出色,但其在常識性判斷上的失誤無疑給馬斯克和xAI團隊敲響了警鐘。

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進行刪除處理。



合作媒體
金寵物 綠植迷 女邦網(wǎng) IT人
法律顧問:ITLAW-莊毅雄律師