Meta首席AI科學家 Yann LeCun:為何現有AI模型走錯了路?
At the AI Crossroads: Yann LeCun's Critique of Current Models' Missteps
導讀
本文精華版|閱讀時間:15分鐘
你是否曾思考,為何ChatGPT雖然能與你對話,卻無法真正理解世界?為何自駕車技術經過多年發展仍無法廣泛應用?Meta首席AI科學家Yann LeCun教授在新加坡國立大學120周年講座中揭示了答案:當前主流的大型語言模型(LLM)走入了歧途。作為人工智能三巨頭之一,LeCun大膽挑戰了業界共識,提出了一條截然不同的AI發展道路。本文帶你走進這場改變AI未來的思想之爭。
摘要
在這場重量級演講中,LeCun教授直言不諱地批評了現今大型語言模型(如ChatGPT)的根本局限性,並描繪了通往真正智能AI的另一條路徑。他強調,僅靠文本訓練的AI永遠無法達到人類智能水平,真正的智能系統必須理解物理世界、具備推理能力,並能為目標而行動。LeCun提出了以「世界模型」和「自監督學習」為核心的新架構,這與當前由OpenAI、Anthropic等公司主導的技術路線形成鮮明對比。
🔍 現有AI的致命缺陷:現今的大語言模型雖能生成令人印象深刻的文本,但它們對物理世界的理解能力連一隻家貓都不如。這就是為什麼ChatGPT能寫詩卻無法真正理解「重力」或「物體永久性」等基本概念。
🧠 AI需要「世界模型」:就像人類嬰兒通過觀察學習世界運作規律,AI系統也需要建立對世界的內部模型,預測行動後果並進行規劃。這比單純預測下一個詞要複雜得多。
👁️ 自監督學習的革命力量:LeCun指出,真正突破的關鍵在於自監督學習(SSL),即AI從原始數據中自己學習,而非依賴人類標記。一個4歲孩子從視覺獲取的信息量相當於目前最大語言模型訓練文本的40萬倍!
⚡ 能量模型:更聰明的思考方式:LeCun提出的能量模型能夠衡量AI決策的合適程度,類似於人類的「深思熟慮」過程,遠比現今AI的「快速反應」更強大。
🌏 開源AI的未來:為了實現AI的文化多樣性,我們需要開源基礎模型,讓全球各地的人們能夠參與AI創新,避免美國和中國少數公司的壟斷。
AI術語小詞典
大語言模型(LLM) - 透過大量文本訓練的AI系統,能生成和理解人類語言,如ChatGPT和Claude
自監督學習(SSL) - AI無需人類標記,自己從原始數據中找出模式的學習方式,類似孩子通過觀察學習世界
監督學習(SL) - 需要人類提供標記和指導的學習方式,如「這張圖是貓」、「那張圖是狗」
強化學習(RL) - 通過獎勵和懲罰訓練AI的方法,類似於訓練寵物
多模態 - AI同時處理多種類型信息(文字、圖像、聲音等)的能力
世界模型 - AI對世界如何運作的內部理解,用於預測行為後果
能量模型 - 用於評估可能解決方案合適度的數學框架
「智能蛋糕」vs「獎勵機器」:AI界的世紀之爭
想像一下,你面前有兩條通往未來AI的道路:
一條路說:「給AI足夠的獎勵和反饋,它就會自己變聰明」—— 這是由 DeepMind 的 David Silver(AlphaGo之父)提出的「獎勵即足夠」理論。
另一條路說:「AI首先需要理解世界,獎勵只是錦上添花」—— 這是 Meta 的 Yann LeCun 堅持的「智能蛋糕模型」。
這場辯論不只是學術爭論,它決定了科技巨頭如何投入數十億美元研發資源,更直接影響你未來使用的AI產品會是什麼樣子。讓我們用日常生活的例子來理解這兩種觀點:
「獎勵即足夠」:訓練智能寵物的方法
想像你正在訓練一隻狗:每次它完成正確動作(如坐下),你就給它小餅乾。根據Silver的理論,只要獎勵機制設計得當,這隻狗最終不僅能學會坐下,還能發展出理解人類語言、解決複雜問題等各種能力——所有這些都是為了獲得更多餅乾而自然發展出來的。
這就是強化學習(RL)的核心思想:通過不斷嘗試並獲得獎勵反饋,AI系統能夠發展出複雜的智能行為。DeepMind的AlphaGo正是通過大量的「自我對弈+獎勵」,最終戰勝了人類圍棋冠軍。
「智能蛋糕模型」:孩子的自然學習方式
而LeCun卻指著人類嬰兒說:「看,他們並沒有通過不斷的獎勵來學習世界!」
嬰兒在得到很少明確獎勵的情況下,通過觀察就能學習物理規律(如物體掉落)、辨認物體(即使從不同角度看)等基本能力。LeCun稱這種不需要外部標記的學習方式為「自監督學習」(SSL)。
在LeCun的「智能蛋糕」比喻中:
蛋糕主體(最大部分)是自監督學習:理解世界的基礎知識
糖霜(表面裝飾)是監督學習:特定技能的訓練
櫻桃(最小部分)才是強化學習:最終目標的微調
為什麼這場爭論如此重要?
這不只是學術爭論,而是關乎我們將擁有什麼樣的AI技術:
如果「獎勵即足夠」是正確的:
我們應該專注於創造更複雜的虛擬環境和更精確的獎勵系統
AI將主要通過「試錯+獎勵」來學習,類似於演化過程
阿爾法星(AlphaStar)、ChatGPT的RLHF等技術路線會是未來主流
如果LeCun的「蛋糕模型」是正確的:
我們需要重點發展允許AI自我理解世界的技術(尤其是視覺、觸覺等多模態數據)
強化學習只是「錦上添花」,不是核心驅動力
未來AI將更像人類嬰兒一樣學習,通過觀察和互動建立世界模型
現實生活的例子
這場爭論直接影響了當前AI產品的設計理念:
「獎勵即足夠」的例子:OpenAI的ChatGPT使用RLHF(基於人類反饋的強化學習)來調整其回答以迎合人類期望。系統根據人類評價者的好評/差評來調整自己的行為。
「蛋糕模型」的例子:Meta的自監督學習系統能從未標記的大量視頻中學習物體的永久性和物理規律,這些系統不需要明確告訴它們「這是正確的」,而是通過預測被遮擋部分來自我學習。
聰明的復讀機:LLM的本質
大語言模型的真相:為何ChatGPT不是通往真正AI的道路
想像你有一位朋友,他讀完了世界上所有的書籍和文章,記憶力超群,能夠流暢地討論任何話題。聽起來很厲害,對吧?但有一個問題:他從未親身體驗過這些事物,只是在復述他讀到的內容。這就是當今大型語言模型(如ChatGPT)的真實寫照。
LeCun教授一針見血地指出:「LLM在文本生成方面確實令人印象深刻,但它們對物理世界的理解甚至不如一隻家貓」。這個比喻可不只是誇張的修辭!
真實案例:當ChatGPT遇上日常物理問題
讓我們做個小實驗。當你問ChatGPT:
「如果我從桌子上推一個杯子,會發生什麼?」
它會回答:「杯子會掉到地上,可能會摔碎...」
聽起來很合理,對吧?但這只是它從文本中學到的關聯,而非真正的理解。當你提出更微妙的問題時,它的限制就會顯現:
「如果我把一個杯子放在桌子邊緣,然後輕輕碰了桌子另一邊,杯子會怎樣?」
真正理解物理世界的人或動物會考慮振動傳導、不穩定平衡等因素,但LLM只能基於它所讀過的文本進行猜測,沒有真正的物理直覺。
為何文本數據永遠不夠
在講座中,LeCun分享了一個震撼的數據:「目前最大的語言模型訓練數據量相當於人類需要花費四五十萬年才能閱讀完的文本量。然而,一個四歲兒童僅憑視覺系統在四年內接收的信息量就已經與之相當!」
這個比較揭示了純文本學習的根本局限:
信息密度差距:視覺、觸覺等感官信息的密度遠高於文本
互動學習缺失:LLM無法主動試驗和探索物理世界
跨模態理解缺失:真實世界是多感官的,不僅僅是語言描述
解決之道:超越文字,擁抱多模態世界
LeCun認為真正的突破需要AI系統能夠:
跨感官學習:結合視覺、聽覺、觸覺等多種感官輸入
建立預測性模型:不僅描述世界,還能預測動作後果
主動探索:像嬰兒一樣通過互動和實驗學習
這就是為什麼Meta正在重點研發能夠從視頻和互動中學習的系統,而不僅僅是提高語言模型的參數量。
「簡單地讓LLM變得更大並不能解決根本問題,就像讓一個盲人讀更多書也不能教會他看到顏色一樣。」—— Yann LeCun
未來已來:LeCun理論對你我的四大實際影響
無論你是在醫療行業工作的專業人士,還是科技公司的決策者,又或者只是日常使用AI工具的普通用戶,LeCun的理論都將深刻影響你的未來。以下是四個關鍵領域的具體變革:
就業市場大洗牌:「長效知識」將決定你的職業生涯
核心洞察:在LeCun看來,面對AI飛速發展,你應關注「保質期長」的基礎知識,而非短期技能。
實際應用:
👨💼 金融分析師:那些專注於純數據輸入和報表生成的工作將被AI取代,但能夠理解市場深層機制和人類行為心理的分析師將更加吃香。
👩⚕️ 醫療專業人員:影像識別等技術任務正被AI承擔,但具備深厚醫學基礎知識和病人溝通能力的醫生將更顯價值。
👨💻 程式開發者:特定編程語言的熟練度已不再是核心競爭力,而是算法思維、系統設計能力和對業務領域的深度理解。
你的行動計劃:
投資學習科學基礎(數學、物理、認知科學)
培養「如何學習」的元能力
尋找跨學科機會,特別是將你的專業與AI結合的領域
「如果你的工作可以被明確寫成指令,那它很可能會被AI取代;如果你的工作需要創造性思維和對世界的基本理解,那麼你的職業將更有保障。」— 基於LeCun的觀點
產品設計革命:從「聰明的搜索引擎」到「真正的助手」
核心洞察:當前的產品設計過度依賴LLM的能力,卻忽視了其根本局限。
真實案例:
現在:智能家居助手(如Alexa)大多是「聽懂指令→執行預設動作」的簡單模式
LeCun模式下的未來:真正理解居住者習慣和家居環境物理特性的助手,能預測需求並主動提供幫助
行業轉變:
教育科技:從簡單的課程推薦到真正理解學生認知發展階段的個性化教育助手
醫療診斷:從單一數據分析到整合病人生活習慣、環境因素的全面健康顧問
創意產業:從模仿現有風格到理解美學原理和文化背景的創作伙伴
關鍵設計思路變革:
從單一模態(文本)到多模態輸入(視覺、聲音、觸覺)
從反應式響應到主動預測
從固定「技能」到持續學習的系統
開源與多元化:全球AI發展新格局
LeCun的關鍵主張:AI的未來不應由少數美國或中國公司壟斷,而應允許全球各地開發者構建符合當地需求和價值觀的系統。
具體影響:
地區AI中心崛起:新加坡等地可利用獨特地緣優勢成為區域AI樞紐
本土化AI模型:適應不同語言和文化背景的專門模型將出現
防止AI殖民主義:避免單一文化價值觀主導全球AI系統
商業模式轉變:
從封閉專有模型到開源基礎模型+專業服務
從通用大模型到垂直領域特化模型
從集中式雲計算到更多邊緣計算和本地部署
「未來的AI將是多元的馬賽克,而非單一的畫布。」— 基於LeCun的開源AI觀點
一分鐘掌握LeCun的核心技術
對於非技術人員來說,LeCun的許多概念可能聽起來十分抽象。這裡用日常生活的比喻,讓你輕鬆理解他的兩大核心技術思想:
「世界模型」:你腦中的谷歌地圖
想像一下谷歌地圖如何工作:
它不僅知道所有地方在哪裡
還能預測如果你走這條路會遇到什麼
能計算出最佳路線來實現你的目標
LeCun的「世界模型」就像你腦中的谷歌地圖:
不僅能識別物體和環境
還能預測「如果我這樣做,會發生什麼?」
能計劃一系列行動來達成複雜目標
現有的LLM就像只有地名索引的老式地圖本,能告訴你地名和一些基本信息,但不能動態導航或預測交通情況。
「能量模型」:大腦的「適合度測量儀」
想像你的大腦中有一個「適合度測量儀」,當你思考一個解決方案時:
好主意會讓測量儀顯示「低能量」(綠燈)
糟糕的主意會顯示「高能量」(紅燈)
你的大腦會自動尋找讓測量儀顯示「最低能量」的方案
LeCun的「能量模型」就是這樣工作的:
衡量輸入和預期輸出之間的兼容性
「低能量」表示良好匹配,「高能量」表示不匹配
AI系統尋找「最低能量」的解決方案
現有的AI主要是單向思考(輸入→輸出),而能量模型允許系統「深思熟慮」,通過反覆優化找到最佳答案。
專家提示:下次聽到AI專家談論「能量模型」時,就把它想像成「方案評分系統」就對了!
綜觀LeCun的思想,我們可以清晰地看到:當今大型語言模型的轟動並非AI發展的終點,而僅是一個中間站。真正的人工智能需要理解物理世界、擁有預測能力,並能為目標而行動—這與現今純文本驅動的AI有本質區別。
如果你是企業決策者:
評估你的AI戰略是否過度依賴LLM技術
優先投資能夠理解你業務領域基本規律的AI系統
考慮如何將AI與物理世界連接(傳感器、機器人、IoT)
如果你是普通用戶:
對現有AI工具的能力和局限保持清醒認識
優先選擇能結合視覺和其他感知的多模態AI工具
培養自己的批判性思維和創造性思維,這正是AI最難以複製的能力
在LeCun看來,真正的AI革命才剛剛開始。未來的AI不只是更好的聊天機器人,而是能真正理解並智能地互動於物理世界的系統。這個願景既令人振奮,也充滿挑戰。但無論如何,這場探索智能本質的偉大旅程,已經不可逆轉地影響著我們每一個人。
你準備好迎接真正的AI時代了嗎?
copyright © PrivacyUX consulting ltd. All right reserved.
關於本刊作者
Gainshin Hsiao 是 Agentic UX(代理式使用者體驗)的先驅,在人工智能與使用者體驗設計領域擁有超過 15 年的開創性實踐。他率先提出將用戶隱私保護視為 AI 產品設計的核心理念,於 2022 年創立 Privacyux Consulting Ltd. 並擔任首席顧問,積極推動隱私導向的醫療 AI 產品革新。此前,他亦擔任社交 AI 首席策略官(2022-2024),專注於設計注重隱私的情感識別系統及用戶數據自主權管理機制。
Agentic UX 理論建構與實踐
AI 隱私保護設計準則
負責任 AI 體驗設計
在 Cyphant Group 設計研究院負責人任內(2021-2023),他探索了 AI 系統隱私保護準則,為行業標準做出貢獻。更早於 2015 至 2018 年,帶領阿里巴巴集團數位營銷平台體驗設計團隊(杭州、北京、上海、廣州)、淘寶用戶研究中心並創立設計大學,從零開始負責大學的運營與發展,不僅規劃了全面的課程體系,更確立了創新設計教育理念,旨在為阿里巴巴集團培育具備前瞻視野與實戰能力的設計人才。其課程體系涵蓋使用者中心設計、使用者體驗研究、數據驅動設計、生成設計等多個面向應用。
活躍於國際設計社群,在全球分享 Agentic UX 和 AI 隱私保護的創新理念。他的工作為建立更負責任的 AI 生態系統提供了重要的理論基礎和實踐指導。
學術背景
Mcgill - Infomation study/HCI -Agentic UX, Canada
Aalto Executive MBA-策略品牌與服務設計, Singapore
台灣科技大學:資訊設計碩士- HCI, Taiwan
中原大學:商業設計學士- Media and marketing design, Taiwan