[AI 教育] Karpathy 錯了嗎? 學術 AI 閱讀的真正瓶頸,不是 PDF
PDFs, Patterns, and the Peril of Progress: Why Karpathy's AI-First Future Misses the Mark
Andrej Karpathy 最近的疾呼——「研究論文的未來不是 PDF」——點燃了整個科技圈。他認為,既然未來 99% 的「注意力」將來自 AI,我們就該為 AI 重新設計內容格式。這個想法很誘人,因為它指向一個清晰的敵人(PDF)和一個性感的解決方案(AI 原生格式)。
但,這是正確的方向嗎?
我認為,Karpathy 可能點出了一個真實的症狀(資訊超載),卻開錯了藥方。將矛頭指向 PDF,就像是怪罪湯匙讓你變胖一樣。真正的問題不在於資訊的載體,而在於我們對「知識生產」和「智慧」本身的理解。
如果我們不假思索地衝向「為 AI 寫作」的未來,我們可能不會得到一個更高效的科學烏托邦,反而會扼殺科學的靈魂。
人物
Andrej Karpathy
背景:前特斯拉 AI 總監、OpenAI 的創始成員之一,是深度學習和電腦視覺領域的頂尖專家。他對大型神經網路的訓練和應用有著深厚的實務經驗。
近期著名觀點:他大力倡導,既然未來絕大多數的資訊將由 AI 來「閱讀」,我們就必須從根本上改變資訊的產製方式。他認為,像 PDF 這樣的格式對於機器來說是低效的「遺產格式」。他提出的解決方案是創造 AI 原生 (AI-Native) 的內容格式,將知識像程式碼一樣結構化、模組化、可驗證。這就是他「像細菌一樣編碼」思想的核心:創造小而美、自給自足、可被 AI 大規模驗證與整合的知識單元。
Michael Levin
背景:塔夫茨大學 (Tufts University) 生物學教授,艾倫探索中心主任。他的研究聚焦於發育生物學、生物電訊號以及非傳統認知。
觀點脈絡:Levin 的工作探索單細胞生物和細胞群體如何處理資訊、做出決策,這讓他對「智慧」的定義遠超人類大腦的範疇。因此,當他感嘆資訊過載時,他並非只從人類讀者的角度出發,而是從一個更廣闊的、生物學的視角看待「認知頻寬」的問題。正是他這種跨領域的背景,讓這場關於 AI 閱讀的討論從一開始就具備了超越純粹電腦科學的深度。
導火線:一位生物學家的深夜感嘆
這場論戰的起點,並非來自電腦科學家,而是一位頂尖生物學家 Michael Levin 的肺腑之言。他在 X 平台上拋出了一個所有研究者都感同身受的困境:
「我時常感到煩躁,因為我根本沒時間去讀那些相關領域傑出人士們,正以越來越快速度產出的精彩論文。其他科學家也面臨同樣的問題,同樣沒時間讀我那些又臭又長的概念性文章。所以,我們究竟是為誰而寫?... 我猜,AI 將是唯一有頻寬去消化這一切的存在... 既然我們的受眾有很一大部分將是 AI,那我們現在該如何寫作呢?」
(I'm constantly irritated that I don't have time to read the torrent of cool papers... Other scientists have the same issue and have no time to read most of my lengthy conceptual papers either. So whom are we writing these papers for? I guess... AI's will be the only ones who actually have the bandwidth to read all this stuff... So then: how should we be writing, knowing that a lot of our audience will be AI?)
Levin 的問題觸動了學術界的集體焦慮。他描繪的不是一個遙遠的未來,而是每個科研人員書桌上,那座越堆越高的「待讀論文山」。
正是這份焦慮,為 Karpathy 的論點提供了完美的舞台。
其他專家的回響:來自 X 平台與網路的多元視角
Levin 的推文不僅引發了 Karpathy 的回應,還在網路社群中激起廣泛討論。以下是幾位專家與評論者的關鍵觀點,來自 Levin 的部落格評論與相關論壇,這些回響擴展了對 AI 優化內容與科學通訊的辯論:
Richard Watson(南安普敦大學計算機科學與進化生物學教授)強調「連接而非控制」的重要性。他認為,真正的意義來自於脆弱的連接,而非控制,質疑純粹為 AI 優化的未來是否會削弱人類的深度連結。他指出:「控制與分離會切斷脆弱的連接,而真正的成長來自於與他者的共鳴。」簡單來說,他擔心過度追求 AI 的效率和控制,會讓我們失去科學交流中那些偶然、脆弱但卻能激發靈感的思想碰撞。這挑戰了 Karpathy 的效率導向觀點,提醒我們科學未來的核心應是意義而非僅是優化。
Greta Quintin(專注於生態與認知交叉領域的作家)以詩意的方式反思人類對智力的狹隘視野:「我們曾崇拜人類智力為創造的巔峰,卻忽略了其他形式的智慧。蘭花向陽的渴望、蜂巢的協調混沌、螞蟻的堅定決心——這些都被視為智力的迴聲,而非本質。」換句話說,她認為我們不該只為我們自己定義的「一種」智慧(人類邏輯)去優化,而應該看到世界上存在著多種智慧形式,AI 或許能幫助我們理解這個更廣闊的智慧網絡。
Benjamin L(可能是與神經科學家 Lisa Feldman Barrett 有關的研究者)討論機制與類別的解構,引用 Lisa Feldman Barrett 的情緒科學,指出傳統機制如恐懼迴路在更細緻檢視下會瓦解。他主張:「定義與類別並非堅固如人們所想;數學定義如笛卡爾積也充滿歧義。」他的意思是,科學中的分類和定義很多時候是為了方便而設的權宜之計,並非牢不可破。過度依賴 AI 進行僵化的數據提取,可能會讓我們忘記這些概念背後的模糊地帶,而那裡往往是創新的源頭。
其他評論者 的觀點則將討論拉到更高的哲學層次。例如 Pamela Lyon(阿德萊德大學的認知科學家)呼籲擴大「光錐」範圍,涵蓋愛與慈悲,這是在提醒我們,科學探索的視野不應只局限於客觀事實,還應該包含驅動我們探索的人文關懷與價值觀。 而 Jan Cavel(對過程哲學有研究的評論者)探討自創生(autopoiesis)與過程哲學,主張生命是組織封閉的持續過程,這是在暗示,知識就像生命體一樣,是一個不斷自我創造和維持的過程,而不是可以被簡單拆解和儲存的數據。
綜合來看,這些多元的聲音共同指向一個結論:將科學的未來簡化為一個 PDF vs AI 原生格式的技術問題,是極度危險的短視。真正的辯論,關乎我們如何看待知識、智慧與人性的本質。
「AI 注意力」的陷阱:效率與洞見的致命權衡
Karpathy 的核心論點建立在一個假設上:AI 的注意力是未來最重要的資源。因此,我們應該優化資訊以方便 AI「消化」。
這是一個危險的簡化。
科學的進程,從來不是純粹的資訊消化。哥白尼推翻地心說,不是因為他比前人「閱讀」了更多天文數據;愛因斯坦提出相對論,也不是靠著對牛頓力學文獻的「摘要」。科學的躍進,源自於無法被輕易量化的洞見、直覺、典範轉移,以及對既有敘事的徹底顛覆。
而這些,恰恰發生在人類大腦與一篇「寫得好」的論文進行深度、有時甚至是低效的「對話」時。一篇好的論文不只提供數據,它更建構了一個敘事 (Narrative)。它引導讀者走過作者的思想路徑,感受其掙扎、驚喜與最終的頓悟。
為 AI 優化內容,意味著:
敘事讓位給數據:將論文拆解成機器可讀的結構化數據塊。
洞見讓位給模式:AI 善於從海量數據中識別模式,卻難以產生顛覆性的新框架。
對話讓位給提取:閱讀從一場思想的交鋒,退化成一場高效率的資訊提取任務。
如果科學家開始為演算法寫作,他們會不自覺地優化那些機器容易理解的部分(數據、方法),而忽略那些真正能啟發同僚的部分(動機、觀點、未解的謎團)。久而久之,科學可能會變得更「高效」,但也會變得更貧瘠。



