五億年智慧啟蒙:李飛飛的人工智能演講(2025 巴黎 AI 會議)
Fei-Fei Li's Talk on AI: The Amazing Journey from Eye Evolution to the Future of Intelligence
影片原文出處
五億年的智慧啟蒙
想像一下五億年前的海洋深處,那是一個光線穿透幽暗水層的神秘世界。在這樣一個原始的環境中,最早的三葉蟲,這些微小的生命先驅,睜開了它們原始而奇特的複眼。這不僅僅是簡單的睜眼,而是生物第一次獲得了視覺,第一次開始以視覺感知這個世界。李飛飛教授巧妙地運用這個生動的比喻,將三葉蟲的視覺啟蒙與嬰兒睜開眼睛的瞬間相類比,深入淺出地解釋了智能最根本的起源:感知環境的能力。
就像一個剛出生的嬰兒,從混沌的黑暗來到充滿光線的世界,透過睜開稚嫩的雙眼,開始觀察周遭的一切。最初,映入眼簾的可能只是模糊的光影,隨著時間推移,嬰兒的視覺逐漸發展,開始分辨出清晰的輪廓、色彩和物體。這是一個不斷學習和探索的過程,每一次視覺體驗都在幫助嬰兒建立對世界的認知。同樣,生物從最初級、最簡單的感光能力開始,歷經漫長的進化,逐步發展出能夠處理周圍環境複雜信息的能力,最終進化出與環境互動並採取行動的智慧。這種從最初被動地「看見」外部世界,進階到主動地「理解」所見之物,再到最終根據理解「做出行動」的完整循環,正是所有形式智慧最基礎、也是最核心的起點,無論是五億年前的三葉蟲,還是今天的人工智能,都遵循著這個感知、理解和行動的智慧進化之路。
"the moment Evolution endowed the simple creatures the ability to sense the world around them... seeing become understanding, understanding led to action"
AI成長的三大燃料
1. 學習方法突破
從1958年,Frank Rosenblatt 發明了第一個「感知器」(Perceptron),這個被視為最早的「AI神經元」模型開始,科學家們就開始積極模仿人腦設計機器學習的模式。早期的神經網路模型雖然簡潔,但受限於計算能力和演算法的限制,發展一度停滯。就像算盤進步到智慧型手機一樣,AI 的學習方法也經歷了漫長的演進。近年來,隨著「注意力機制」(Transformer)的出現,AI 迎來了突破性的進展。Transformer 模型能夠有效地處理序列數據,並行處理大量資訊,不再像傳統的循環神經網路(RNN)那樣需要依序處理,這使得 AI 在處理長文本和複雜語境時效率和準確性都大幅提升。這種革命性的技術,正是驅動 ChatGPT 等大型語言模型能夠流暢自然地與人類對話的底層秘密。
"This work would go on to inspire Decades of computer scientists... culminating in the Deep learning algorithms we know today"
2. 資料養分
2009年,李飛飛教授主導的ImageNet專案,如同為AI建立了一座豐富的「圖像圖書館」。這個專案耗時數年,從網路上收集了超過一千四百萬張人工標註的圖片,涵蓋兩萬多個不同的類別,旨在為電腦視覺系統提供海量的訓練數據。李飛飛教授曾生動地比喻:「這就像教小孩認識貓和狗,需要給予足夠多的學習樣本,才能讓AI真正學會辨識圖像。」ImageNet的出現,極大地推動了深度學習在圖像識別領域的發展,成為日後許多AI視覺技術的基石。而如今,更為龐大的LAION資料集被廣泛使用,其規模達到了驚人的580億張帶有文字說明的圖片,這相當於人類歷史上所有出版書籍的總和,為AI的發展提供了前所未有的數據燃料。
"Our hypothesis of data as the key... kicked off a global Trend in using big data for AI"
3. 超級引擎
令人驚訝的是,AI 算力的爆發竟然與電玩遊戲息息相關!圖形處理器(GPU),最初是為了滿足電子遊戲對圖像渲染的需求而開發的,但意外地成為了訓練 AI 模型的理想引擎。GPU 擅長並行處理大量數據,這與深度學習中大量的矩陣運算完美契合。正是由於遊戲產業對更精細、更流暢畫面效果的不斷追求,才推動了 GPU 技術的飛速發展,使其具備了遠超傳統 CPU 的計算能力,進而成為 AI 發展的關鍵基礎設施。AI 模型訓練的成本也因此發生了驚人的變化,從 2012 年大約相當於一支手機的價格(約 1,000 美元),急劇攀升至如今如同建造摩天大樓般的天價(高達 1 億美元)。這背後的原因是,隨著 AI 模型變得越來越複雜,處理的數據量也呈現指數級增長,對算力的需求也隨之水漲船高。
"it was video games that helped push the raw speed of silicon into overdrive... if there are any Gamers out there we have to thank you for this"
AI新技能:從思考到動手
最新技術讓AI突破「鍵盤戰士」角色,不再僅限於螢幕上的互動:
3D透視眼:從2D照片重建立體空間:AI能夠分析二維圖像,重建出三維立體模型。例如,它可以將梵谷的畫作轉換為可沉浸式體驗的立體咖啡館,讓觀者身臨其境。這項技術利用深度學習演算法,從單張或多張2D圖片中推斷深度信息和空間結構,應用於虛擬實境、擴增實境、以及城市建模等多個領域。
機器人學徒:透過VR模擬學習多項日常任務:AI驅動的機器人不再需要繁瑣的編程,而是可以通過觀看VR模擬示範來學習執行複雜的日常任務,例如泡茶、整理房間等超過1000種不同的操作。這種「模仿學習」的方式,大幅降低了機器人學習新技能的門檻,加速了機器人在家庭服務、工業自動化等領域的應用。
醫療好幫手:腦波控制機械手臂與手術機器人:AI在醫療領域扮演著越來越重要的角色。腦波控制機械手臂技術,讓癱瘓病人能夠通過意念精準控制機械手臂,準確率高達92%。此外,全球已有7000多台手術機器人在醫院服役,輔助醫生進行更精確、微創的手術,提高手術成功率並縮短病人恢復時間。
"AI is starting to create, understand, reason and interact in tangible 3D spaces... going from an observer to an actor alongside Us"
以人為本的AI時代
溫暖科技
聽見世界:OpenAI 開發的 Whisper 語音辨識技術,如同為世界裝上耳朵,它不僅支援高達 97 種語言,更能精準辨識各種口音和方言,打破語言隔閡,讓資訊無障礙流通。
看見美好:Google Lookout 應用 AI 視覺技術,化身為視障者的眼睛,即時描述周遭環境、辨識物品、閱讀文字,幫助他們更安全、更獨立地探索世界,重拾生活的美好。
學習夥伴:可汗學院 AI 導師,如同每個學生的專屬家教,它運用 AI 技術分析學生的學習狀況,提供個人化的指導與解答,目前已幫助全球 50 萬學生,讓學習變得更有效率、更有趣。
"AI should help protect and even return that sense of dignity to all of us, especially to the most vulnerable"
全球共治
面對AI帶來的挑戰,需要全球共同努力,採取以下策略:
科學監管,風險分級: 借鑒食品分級制度的思路,對AI應用進行風險評估和分級管理。就像食品有不同的安全等級,AI應用也應根據其潛在風險程度,例如對社會穩定、個人隱私、倫理道德可能造成的影響,劃分不同等級。高風險的AI應用,如涉及公共安全、金融決策等領域的系統,需要更嚴格的審查和監管,確保其安全、可靠和符合倫理標準。低風險的應用則可以相對寬鬆的管理,鼓勵創新。這種分級制度有助於在促進AI發展的同時,有效防範和降低潛在風險。
開源共享,知識普惠: 學習Hugging Face平台的開源共享模式,打破技術壟斷,促進AI知識和技術的普及。Hugging Face 平台就像一個「AI維基百科」,匯集了超過15萬個預訓練模型、數據集和AI工具,讓研究人員和開發者可以免費存取和使用,極大地降低了AI開發的門檻,加速了技術創新和應用落地。鼓勵更多機構和企業將AI研究成果、模型和數據集開源共享,構建開放、協作的AI生態系統,讓更多人能夠參與到AI的發展中來,共享技術紅利。
資源平衡,算力普惠: 正視算力資源分配不均的問題,避免算力過度集中在少數大型企業手中。目前全球算力資源分配極不均衡,例如非洲的算力僅佔全球的0.6%,這將導致發展中國家在AI發展中處於劣勢地位,加劇數字鴻溝。應推動算力基礎設施的均衡發展,例如通過國際合作、技術援助等方式,幫助發展中國家提升算力水平,確保各國都能平等地參與到AI的發展進程中。同時,也需要探索更高效的算力利用方式,例如發展更節能的AI算法、優化算力調度機制等,提升全球算力資源的整體利用效率,實現算力普惠,讓更多人能夠平等地享受AI帶來的便利。
"we need everyone from all walks of life to have a role in shaping this change"
給人類的智慧叮嚀
李飛飛最後提醒:「AI應該是擴展人類能力的工具,不是替代品。就像顯微鏡延伸我們視力,AI將幫助我們更好理解世界,但人性的溫暖永遠無可取代。」她進一步強調,儘管AI在某些方面超越了人類的能力,例如數據處理和快速計算,但其本質仍然是服務於人類的工具。如同顯微鏡幫助生物學家探索微觀世界,望遠鏡幫助天文學家探索宇宙奧秘,AI 的價值在於擴展人類的認知邊界和解決問題的能力。然而,科技的發展不應以犧牲人類獨有的情感、創造力和社會連結為代價。人與人之間的同情心、關懷和倫理判斷,是機器智能難以複製和替代的。因此,在追求AI技術進步的同時,我們必須堅守以人為本的原則,確保AI始終服務於人類的福祉,而不是取代人類的價值和地位。
"Today I would like to dare all of us to build a human centered AI. The real power of intelligence isn't merely to think but to drive action with those thoughts"
copyright © PrivacyUX consulting ltd. All right reserved.