[讀者回函]從 Schoolhouse 篩網到 Mercor 標註工:Khan-TED 時代的大學階級重構
Khan-TED and the Annotation Pipeline: Competency College Meets Ghost Work
序言:當 Khan-TED 聯手推出 $10K 的「應用 AI 學位」,它不會去敲常春藤的門;它敲的是中後段大學—因為在「大型平台+大廠」把手伸進課表時,能力本位評量往往會被接進專家標註合約同一條供應鏈。
這句話有範圍:並非每一種能力本位或每一所應用 AI 本科都注定走向標註;只是 Khan-TED 這個公開樣本,把風險畫得最銳利。
作者補充
最近一位亞洲朋友在諮詢北美的高等教育資源。去年秋天另一場類似的對話裡,我也曾因對方堅持「孩子適合線上」而僵持—直到把問題改成「這張文憑準備拿去交換哪一種勞動契約」,對方才肯離開適不適配的軌道。
他家裡的路線很典型:孩子在家自學(由家長主導、不在公立/私立學校全日制就讀),現在準備銜接北美大學體系。
他在資訊海洋裡看到了 Khan-TED 學位—由可汗學院與 TED 共同發起的線上學位計畫,主打約 $10K 級距的低學費與「能力本位」評量。對一個正在替小孩算「時間/金錢/出路」的家長來說,這個選項看起來像捷徑。
他丟給我一個很尖的問題:
「這種 AI 大學的定位,是加速那些資源受限、只能走向就業型的中後段大學,更快走進專家標註的死胡同嗎?」
我的答案是:是。
但我必須先把話說開—這個問題不只屬於那位父親。它只是同一個結構的三個入口之一;另外兩個入口,我在諮詢裡反而更常碰到。
第一條線:家長/升學規劃。 表面上是「要不要選 Khan-TED」,底層是:孩子拿到的學位,會不會在勞動市場裡被當成「可標準化輸出的能力包」來定價—而那種定價方式,跟 Mercor 類平台上的專家標註合約是同一套語言。
第二條線:正在做專家標註的局內人。 我常遇到資歷 8 年上下的專家問:「專家標註到底是過渡期的出路,還是一條會越走越窄的死路?」這句話若硬翻成升學語言,其實是在問:「我是不是在 18 歲選錯了主修/學校,才會在 30 歲把自己論斤論兩賣掉?」 Khan-TED 如果大規模普及,會把這個問答時間點往前推到「選大學的那一刻」。
第三條線:乙方創業者/採購決策者。 另一種問法是:「我該不該採購某家標註服務?」聽起來像在談供應商與服務水準承諾;但它的上游版本更刺眼:「我的標註供應鏈,究竟是從哪一種大學/哪一種課表量產出來的?」 當大學課程被設計成「可驗證任務清單」,你買到的就不只是人力工時,而是一整套已被規格化的「能力輸出格式」。
三條問題線看起來不相干—升學、接案、採購—但它們在 Khan-TED 這個設計樣本上交會:同一套「能力可被切片、可被評分、可被運送」的邏輯,同時定義了學位、履歷與訓練資料。
而且這套機制比表面上「便宜/高效/國際化」的文案更精準:省學費只是表象;底層是把教育接上標註經濟的銜接規格—而這個接法,在課程簡章上讀不出來。
要解開的誤區:用「孩子適不適合某種學習模式」當選校首要變數,預設勞動市場那一端會自動接住。
那天他追問我一句更具體的:「他自學那麼多年了,跟一般小孩不一樣—傳統校園的群體生活他可能反而不適應。線上又是能力本位,剛好對他的個性吧?」
我反問他:「你算的是學習模式『適不適合』孩子。但你打算讓孩子用這個學位去交換什麼?」
他愣了一下:「進職場啊。」
「進什麼樣的職場?什麼樣的職位?什麼樣的同事?」
「……我沒想那麼遠。我以為先選個能讓他唸下去的,後面再說。」
這句話我太常聽到。它的真實意思是:我把「孩子能不能適應」當成選校的首要變數,預設勞動市場那一端會自動接住他。Khan-TED 卻把入口(自學者友善的線上模式)跟出口(替帝國定義能力規格的產業夥伴)接在同一條供應鏈上。
一個自學長大的孩子,正是這條供應鏈最理想的原料:自律、不依賴傳統師生關係、習慣自己跟教材對話—這些都是 Mercor 模式下「優質標註工」的素描。
能力評量 ≡ 標註合約
Khan-TED 學位的核心賣點是「能力本位評量」—用「你會做什麼」的證明,取代「你修了幾學分」:時間長短可以變,但要達到的精通程度當成固定標準。
聽起來很進步?把這句話跟 Karen Hao 在《AI 帝國》調查中,那位被迫做標註的母親的控訴放在一起看:
“Mechanizing my life, atomizing my work, devaluing my expertise, and then harvesting it for the perpetuation of this machine.”
「能力本位評量」和「專家標註合約」走的是同一條轉換管線:把人拆成能力清單,再把能力拆成可驗證任務,最後把任務拆成可重複的提示—回應對。
出口端的稱呼不同—在大學端落在成績單上,在平台端落在訓練資料裡。任何一個夠細的能力評量題庫,本質上就是一套未來的標註語料規格書。
在當前大型語言模型與資料標註平台的產業結構下,「作品集式評量」與「平台任務紀錄」共用類似的可驗證任務語言與技術底層—兩者高度可互換,才容易被市場接成同一條管線。我有意收窄宣稱:即使「能力本位」不全然等於標註、也不是每家應用 AI 本科都通向 Mercor,一旦評量與出口被同一套平台邏輯收編,兩者的邊界仍會比課程簡章上寫的更薄。
能力本位評量不是新東西—1960 年代起就在護理、職業教育裡存在。能力本位本身不是原罪;問題在於誰握有評量權、評量產出最後流進哪一條供應鏈。
傳統路線裡,評量者是受訓教師:他們閱讀學生作品時帶著「這個學生這學期狀態如何」的縱貫脈絡——那才是許多專業職類裡「不走向標註」的能力本位實作。
Khan-TED 跟 ETS(美國教育測驗服務社,托福與 GRE 的主辦機構)合作的版本,評量者是綁在大型語言模型上的評分規準—它一次只檢視作品集裡的一個項目,沒有縱貫脈絡,但有「跨萬人標準化」的優勢。
同一套「大型語言模型+評分規準」拿來評學生的作品集,跟拿來評 Mercor(為科技大廠提供 AI 訓練資料與專家標註的代工平台)標註工人上交的任務完成紀錄,底層是同一類技術堆疊。
差別只在前者每幾年產出一張學位證書,後者每幾分鐘產出一筆訓練資料。同一套評量基礎設施,被部署在勞動鏈的兩端。
Khan-TED 跟 ETS 要把「可長期帶著走的軟實力」(溝通、協作、創造力這類)量化驗證—名目上可以叫教育創新;骨子裡卻是把標註勞工「20 分鐘給出諮商建議」的勞動結構,提前往上移到大學端:學生繳交作品集,工人繳交任務完成紀錄,審閱端越來越常是同一套評分規準。
$10K vs $100K = Mercor 的時薪曲線高教版
這節標題寫得像全稱命題,但先把範圍說死:我不是主張「所有平價應用 AI 學位都必定把人養成 Mercor 預備軍」;我是描述一條在公開文件裡已可被拼出來的激勵鏈—當學位核心是可切片、可驗證的任務輸出,而產業夥伴高度重疊於模型與標註採購端(見下一節),出口就更容易長得像 Jen 那條時薪鋸齒的高教翻版。Khan-TED 只是目前把這組張力寫得最清楚的樣本之一。
Karen Hao 調查影片裡,常春藤博士 Jen 在求職社群平台 LinkedIn 上看到 Mercor 徵才:時薪 $55,公司名叫 Mercor;Karen 後來還自己接了同一份工作裡的 AI 面試,做交叉驗證。Jen 的時薪曲線發生在 Mercor 上—這裡必須跟 Scale AI 旗下的標註平台 Outlier 分開:兩邊在報導裡扮演不同角色,混用會被熟讀這支報導的讀者抓到。
Jen 是常春藤博士。去年畢業前的兩週,第一份 Mercor 合約被切斷;那個月她在食物券、跟姐姐合住、$15 時薪代課三件事之間維生。一個月後 Mercor 第二份合約來了,時薪降到 $45。
她試圖議價—已讀不回。再幾個月後,$35。
她簽了—「即便去年的我會覺得這簡直是侮辱」。最後一份 $101,她跟學校請假衝刺 40 小時——任務隔天就被砍。
這條曲線發生在 12 個月內。$55 到 $101 看起來像進步,但中間夾著 $45、$35 和兩次合約消失。它比較像一條被精心設計的「讓你以為自己在前進」的不規則波形,而不是職涯。
中後段大學的學費與生存曲線,正在進入同一個鋸齒:學費比 Khan-TED 貴上一個數量級,卻證明不了同比例的學習成果,家長先用錢投票質問;校方降價回應後研究投入萎縮,溢價更難論證;接著為了維持招生塞進「就業導向課程」,賽道愈來愈像 Khan-TED,卻得用對方的規則競賽——對手還握著品牌、ETS 認證與 McKinsey 背書。
中後段大學的對位版本可以再往下長一層:第一年招生人數還行($55),第二年系所開始裁併($45),第三年校方推「跟某 AI 大廠合作的應用 AI 學程」搶人($35——但你簽了,因為不走這條去年的你會覺得更侮辱),第四年突然有一個「我們畢業生進了 Anthropic」的案例衝上新聞稿($101)——隔年那個學程被靜悄悄合併進通識中心。
Jen 在這條曲線上是被個別榨取的工人。中後段大學在這條曲線上是被集體榨取的機構。
這跟 Jen 議價 $55 遭「已讀不回」之後簽 $35 的過程是同一個結構:一旦你被定位成「可替代的供給端」,所有議價動作都讓你更快往下走。
末端的爆衝(突然出現的「明星畢業生案例」)比較像控制機制,不像慷慨。它讓你相信留在賽道上有意義,於是你打亂全部生活去衝刺—直到隔天合約被收回,或者科系被裁撤。
這條鋸齒也很少是「個人做錯決策」的結果。更像是勞動經濟學說的價格發現在這裡被做成單邊平台:時薪並非透過穩定的勞資議價「談出來」,而往往由平台規則、撮合演算法,以及供給端彼此競價的過剩專家共同「發現」—發現的結果通常有利於買方。Gray 與 Suri 在《Ghost Work》裡描寫的隱形外包鏈,正是在這種結構裡:表面上你是獨立承包商,實際上長期議價籌碼被切碎。
把鏡頭轉到中後段大學:學費壓力與排名敘事,同樣會把學校推向「市場會替你決定你值多少」—招生與就業辦公室多半只能在這條鋸齒裡調預算、改文案、換合作廠牌,卻很難改變曲線本身的形狀,更少有空間慢慢論證「我們獨特的價值主張是什麼」。
Jen 的故事因此不只是道德憤怒的素材:個別行政單位無法靠勤奮扭轉整條波形,正如平台上的前段履歷也很難靠自律逃出同一套機制。
產業夥伴名單 = 預先寫好的買家清單
Khan-TED 的企劃書裡有一段最值得拿放大鏡看:
企業參與度高:Google、Microsoft、Accenture、Bain、McKinsey、Replit 等作為「思想/產業夥伴」,協助定義能力指標與專題。
把這份名單跟科技巨頭的現況對照:
Google / Microsoft:模型提供方。它們需要的不是被雇主,是訓練語料供給端。
Accenture / Bain / McKinsey:諮詢業。它們是 AI 取代初階職缺最積極的公司,過去兩年大砍畢業生招募的就是這幾家。
Replit:主打「邊聊邊生出程式」的線上開發環境。它把「寫程式」重新定義成「跟 AI 對話」。
這份名單裡,沒有任何一家公司是「會給 Khan-TED 畢業生穩定中階職涯」的雇主。它們都是把「中階」這個位置抽掉的人。
它們參與「定義能力指標」,意思是它們在替自己未來的標註語料規格簽合約—而學生付學費來生產這份規格。能力指標是被選擇的,不是學科自然演化的。誰選?付得起最多錢、又最想自動化這些能力的人。
這份名單裡的公司還有一個共同身份沒被寫出來—它們同時是 Mercor 與 Scale AI 生態系的主要客戶端:McKinsey、Bain、Accenture 會採購標註服務來訓練自家或客戶端的行業模型;Google、Microsoft 在多項公開報導裡反覆出現在 Scale AI 買家敘事的前列。
這份「定義能力指標」的名單,跟「採購專家標註語料」的名單,在實體層高度重疊。它們在 Khan-TED 端定義要學生掌握什麼能力,在 Mercor/Scale 端採購這些能力被標註化後的語料—兩個動作之間的中介者往往是學生本人。學生付學費學能力,畢業後到 Mercor 等平台標註同類能力,最後語料被同一批公司買回去。
這就是迴圈閉合的時刻。學生繞了一圈,把自己變成了一份「能力被買兩次」的商品:第一次是 $10K 的學費(付給學校),第二次是 $35 的時薪(公司付給工人)。中間的差價是誰賺走,不需要再多解釋。
成人就業的殘酷對照—留言區裡的「未來預演」
在 Karen Hao 揭露 AI 隱形工作者的調查影片(YouTube)下方,累積了超過 6,000 則留言。這些留言不僅是網民的憤怒,更是中後段大學畢業生即將面對的「成人就業真實對照」。
為什麼留言區值得當證據看?鏡頭前的版本經過表演與剪輯;匿名留言區更接近「揭示偏好」—別看人嘴上說什麼,要看人在無署名時願意為哪種判斷按讚、留言、接力擴散。Karen 採訪 Jen 時,Jen 仍要求匿名,因為「我高度懷疑他們會希望這些資訊公開」。留言區是匿名的下一層—那些被鏡頭漏掉、但活在同一條供應鏈裡的人,用自己的方式確認報導屬實。下文摘的三則只是樣本;它們之所以能代表什麼,是因為整池輿論反覆敲在同一組主題上。
當大學把學生訓練成「能精準解題的任務包」,他們進入的勞動市場長這樣:
“These are the ‘new jobs’ the AI-class promised us.”(這就是 AI 階級承諾給我們的「新工作」。)
“People with PhD’s working min wage jobs is absolutely a sign of a crumbling society.”(擁有博士學位的人做著最低薪的工作,絕對是社會崩壞的標誌。)
“The real AGI was the underpaid contractors we ignored along the way.”(真正的 AGI,是我們一路上忽視的廉價外包工。)
這句話可以再多拆一層。表層是反諷—通用人工智慧(業界常縮寫 AGI)被吹噓多年,真正的貢獻卻來自廉價外包工。底層更狠:它在語法上偷換了主詞。
{合作廣告}
🧑🎓 UX 訂閱制學習計劃:把 human-in-the-loop 變成你的日常。這也是我會特別推薦 #UX訂閱制學習計劃 的原因:它不是一次性的 bootcamp,而是把借位、補位、入位拆開來,串成 3 月到 12 月的一條學習軸線。透過每月 Podcast 和專欄,先向不同領域的 UX / 產品 / AI / 服務設計講師「借位」
透過直播與 Circle 社群討論,在你的真實案子與問題上進行「補位」
當科技公司執行長說某個新版本 GPT 達到「博士級」時,主詞是模型;當留言者改寫成「真正的 AGI 是廉價外包工」,主詞變回了人—而且是一群被命名為承包商以掩蓋勞工身份的人。它超出單純憤怒,落在語法層的反擊。
這些留言點破了一個殘酷的現實:在「專家標註」的生態系裡,學歷的溢價已經被抹平。當一個擁有常春藤博士學位的成年人,都必須在 Mercor 這類平台上為了 $35 的時薪被隨意停權、甚至被迫與低薪國家的計件工競爭時,一個拿著「應用 AI 學位」的中後段大學畢業生,憑什麼認為自己能獲得穩定的中產階級職涯?
這就是「自毀式困局」:學生付學費訓練自己成為 AI 的語料,畢業後成為廉價的標註承包商,親手訓練出最終將取代自己的模型。
對局內人來說,這個困局的時間感不一樣:你多半早就身在鏈上;每多接一個專案,位置往往再往下沉一格。先把「進不進」放一邊,問「此刻卡在鏈上的哪一段,還有哪個方向的摩擦力可用」。
要解開的誤區:「我的孩子不一樣」—許多亞洲家長最後一道心理防線。
第四節讀完之後,他講了一句我每次聽到都會停頓的話:「Jen 那個故事我聽了很心疼。但我兒子不一樣—他從小自學,會做提示工程,他不會走到那一步。」
這句話我必須認真回。
「你說『他不一樣』,我相信。但你聽我描述一下 Jen 是什麼樣的人—常春藤博士,畢業前一年開始找工作,投了 200 份履歷拿到 3 個面試。她不是 Karen 為了戲劇效果挑出來的弱者;她在統計學意義上就是『條件最好的那 5%』。這 5% 的人都被丟進 $35 時薪的鋸齒曲線—你兒子要勝出的不是 95%,是這頂尖 5% 裡的另外幾位。」
「他從小就是班上最前面那一撮。」






