AI 素養與隱私體驗

AI 素養與隱私體驗

[Vibe coding : UX 實作] 從 AGENTS.md 到瀏覽器戰爭:定義 AI Agent「內涵」的協作憲章

From AGENTS.md to the Browser Wars: A Charter for AI Agent Character

GAINSHIN's avatar
GAINSHIN
Aug 29, 2025
∙ Paid
2
1
Share

前言:AGENTS.md 的「美麗陷阱」

最近,由 OpenAI 和 Google 共同推動的 AGENTS.md,在開發者社群中引起了極大的關注。它被譽為「給機器的 README」,旨在為 AI 程式設計 Agent 提供一套標準化的專案指令。表面上看,這似乎是解決 AI 工具碎片化問題的完美方案,一個我們期待已久的統一標準。

参考来源:

  • http://agents.md/

  • https://www.factory.ai/agents-md

  • https://github.com/openai/agents.md

當 Devin、Copilot 等 AI Agent 成為程式開發者的「第二大腦」,一個不大不小的問題也隨之浮現:我們該如何與這些越來越聰明的「數位同事」高效溝通,確保他們不僅能完成任務,更能打造出以人為本的產品?

為了解決設定檔混亂的「巴別塔」問題,OpenAI 與 Google 等巨頭聯手推出了 AGENTS.md。表面上看,這似乎是我們期待已久的萬靈丹。

但我認為,它其實是一個「陷阱」。

它用一個看似簡單的標準,讓我們誤以為只要填個表單,就能解決 AI 開發的根本難題。開發者的第一反應可能是:「又來一個 .md 檔案?這真的能解決問題,還是只是另一個需要維護的負擔?」

我的觀點是:AGENTS.md 的價值完全不在於檔案本身,而在於它迫使我們去建立一套全新的、結合了 UX、敏捷開發和 Prompt Engineering 的工作流程。如果你只是把它當成另一個設定檔來寫,那它注定會失敗。

本文將深入探討,如何利用這個「陷阱」,將 AGENTS.md 從一份簡單的指令集,升級為定義 AI 核心「內涵」的協作章程。


為何 CONTRIBUING.md 不夠用?Agent 需要的是原則,不是步驟

我深入研究後發現社群最大的爭議點在於:既然 LLM 這麼強,為何不直接優化給人類看的 CONTRIBUTING.md?

答案藏在 AGENTS.md 的核心設計理念中:它提供了一套可執行的約束 (enforceable constraints)。它不只是一份靜態的說明書,而是一個動態的操作手冊,能將 AI Agent 固有的非確定性行為,嵌入到一個確定性、可預測的軟體開發流程中。例如,它會強制 AI 在提交程式碼前,必須完成 Linting、型別檢查和測試。

這實際上是將 AI 從一個單純的「程式碼生成器」,轉變為一個能理解並執行整個「開發工作流」的自主實體。也正因如此,一份給人類看的 CONTRIBUTING.md 遠遠不夠。


必然的分裂:平台戰爭的序幕

當我以為我們終於找到一條通往標準化的清晰路徑時,一個巨大的矛盾浮現了:如果 AGENTS.md 這麼好,為什麼各大巨頭——包括最初的參與者——都在推出自己的版本?

這不是標準化失敗的跡象。我認為,這是下一場平台戰爭的序幕。


表面:解決真實痛點,實質:構建護城河

不可否認,AGENTS.md 的出現,確實解決了開發者的真實痛點。在此之前,AI 開發工具的配置文件呈現極度碎片化的狀態:

  • Cursor 使用 .cursorrules

  • Claude Code 要求 CLAUDE.md

  • Gemini CLI 需要 GEMINI.md

  • 其他工具還有各種 .agentrc

這種混亂迫使開發者為每個 AI 工具維護不同的設定,創造了巨大的維護負擔。也因此,當 OpenAI 將 agents.md 域名收購並宣布為「廠商中立」標準時,社群反應熱烈——至今,GitHub 上已有超過 20,000 個開源專案採用了此格式。

然而,在這片罕見的產業「團結」景象之下,隱藏著更深層的策略考量。


深層:技術、商業與安全的三角制衡

巨頭們各自推出標準的根本原因,是在技術、商業和安全三個維度上進行的一場精妙的權力遊戲。

1. 技術的必然性:從單一指令到複雜協作

AGENTS.md 的簡潔性是其優點,也是其極限。它無法承載日益複雜的 AI 開發需求,這催生了各種「變體」:

  • Google 的 GEMINI.md:為了解決大型專案 (monorepos) 中單一 AGENTS.md 過於臃腫、浪費 tokens 的問題,Google 設計了階層式的 GEMINI.md 結構,讓 Agent 能更精準地載入相關上下文。

  • Anthropic 生態的 CLAUDE.md:在社群驅動下,CLAUDE.md 成為複雜「多代理協作」的實施指南,協調產品經理、UX 設計師、程式碼等多個 Agent 共同工作,這是單一 AGENTS.md 無法處理的。

更深層次地,這些變體是為了支援更底層的協議戰爭,如 Anthropic 的模型上下文協議 (MCP) 和 Google 的代理對代理協作協議 (A2A),這些都需要專有的、更詳細的配置檔案來承載。

2. 商業的陽謀:標準化下的生態系戰爭

巨頭們的策略並非拋棄標準,而是在開放標準的基礎上尋求差異化,這是「佔領工作流」的陽謀。透過提供 GEMINI.md 的階層式上下文管理,或 CLAUDE.md 的多代理協作指南,他們讓開發者在其生態系內能實現更強大的功能。這大大提高了開發者的「轉換成本」,一旦習慣了特定工具的高級功能,就很難轉向其他平台,從而實現了生態系的鎖定。

3. 安全的底線:不可妥協的信任與控制

最後,也是最關鍵的,是安全。在企業級應用中,最小權限原則 (Principle of Least Privilege) 和 沙盒化 (Sandboxing) 是不可妥協的底線。如何為 Agent 配置 Docker 沙盒環境?如何管理動態的、即時的權限?這些高度依賴特定工具和平台的實施細節,無法用一份通用的 AGENTS.md 來定義。因此,專有文件成了確保信任與控制的必要載體。

所以,我們必須接受這個現實:分裂是必然的。這也讓如何寫好一份 agents.md 的「原則」,變得比爭論哪個「版本」更好,來得更加重要。這就帶我們回到了核心問題。


AI Agent 的「內涵」如何定義?一份給開發者的 AIPET 轉譯指南

這就引出了我思考的核心:一個好的 AI Agent 到底意味著什麼?它遠不止是高效執行任務這麼簡單,更需要交付優質的代理式使用者體驗 (Agentive UX)——使用者明確地將意圖 (intent) 授權給 AI,由 AI 作為使用者的代理人來完成目標。

但如何將「好的 UX」這個抽象概念,轉化為可執行的工程指令?我的方法是,將 AIPET 設計框架,轉譯成我們開發者都熟悉的軟體工程原則:

Keep reading with a 7-day free trial

Subscribe to AI 素養與隱私體驗 to keep reading this post and get 7 days of free access to the full post archives.

Already a paid subscriber? Sign in
© 2025 PrivacyUX consulting Ltd.
Privacy ∙ Terms ∙ Collection notice
Start your SubstackGet the app
Substack is the home for great culture