陪讀引導
前面三篇處理 agent 怎麼被配置與拆分;第四章直接面對產品上線後最現實的事:哪些地方不能讓 agent 自己過。
這一季的陪讀主書是《Patterns for Building AI Agents》。Riker 的〈Designing for Agents〉不是本季陪讀對象,而是一副鏡片:它讓我們在讀每個 pattern 時,都多問一句「這個 agent 行為在產品和組織裡,最後能不能被管」。
本章在解決什麼
完全自主的 demo 很迷人,但真實產品裡,高風險任務通常需要暫停、澄清、審核或批准。問題不是要不要有人,而是人在哪個節點進來、看到什麼、要負什麼責任。
對 UX / PM / 工程來說,這類問題最麻煩的地方在於:它不像傳統功能規格,只要畫出流程就好。Agent 會替人行動、調用工具、跨資料源推理,所以設計對象從「使用者看到什麼」擴張成「系統如何替使用者行動,以及行動後留下什麼證據」。
《Patterns》本章要點
Human-in-the-Loop 可以是執行中暫停、產出後審核,也可以是延遲工具執行等待批准。
高風險、低信心、不可逆或合規敏感的任務,都需要人類節點。
好的 HITL 不要求人類 babysit 每一步,而是把人放在真正需要判斷的位置。
這章的價值是把「人類介入」從保守態度改寫成產品結構:好的 HITL 不是叫人盯著 agent 每一步,而是在高風險、低信心、不可逆的節點上設計責任接手。
Sam Bhagwat 與 Michelle Gienow 原文
1. HITL 降低的是部署風險
Quote|原文 Sam Bhagwat 與 Michelle Gienow 在 Ch4 開頭先講使用者偏好:有些決策本來就應該由人做。接著,Bhagwat 與 Gienow 把 HITL 放進部署風險:“the risk of deploying agents goes way down when humans can be brought into the loop to review risky or low-confidence output.”
Analysis|這句在說什麼 HITL 不是「模型還不夠好,所以先人工補洞」。它是風險控制設計:當輸出高風險或低信心,人類節點讓產品有機會暫停、修正、拒絕或承擔。
Application|讀者可以怎麼用 在 spec 裡替每種任務標上 risk level 與 confidence threshold。超過門檻才進 HITL,不要把所有事情都丟給人工審,也不要把高風險操作全自動化。
2. Agent 可以補資訊,但最後判斷留給人
Quote|原文 Bhagwat 與 Gienow 接著補上一個更細的定位:agent 可以幫人準備資訊與脈絡,但某些 final call 不該交給它:“agents can augment humans by providing us with information and context, but leaving human judgment to make the final call.”
Analysis|這句在說什麼 這句把 agent 從 decision maker 拉回 decision support。對金融、醫療、法務這類場景,產品價值常常不是「agent 自動做決定」,而是「agent 讓人更快做出可負責的決定」。
Application|讀者可以怎麼用 把流程分成三段:agent 可整理資訊、agent 可建議、agent 可執行。每一段對應不同審核與記錄要求,不要用一個「approve」按鈕混過去。
3. 人可以在工具執行前插入
Quote|原文 在
Solution: Agents and humans taking turns裡,Bhagwat 與 Gienow 引用 12-Factor Agents 的原則,指出 agent 應能在流程任何點暫停請求人類輸入,甚至是:“between tool selection and execution.”Analysis|這句在說什麼 最重要的 HITL 節點不一定在最後輸出前,而是在 agent 已經選好工具、但還沒造成副作用之前。這是產品能攔住不可逆行為的關鍵位置。
Application|讀者可以怎麼用 對所有會寫入、發送、刪除、交易、通知外部人的 tool call,加一個 pre-execution checkpoint。讓審核者看到 agent 想做什麼、為什麼做、會影響誰。
4. Deferred tool execution 比逐步 babysit 更接近現實
Quote|原文 Bhagwat 與 Gienow 列出 in-the-loop、post-processing review 與 deferred tool execution 後,特別指出:“Deferred tool execution might be the HITL pattern most aligned with real-world workflows because humans don’t want to babysit agents in a blocking, step-by-step manner.”
Analysis|這句在說什麼 真實組織裡,人不可能一直坐在 agent 旁邊。好的 HITL 要讓 agent 先準備好工作、排隊等待批准、在背景繼續能做的部分,而不是每一步都卡住。
Application|讀者可以怎麼用 設計 approval queue,而不是只設計 confirmation modal。讓 reviewer 可以批次看、延後回、覆寫、要求重跑,並把每個決定寫進 audit log。
Riker 透鏡
Riker 的五動詞裡,HITL 同時支撐限制與追責。摩擦不是敵人;在高風險 agent 裡,摩擦是責任節點的 UI。
這也是我建議把五動詞放在每篇旁邊的原因:配置讓 agent 能配合任務與角色,觀察讓它的行為能被回放,評估讓好壞有標準,限制讓它不會越界,追責讓錯誤不會消失在「AI 自動做的」這句話裡。
UX / PM / 工程可以拿去做什麼
畫一張 decision ladder:哪些操作可自動、哪些要通知、哪些要確認、哪些必須審批。每層都要寫出使用者看到的訊息與 audit log。
實作時不要只交一份 feature spec。至少補上一個 artifact:一張 map、一份 schema、一個 review checklist,或一個會被 CI / logging / audit 真的用到的欄位定義。Agentic UX 的交付物不只 Figma,還包含讓 agent 行為可被理解、可被測、可被治理的文字與結構。
付費專欄導讀
免費版講 HITL 的設計型態;付費版會處理金融現場最麻煩的那句話:「既然都要人審,那 AI 到底省了什麼?」
Helix 的 HR Helper 準備接第一個高風險流程:員工離職文件摘要與政策建議。Aaron 想減少人工時間,Vincent 要求不可逆動作前必須有人簽。Iris 要設計的不是一個「確認」按鈕,而是一條 decision ladder:
哪些任務可自動完成
哪些任務只需要通知
哪些任務要人類確認
哪些任務必須合規審批
付費版會給一張 HITL decision ladder 樣板,以及 Iris 對 Aaron 的說法:「摩擦不是效率損失;放在正確節點的摩擦,是我們能上線的理由。」
章末思考題
你的 HITL 節點是讓人做真判斷,還是只是把責任丟給使用者按「同意」?
哪些 tool call 一旦執行就不可逆,因此必須在 execution 前停下來?
審核者看到的資訊,足以讓他說明「我為什麼批准」嗎?如果不能,audit log 其實也救不了你。
下一篇預告
下一篇進 Ch05「Parallelize Carefully」。Ch04 把人放回流程,是為了控制高風險節點;Ch05 會處理另一種常見失控:你把任務切給多個 subagent 同時跑,速度變快了,但上下文開始分裂。
如果 HITL 是責任節點,parallelization 就是責任分岔點。下一篇要問:哪些任務真的能平行,哪些只是被你切壞了?
英文參照對應
Human-in-the-Loop:人機協作/人類介入。重點是把人放在需要判斷或批准的節點。risky or low-confidence output:高風險或低信心輸出。通常需要審核、澄清或降級處理。augment humans:增強人類。agent 提供資訊與脈絡,但最後判斷仍由人做。final call:最後決定。高後果場景中,這通常不能完全交給 agent。checkpoint:檢查點。流程中暫停、補充資訊、審核或批准的位置。between tool selection and execution:工具選擇與執行之間。攔截副作用操作的黃金節點。post-processing review:產出後審核。適合草稿、摘要、建議等可修改輸出。deferred tool execution:延遲工具執行。agent 先準備,等人類批准後再執行。
Copyright © PrivacyUX Consulting Ltd. All rights reserved.
Joshua 是 Agentic UX(代理式使用者體驗)的先驅,在人工智能與使用者體驗設計領域擁有超過 15 年的開創性實踐。他率先提出將用戶隱私保護視為 AI 產品設計的核心理念,於 2022 年創立 Privacyux Consulting Ltd. 並擔任首席顧問,積極推動隱私導向的醫療 AI 產品革新。此前,他亦擔任社交 AI 首席策略官(2022-2024),專注於設計注重隱私的情感識別系統及用戶數據自主權管理機制。



