[AI 工作] Vibe coding 從 Base44 到 Amazon Kiro，未注入靈魂：新一代「體驗驅動」的品質工程才剛啟動

The Soul in the Machine: How Founder-Infused QA is Saving AI-Generated Code

GAINSHIN

Jul 20, 2025

∙ Paid

當 AI 的創造力如洪水般湧入我們的 IDE，我們最該問的，或許不是「如何更快？」，而是「如何確保快得有價值？」當 AI 能在一分鐘內寫出一百行程式碼，誰來為這一百行程式碼的品質、安全性和靈魂負責？

引言：從 Base44 到 Amazon Kiro，我們在「加速」的迷霧中看見了什麼？

當 Base44 的故事——一個創辦人，六個月，八千萬美金——像野火一樣蔓延時，整個科技圈的空氣都變得稀薄了。這不是一次普通的成功，它像一聲發令槍，宣告了「AI 原生創業者」時代的降臨。我們不再是小步快跑，而是直接躍遷。

[AI 創業] 三重「Aha Moment」：引爆 Base44 與 Lovable 超線性成長的秘密

GAINSHIN

July 12, 2025

Read full story

正當我們試圖理解這種躍遷時，像 Kiro 這樣的新一代 AI 開發工具出現了。它繼承了我們熟悉的 VS Code 介面，卻引入了「規格導向開發」、「Agent Hooks」等新概念，彷彿在說：「別驚訝，Base44 的神話，即將成為可以被複製的日常。」

Kiro 們的出現，似乎為這場由 Base44 點燃的革命提供了燃料和地圖。它們承諾了更高的效率、更結構化的流程，以及更強大的自動化能力。

但，這就是答案的全部嗎？

這篇文章，將從 Kiro 的務實功能出發，深入探討 TestSprite 2.0 所揭示的 AI 品質保證新範式，並最終結合 AIPET 的組織理念，推論出一個虛實整合的未來——一個人類專注於定義價值，而 AI 負責執行與守護的新世界。

Kiro 的「美麗新世界」...與它的內在矛盾

坦白說，第一次打開 Kiro，我的感覺是「熟悉，但又有點不一樣」。它看起來就像我的老朋友 VS Code，這很好，至少我不用重新學習肌肉記憶。但當我開始跟著它的引導設定專案時，那種熟悉的感覺就消失了。

它逼著我先寫「規格」。

這就是 Kiro 的「規格導向開發」模式。它不是讓你上來就寫程式碼，而是先建立產品規格、技術文件，讓 AI Agent 徹底搞懂「我們到底要做什麼」。我得承認，一開始我有點抗拒。這不就又回到了瀑布式開發的老路嗎？說好的敏捷呢？

但當我看到 AI 根據我設定的規格，一步步生成符合預期的功能，甚至透過 Pexels MCP 伺服器為部落格文章自動抓取並標注圖片來源時，我明白了。這不是倒退，這是必要的「約束」。它用前期的「慢」，換取了後期的「準」，避免了 AI 在程式碼的荒原上自由奔跑，最終卻南轅北轍。

最有意思的是它的 Agent Hooks 功能。你可以設定一個觸發器，比如「當我儲存檔案時，自動觸發 AI 進行安全漏洞掃描」。

這讓我腦中靈光一閃。

這不就是一個 QA Agent 的雛形嗎？一個自動化的、不知疲倦的守護者。雖然 Kiro 本身並未引入驚天動地的技術，但它將現有的 AI 開發理念，用一種更「有紀律」的方式整合了起來。

然而，這也帶來了隱憂。雖然 Kiro 承諾未來會支援更多模型，但目前仍以 Claude 為主。這讓我警惕，我們是否又會陷入被單一模型供應商「綁架」的困境？開發者的自由，不應建立在平台的恩賜之上。

Kiro 的階梯式開發模式，讓我對開發進度有了更清晰的掌控感。但它也逼我思考一個更深層的問題：如果 AI 精準地執行了一個平庸、甚至錯誤的規格，那它產出的不過是一堆「精緻的垃圾」。當規格無法描述用戶體感的「魔法」時，我們又該如何確保 AI 沒有好心辦壞事？

這時候，我們需要的就不只是一個忠實的「執行者」，而是一個擁有「品味」的審判者。

TestSprite 2.0：AI 開發的「反對票」

就在我思考這個問題時，TestSprite 2.0 的影片給了我答案。

影片裡那個數據讓我倒抽一口涼氣：超過 50% 的 AI 生成程式碼無法正常運作。 這個數字比我之前預估的 40% 還要糟。這意味著，如果我們任由 AI 狂飆，我們產出的將是一座華麗的、但隨時可能崩塌的數位巴別塔。

這就是 TestSprite 的切入點，它的 Slogan 堪稱年度最佳：

"Let your AI code, we will make it work."

這句話太聰明了。它沒有把自己定位成另一個 AI 寫作工具的競爭者，而是所有 AI 工具的「賦能者」。你用 Cursor、Kiro、Copilot、Base 44...隨便你用誰，你負責天馬行空地創造，而我，TestSprite，負責讓你的創造「能用」。

它把自己從一個「測試工具」，升級成了「AI 開發的品質基礎設施」。這是一次維度打擊。

影片中展示的 42% -> 93% 的準確率提升，就是它最硬核的價值宣言。這不是空談，而是可以量化的奇蹟。它意味著 AI 寫的程式碼，在經過 TestSprite 的洗禮後，幾乎達到了人類資深工程師的可靠性水準。

怎麼做到的？透過 MCP Server 的原生整合。它不再是一個外部工具，而是直接內嵌在你的 IDE 裡，在你寫完程式碼的下一秒，測試和修正就已經自動完成。這條「從寫作到修復」的反饋迴路，被壓縮到了極致。

這讓傳統測試顯得像個笑話。

傳統測試：寫完程式碼 -> 提交 -> 等待 CI/CD -> 發現 Bug -> 開票 -> 分配任務 -> 修復... 這是一個以「天」為單位的流程。
TestSprite：寫完程式碼 -> 瞬間完成。

這不僅僅是效率的提升，這是對「開發者體驗」的重新定義。它把測試從一個令人頭痛的「成本中心」，變成了一個創造價值的「賦能環節」。

未來圖景：當 QA agent 不再是測試，而是 coding 的守門人

好了，現在我們有了一個能確保程式碼「能跑」的 TestSprite，一個能讓開發流程「有序」的 Kiro 或 base 44。

但這就夠了嗎？

Continue reading this post for free, courtesy of GAINSHIN.

Or purchase a paid subscription.

AI 素養與隱私體驗