AI 素養與隱私體驗

AI 素養與隱私體驗

[AI 工作] Vibe coding 從 Base44 到 Amazon Kiro,未注入靈魂:新一代「體驗驅動」的品質工程才剛啟動

The Soul in the Machine: How Founder-Infused QA is Saving AI-Generated Code

GAINSHIN's avatar
GAINSHIN
Jul 20, 2025
∙ Paid

當 AI 的創造力如洪水般湧入我們的 IDE,我們最該問的,或許不是「如何更快?」,而是「如何確保快得有價值?」當 AI 能在一分鐘內寫出一百行程式碼,誰來為這一百行程式碼的品質、安全性和靈魂負責?

引言:從 Base44 到 Amazon Kiro,我們在「加速」的迷霧中看見了什麼?

當 Base44 的故事——一個創辦人,六個月,八千萬美金——像野火一樣蔓延時,整個科技圈的空氣都變得稀薄了。這不是一次普通的成功,它像一聲發令槍,宣告了「AI 原生創業者」時代的降臨。我們不再是小步快跑,而是直接躍遷。

[AI 創業] 三重「Aha Moment」:引爆 Base44 與 Lovable 超線性成長的秘密

[AI 創業] 三重「Aha Moment」:引爆 Base44 與 Lovable 超線性成長的秘密

GAINSHIN
·
July 12, 2025
Read full story

正當我們試圖理解這種躍遷時,像 Kiro 這樣的新一代 AI 開發工具出現了。它繼承了我們熟悉的 VS Code 介面,卻引入了「規格導向開發」、「Agent Hooks」等新概念,彷彿在說:「別驚訝,Base44 的神話,即將成為可以被複製的日常。」

Kiro 們的出現,似乎為這場由 Base44 點燃的革命提供了燃料和地圖。它們承諾了更高的效率、更結構化的流程,以及更強大的自動化能力。

但,這就是答案的全部嗎?

這篇文章,將從 Kiro 的務實功能出發,深入探討 TestSprite 2.0 所揭示的 AI 品質保證新範式,並最終結合 AIPET 的組織理念,推論出一個虛實整合的未來——一個人類專注於定義價值,而 AI 負責執行與守護的新世界。


Kiro 的「美麗新世界」...與它的內在矛盾

坦白說,第一次打開 Kiro,我的感覺是「熟悉,但又有點不一樣」。它看起來就像我的老朋友 VS Code,這很好,至少我不用重新學習肌肉記憶。但當我開始跟著它的引導設定專案時,那種熟悉的感覺就消失了。

它逼著我先寫「規格」。

這就是 Kiro 的「規格導向開發」模式。它不是讓你上來就寫程式碼,而是先建立產品規格、技術文件,讓 AI Agent 徹底搞懂「我們到底要做什麼」。我得承認,一開始我有點抗拒。這不就又回到了瀑布式開發的老路嗎?說好的敏捷呢?

但當我看到 AI 根據我設定的規格,一步步生成符合預期的功能,甚至透過 Pexels MCP 伺服器為部落格文章自動抓取並標注圖片來源時,我明白了。這不是倒退,這是必要的「約束」。它用前期的「慢」,換取了後期的「準」,避免了 AI 在程式碼的荒原上自由奔跑,最終卻南轅北轍。

最有意思的是它的 Agent Hooks 功能。你可以設定一個觸發器,比如「當我儲存檔案時,自動觸發 AI 進行安全漏洞掃描」。

這讓我腦中靈光一閃。

這不就是一個 QA Agent 的雛形嗎?一個自動化的、不知疲倦的守護者。雖然 Kiro 本身並未引入驚天動地的技術,但它將現有的 AI 開發理念,用一種更「有紀律」的方式整合了起來。

然而,這也帶來了隱憂。雖然 Kiro 承諾未來會支援更多模型,但目前仍以 Claude 為主。這讓我警惕,我們是否又會陷入被單一模型供應商「綁架」的困境?開發者的自由,不應建立在平台的恩賜之上。

Kiro 的階梯式開發模式,讓我對開發進度有了更清晰的掌控感。但它也逼我思考一個更深層的問題:如果 AI 精準地執行了一個平庸、甚至錯誤的規格,那它產出的不過是一堆「精緻的垃圾」。當規格無法描述用戶體感的「魔法」時,我們又該如何確保 AI 沒有好心辦壞事?

這時候,我們需要的就不只是一個忠實的「執行者」,而是一個擁有「品味」的審判者。


TestSprite 2.0:AI 開發的「反對票」

就在我思考這個問題時,TestSprite 2.0 的影片給了我答案。

影片裡那個數據讓我倒抽一口涼氣:超過 50% 的 AI 生成程式碼無法正常運作。 這個數字比我之前預估的 40% 還要糟。這意味著,如果我們任由 AI 狂飆,我們產出的將是一座華麗的、但隨時可能崩塌的數位巴別塔。

這就是 TestSprite 的切入點,它的 Slogan 堪稱年度最佳:

"Let your AI code, we will make it work."

這句話太聰明了。它沒有把自己定位成另一個 AI 寫作工具的競爭者,而是所有 AI 工具的「賦能者」。你用 Cursor、Kiro、Copilot、Base 44...隨便你用誰,你負責天馬行空地創造,而我,TestSprite,負責讓你的創造「能用」。

它把自己從一個「測試工具」,升級成了「AI 開發的品質基礎設施」。這是一次維度打擊。

影片中展示的 42% -> 93% 的準確率提升,就是它最硬核的價值宣言。這不是空談,而是可以量化的奇蹟。它意味著 AI 寫的程式碼,在經過 TestSprite 的洗禮後,幾乎達到了人類資深工程師的可靠性水準。

怎麼做到的?透過 MCP Server 的原生整合。它不再是一個外部工具,而是直接內嵌在你的 IDE 裡,在你寫完程式碼的下一秒,測試和修正就已經自動完成。這條「從寫作到修復」的反饋迴路,被壓縮到了極致。

這讓傳統測試顯得像個笑話。

  • 傳統測試:寫完程式碼 -> 提交 -> 等待 CI/CD -> 發現 Bug -> 開票 -> 分配任務 -> 修復... 這是一個以「天」為單位的流程。

  • TestSprite:寫完程式碼 -> 瞬間完成。

這不僅僅是效率的提升,這是對「開發者體驗」的重新定義。它把測試從一個令人頭痛的「成本中心」,變成了一個創造價值的「賦能環節」。


未來圖景:當 QA agent 不再是測試,而是 coding 的守門人

好了,現在我們有了一個能確保程式碼「能跑」的 TestSprite,一個能讓開發流程「有序」的 Kiro 或 base 44。

但這就夠了嗎?

User's avatar

Continue reading this post for free, courtesy of GAINSHIN.

Or purchase a paid subscription.
© 2026 PrivacyUX consulting Ltd. · Privacy ∙ Terms ∙ Collection notice
Start your SubstackGet the app
Substack is the home for great culture