AI教父吳恩達：不要花時間定義AI代理；開發者還是很重要

在人工智慧快速發展的時代，每當吳恩達（Andrew Ng）發聲，科技界總是豎起耳朵聆聽。這位Coursera共同創辦人、前Google Brain研究科學家、Stanford大學教授，近期在LangChain會議上的爐邊談話，再次展現了他對AI技術發展的深刻洞察。從重新定義AI Agent概念，到企業應用的實務挑戰，再到被市場低估的技術趨勢，吳恩達用他一貫的務實角度，為我們描繪了AI發展的真實圖景。

這場與LangChain創辦人Harrison Chase的對話，不僅回顧了兩人在AI Agent領域的合作歷程，更重要的是，吳恩達分享了他在Deep Learning.AI以及AI Fund工作中累積的寶貴經驗。從技術實作到創業投資，從程式設計教育到企業轉型，這場談話涵蓋了AI產業發展的各個面向。

從「Agent」到「Agentic」的思維轉換

在AI Agent概念逐漸普及的今天，吳恩達提出了一個重要的觀點轉換。他回憶起約一年半前，當時許多人熱衷於討論「這到底算不算是一個Agent」，爭論系統是否具備真正的自主性。吳恩達認為，這樣的爭論雖然有其價值，但可能讓社群把時間花在錯誤的地方。

「與其爭論某個系統是否為真正的Agent，不如說所有這些都是具有不同自主性程度的Agentic系統。」吳恩達解釋，無論是具備少量自主性還是大量自主性的系統，都有其存在價值。這種思維轉換成功地減少了社群在定義問題上的時間消耗，讓開發者能專注於實際應用的建構。

這個「Agentic」概念的提出，反映了吳恩達一貫的務實態度。他不追求純理論的完美定義，而是關注如何讓技術更好地服務實際需求。正如他所說：「讓我們稱呼它們為Agentic系統，然後繼續前進。」這種實用主義的思維，也成為他後續所有觀點的基礎。

線性工作流程才是主流應用

儘管複雜的多Agent系統經常成為學術討論的焦點，吳恩達在實務工作中觀察到一個有趣的現象：大多數商業機會其實來自相對簡單的線性工作流程。他的團隊確實會使用LangGraph來處理最困難的問題，但更多時候，企業面臨的是「相當線性的工作流程，或是只有偶爾分支的線性流程」。

吳恩達舉例說明：「現在有人在網站上查看表單，進行網路搜尋，檢查資料庫以確認是否有合規問題，或是否有不該販售特定商品給某些人的限制。這是一種複製貼上的過程，可能需要再做一次網路搜尋，然後貼到不同的表單中。」這些看似簡單的商業流程，實際上蘊藏著巨大的自動化潛力。

然而，將這些人工流程轉換為Agentic工作流程並非易事。吳恩達指出，最大的挑戰在於決定「應該以什麼粒度將任務分解為微任務」，以及當初始原型效果不佳時，「應該改進哪些步驟來提升整體效能」。這種技能組合——如何觀察人們正在做的事情，將其分解為順序步驟，加入少量分支，建立評估系統——仍然相當稀缺。

這個觀察提醒我們，在追求技術前沿的同時，不應忽視解決實際問題的重要性。許多企業真正需要的，可能不是最複雜的AI系統，而是能夠可靠執行日常任務的簡單自動化解決方案。

從「人眼評估」到自動化測試

在Agent系統開發過程中，評估系統的建立是一個經常被忽視但極為重要的環節。吳恩達坦承，雖然很多人談論評估系統，「但出於某種原因，人們並不真的去做」。他認為問題在於大家把建立評估系統想像成「必須完成的巨大工程」。

吳恩達的做法截然不同。他把評估系統當作「我要快速組裝的東西，可能只需要20分鐘，雖然不是很好，但可以開始補充我的人眼評估」。當系統中某個問題持續出現回歸現象——以為修好了卻又壞掉，這種循環讓人沮喪時，他會快速編寫一個簡單的評估系統，可能只有五個輸入範例和一些簡單的LLM評判機制，專門檢查這一個回歸問題。

重要的是，這種評估系統並非要完全取代人工評估，而是作為補充。「我仍然會親自查看輸出結果，但當我改變某些東西時，我會執行這個評估，減輕我的負擔。」這種漸進式的改善方法，讓評估系統從「勉強有用但明顯很破爛」的狀態，逐步發展成更完善的工具。

這種方法的智慧在於降低了開始的門檻。就像我們建立應用程式時，通常從一個「非常快速且粗糙、無法運作的東西」開始，然後逐步改善。評估系統的建立也應該遵循同樣的原則：先有一個不完美但能運作的版本，再持續優化。

語音AI與標準化協定的潛力

在討論被低估的技術趨勢時，吳恩達特別強調了語音技術堆疊的巨大潛力。他觀察到一個有趣的現象：雖然他本人、朋友們以及許多大型企業都對語音應用感到興奮，「開發者社群對語音堆疊應用的關注程度，感覺比我看到的大型企業重要性以及即將推出的應用要小得多」。

吳恩達特別指出，有效的語音應用並非全部仰賴即時語音API或原生音訊模型。事實上，他發現這些模型「很難控制」。相反地，當使用更多Agentic語音堆疊工作流程時，「我們發現這種方法更容易控制」。

為了解決語音應用中的延遲問題，吳恩達的團隊開發了創新的解決方案。以他與HeyGen合作建立的Avatar為例，初始版本有5到9秒的延遲，「這是糟糕的用戶體驗」。他們因此建立了「預回應」機制，就像人們在被問問題時會說「嗯，這很有趣」或「讓我想想」一樣，讓AI也能用這種方式隱藏延遲。甚至在客服聊天機器人中，播放客服中心的背景噪音而非死寂，也能讓用戶更能接受延遲。

在標準化方面，吳恩達高度肯定了MCP（Model Context Protocol）的價值。這個協定解決了AI開發中的一個重要痛點：資料整合。他指出，當前開發AI應用時，團隊往往花費大量時間處理「管線工程」——將正確的上下文提供給模型。MCP標準化了與各種工具和資料來源的介面，從「n個模型或Agent與m個資料來源需要n×m的努力」降低到「n+m的努力」。

「Vibe Coding」背後的深度思考

AI輔助程式設計的普及，催生了「Vibe Coding」這個新詞彙。但吳恩達對這個名稱並不滿意，認為它「誤導很多人以為只要跟著感覺走，接受這個，拒絕那個」。事實上，當他使用AI程式設計助手工作一整天後，「坦白說，一天結束時我已經精疲力盡。這是深度的智力活動」。

這個現象反映了一個更深層的趨勢。吳恩達強烈反對過去一年中一些人建議「不要學習程式設計，因為AI會自動化程式設計」的觀點。他認為這可能是「有史以來最糟糕的職業建議」。歷史告訴我們，當程式設計變得更容易時，更多人開始程式設計——從打孔卡到鍵盤終端機，從組合語言到COBOL，每一次技術進步都擴大了程式設計師的群體。

「未來開發者和非開發者最重要的技能之一，是能夠準確告訴電腦你想要什麼，讓它為你完成。」吳恩達強調，理解電腦如何運作，能讓人更精確地提示或指導電腦。這就是為什麼他仍然建議每個人都應該學習一種程式語言，比如Python。

有趣的是，吳恩達本人就是這種趨勢的受益者。作為Python開發者，他現在透過AI輔助，「寫了比以往更多的JavaScript和TypeScript程式碼」。即使在除錯他人為他撰寫的程式碼時，「真正理解錯誤情況是什麼意思，這對我除錯JavaScript程式碼來說非常重要」。

速度與技術深度決定成敗

作為AI Fund的創辦人，吳恩達分享了他在投資和創業方面的獨特觀察。AI Fund是一家創業工作室，專門投資他們共同創辦的公司。在回顧AI Fund的經驗時，吳恩達提出了兩個關鍵的成功預測指標。

「第一個預測新創公司成功的指標是速度。」吳恩達觀察到，很多人從未見過技能精湛的團隊能夠達到的執行速度。這種速度「比較慢的企業所能做的任何事情都要快得多」。這不僅僅是開發速度，而是整體執行和決策的速度。

第二個重要指標是技術知識。吳恩達分析，建立新創公司需要的技能可以分為兩類：行銷、銷售、定價等商業技能，以及技術理解。雖然商業技能同樣重要，但這些知識「已經存在一段時間，所以分布較為廣泛」。相反地，「真正稀缺的知識是如何真正理解技術運作」，因為技術一直在快速發展。

這種觀點反映在AI Fund的投資策略上：「我們非常喜歡與技術深度很強的人合作，他們具備良好的直覺，知道該做什麼、不該做什麼，這讓你的速度快一倍。」相對而言，商業知識雖然重要，但通常「比較容易想出來」。

值得注意的是，吳恩達透露AI Fund的一個有趣特色：每個員工都會程式設計，包括前台接待員、財務長和法律顧問。「這不是要他們成為軟體工程師，他們不是。但在各自的工作職能中，通過學習一點程式設計，他們更能告訴電腦想要做什麼。」這種安排在所有非軟體工程職能中都帶來了有意義的生產力提升。

技術演進中的實務智慧

吳恩達用樂高積木來比喻當前的AI工具生態。他認為，如果只有紫色樂高積木，就無法建造太多有趣的東西。但隨著工具的多樣化——RAG、聊天機器人建構、記憶體處理、評估系統、防護欄等——就像擁有了紅色、黑色、黃色、綠色等不同顏色和形狀的樂高積木。

「當你試圖建造某些東西時，有時你需要那個正確的、奇怪形狀的樂高積木，有些人知道它並能將其插入，完成工作。」但如果你從未建立過特定類型的評估系統，「你可能最終會花費額外的三個月做一些別人曾經做過的事情」。

這種經驗的重要性，在技術快速演進的背景下更加凸顯。例如，由於LLM的上下文記憶體越來越長，「一年半前的RAG最佳實踐在今天已經不太相關了」。過去需要複雜的遞歸摘要和精細的超參數調整，現在「我們只是將更多內容放入上下文中」。RAG並未消失，但超參數調整變得容易得多。