AI教父吳恩達:不要花時間定義AI代理;開發者還是很重要

在人工智慧快速發展的時代,每當吳恩達(Andrew Ng)發聲,科技界總是豎起耳朵聆聽。這位Coursera共同創辦人、前Google Brain研究科學家、Stanford大學教授,近期在LangChain會議上的爐邊談話,再次展現了他對AI技術發展的深刻洞察。從重新定義AI Agent概念,到企業應用的實務挑戰,再到被市場低估的技術趨勢,吳恩達用他一貫的務實角度,為我們描繪了AI發展的真實圖景。
這場與LangChain創辦人Harrison Chase的對話,不僅回顧了兩人在AI Agent領域的合作歷程,更重要的是,吳恩達分享了他在Deep Learning.AI以及AI Fund工作中累積的寶貴經驗。從技術實作到創業投資,從程式設計教育到企業轉型,這場談話涵蓋了AI產業發展的各個面向。
從「Agent」到「Agentic」的思維轉換
在AI Agent概念逐漸普及的今天,吳恩達提出了一個重要的觀點轉換。他回憶起約一年半前,當時許多人熱衷於討論「這到底算不算是一個Agent」,爭論系統是否具備真正的自主性。吳恩達認為,這樣的爭論雖然有其價值,但可能讓社群把時間花在錯誤的地方。
「與其爭論某個系統是否為真正的Agent,不如說所有這些都是具有不同自主性程度的Agentic系統。」吳恩達解釋,無論是具備少量自主性還是大量自主性的系統,都有其存在價值。這種思維轉換成功地減少了社群在定義問題上的時間消耗,讓開發者能專注於實際應用的建構。
這個「Agentic」概念的提出,反映了吳恩達一貫的務實態度。他不追求純理論的完美定義,而是關注如何讓技術更好地服務實際需求。正如他所說:「讓我們稱呼它們為Agentic系統,然後繼續前進。」這種實用主義的思維,也成為他後續所有觀點的基礎。
線性工作流程才是主流應用
儘管複雜的多Agent系統經常成為學術討論的焦點,吳恩達在實務工作中觀察到一個有趣的現象:大多數商業機會其實來自相對簡單的線性工作流程。他的團隊確實會使用LangGraph來處理最困難的問題,但更多時候,企業面臨的是「相當線性的工作流程,或是只有偶爾分支的線性流程」。
吳恩達舉例說明:「現在有人在網站上查看表單,進行網路搜尋,檢查資料庫以確認是否有合規問題,或是否有不該販售特定商品給某些人的限制。這是一種複製貼上的過程,可能需要再做一次網路搜尋,然後貼到不同的表單中。」這些看似簡單的商業流程,實際上蘊藏著巨大的自動化潛力。

然而,將這些人工流程轉換為Agentic工作流程並非易事。吳恩達指出,最大的挑戰在於決定「應該以什麼粒度將任務分解為微任務」,以及當初始原型效果不佳時,「應該改進哪些步驟來提升整體效能」。這種技能組合——如何觀察人們正在做的事情,將其分解為順序步驟,加入少量分支,建立評估系統——仍然相當稀缺。
這個觀察提醒我們,在追求技術前沿的同時,不應忽視解決實際問題的重要性。許多企業真正需要的,可能不是最複雜的AI系統,而是能夠可靠執行日常任務的簡單自動化解決方案。
從「人眼評估」到自動化測試
在Agent系統開發過程中,評估系統的建立是一個經常被忽視但極為重要的環節。吳恩達坦承,雖然很多人談論評估系統,「但出於某種原因,人們並不真的去做」。他認為問題在於大家把建立評估系統想像成「必須完成的巨大工程」。
吳恩達的做法截然不同。他把評估系統當作「我要快速組裝的東西,可能只需要20分鐘,雖然不是很好,但可以開始補充我的人眼評估」。當系統中某個問題持續出現回歸現象——以為修好了卻又壞掉,這種循環讓人沮喪時,他會快速編寫一個簡單的評估系統,可能只有五個輸入範例和一些簡單的LLM評判機制,專門檢查這一個回歸問題。
重要的是,這種評估系統並非要完全取代人工評估,而是作為補充。「我仍然會親自查看輸出結果,但當我改變某些東西時,我會執行這個評估,減輕我的負擔。」這種漸進式的改善方法,讓評估系統從「勉強有用但明顯很破爛」的狀態,逐步發展成更完善的工具。
這種方法的智慧在於降低了開始的門檻。就像我們建立應用程式時,通常從一個「非常快速且粗糙、無法運作的東西」開始,然後逐步改善。評估系統的建立也應該遵循同樣的原則:先有一個不完美但能運作的版本,再持續優化。
語音AI與標準化協定的潛力
在討論被低估的技術趨勢時,吳恩達特別強調了語音技術堆疊的巨大潛力。他觀察到一個有趣的現象:雖然他本人、朋友們以及許多大型企業都對語音應用感到興奮,「開發者社群對語音堆疊應用的關注程度,感覺比我看到的大型企業重要性以及即將推出的應用要小得多」。
吳恩達特別指出,有效的語音應用並非全部仰賴即時語音API或原生音訊模型。事實上,他發現這些模型「很難控制」。相反地,當使用更多Agentic語音堆疊工作流程時,「我們發現這種方法更容易控制」。
為了解決語音應用中的延遲問題,吳恩達的團隊開發了創新的解決方案。以他與HeyGen合作建立的Avatar為例,初始版本有5到9秒的延遲,「這是糟糕的用戶體驗」。他們因此建立了「預回應」機制,就像人們在被問問題時會說「嗯,這很有趣」或「讓我想想」一樣,讓AI也能用這種方式隱藏延遲。甚至在客服聊天機器人中,播放客服中心的背景噪音而非死寂,也能讓用戶更能接受延遲。
在標準化方面,吳恩達高度肯定了MCP(Model Context Protocol)的價值。這個協定解決了AI開發中的一個重要痛點:資料整合。他指出,當前開發AI應用時,團隊往往花費大量時間處理「管線工程」——將正確的上下文提供給模型。MCP標準化了與各種工具和資料來源的介面,從「n個模型或Agent與m個資料來源需要n×m的努力」降低到「n+m的努力」。
「Vibe Coding」背後的深度思考
AI輔助程式設計的普及,催生了「Vibe Coding」這個新詞彙。但吳恩達對這個名稱並不滿意,認為它「誤導很多人以為只要跟著感覺走,接受這個,拒絕那個」。事實上,當他使用AI程式設計助手工作一整天後,「坦白說,一天結束時我已經精疲力盡。這是深度的智力活動」。
這個現象反映了一個更深層的趨勢。吳恩達強烈反對過去一年中一些人建議「不要學習程式設計,因為AI會自動化程式設計」的觀點。他認為這可能是「有史以來最糟糕的職業建議」。歷史告訴我們,當程式設計變得更容易時,更多人開始程式設計——從打孔卡到鍵盤終端機,從組合語言到COBOL,每一次技術進步都擴大了程式設計師的群體。

「未來開發者和非開發者最重要的技能之一,是能夠準確告訴電腦你想要什麼,讓它為你完成。」吳恩達強調,理解電腦如何運作,能讓人更精確地提示或指導電腦。這就是為什麼他仍然建議每個人都應該學習一種程式語言,比如Python。
有趣的是,吳恩達本人就是這種趨勢的受益者。作為Python開發者,他現在透過AI輔助,「寫了比以往更多的JavaScript和TypeScript程式碼」。即使在除錯他人為他撰寫的程式碼時,「真正理解錯誤情況是什麼意思,這對我除錯JavaScript程式碼來說非常重要」。
速度與技術深度決定成敗
作為AI Fund的創辦人,吳恩達分享了他在投資和創業方面的獨特觀察。AI Fund是一家創業工作室,專門投資他們共同創辦的公司。在回顧AI Fund的經驗時,吳恩達提出了兩個關鍵的成功預測指標。
「第一個預測新創公司成功的指標是速度。」吳恩達觀察到,很多人從未見過技能精湛的團隊能夠達到的執行速度。這種速度「比較慢的企業所能做的任何事情都要快得多」。這不僅僅是開發速度,而是整體執行和決策的速度。
第二個重要指標是技術知識。吳恩達分析,建立新創公司需要的技能可以分為兩類:行銷、銷售、定價等商業技能,以及技術理解。雖然商業技能同樣重要,但這些知識「已經存在一段時間,所以分布較為廣泛」。相反地,「真正稀缺的知識是如何真正理解技術運作」,因為技術一直在快速發展。

這種觀點反映在AI Fund的投資策略上:「我們非常喜歡與技術深度很強的人合作,他們具備良好的直覺,知道該做什麼、不該做什麼,這讓你的速度快一倍。」相對而言,商業知識雖然重要,但通常「比較容易想出來」。
值得注意的是,吳恩達透露AI Fund的一個有趣特色:每個員工都會程式設計,包括前台接待員、財務長和法律顧問。「這不是要他們成為軟體工程師,他們不是。但在各自的工作職能中,通過學習一點程式設計,他們更能告訴電腦想要做什麼。」這種安排在所有非軟體工程職能中都帶來了有意義的生產力提升。
技術演進中的實務智慧
吳恩達用樂高積木來比喻當前的AI工具生態。他認為,如果只有紫色樂高積木,就無法建造太多有趣的東西。但隨著工具的多樣化——RAG、聊天機器人建構、記憶體處理、評估系統、防護欄等——就像擁有了紅色、黑色、黃色、綠色等不同顏色和形狀的樂高積木。
「當你試圖建造某些東西時,有時你需要那個正確的、奇怪形狀的樂高積木,有些人知道它並能將其插入,完成工作。」但如果你從未建立過特定類型的評估系統,「你可能最終會花費額外的三個月做一些別人曾經做過的事情」。
這種經驗的重要性,在技術快速演進的背景下更加凸顯。例如,由於LLM的上下文記憶體越來越長,「一年半前的RAG最佳實踐在今天已經不太相關了」。過去需要複雜的遞歸摘要和精細的超參數調整,現在「我們只是將更多內容放入上下文中」。RAG並未消失,但超參數調整變得容易得多。