插圖/艾拉娜.薩金森(Alanah Sarginson)
1940年代末,工程師大野耐一開始發展豐田生產系統(Toyota Production System),以日本的「改善」(kaizen,也就是持續改進)原則為基礎來發展。這套系統在豐田帶來持續不斷的小規模改進,而關鍵的建議都來自製造部門所有層級的員工。豐田沒有投入大膽、創新和高風險的努力,來促使自己所屬的產業產生革命性的變化,而是選擇推動漸進但毫不懈怠的改進。今天它是世界上最大的汽車製造商,而豐田生產系統仍然是管理企業所有流程的模範。一些隨它而出現的著名概念也存在很長一段時間,例如員工賦能、重視持續降低成本、全面品質管理、及時製造、根本原因分析、數據驅動流程,以及符合人性的自動化(jidoka,日文為「自働化」)。
隨著愈來愈多營運作業的數位化,由生成式AI和其他先進科技增強的「改善」,再次重塑了流程管理。自然語言介面等功能的出現,使非技術員工也能使用生成式AI,因此「改善」同時推動了大規模和小規模的流程變革。在AI的協助下,員工能夠綜合各種數據,包括非結構化數據。他們可以將曾經難以理解的大量數字資訊轉化為見解,並依據這些見解來改進工作流程,從而不斷提高績效、減少浪費,並達成更高的品質水準。「改善2.0」並沒有像人們普遍認為生成式AI會做的那樣取代人類,而是將人類推向新的機器輔助流程的中心,並實現許多管理理論長期以來的願望:將業務轉型交由所有員工負責執行。
“隨著愈來愈多營運作業的數位化,由生成式AI和其他先進科技增強的「改善」,再次重塑流程管理。
然而,重新構思商業流程要取得成功,並不像請ChatGPT審視工作流程那樣容易。為了加快速度,領導人需要了解哪些流程適合使用演算法來重新設計,並了解其他公司如何使用生成式AI去改造那些流程。
本文將根據我們數十年來在科技和創新領域提供客戶建議的經驗,說明最優秀的公司如何部署生成式AI。我們也要向你介紹「改善」的未來:完全自主的代理(agent)能夠獨立行動,來實現目標、調整策略、分析環境,並完成複雜的任務。但是就像所有的科技採用一樣,生成式AI的成功以及它改進商業流程的能力,背後的關鍵都是人類。
賦能全體員工
無論哪一個產業,從汽車製造、生命科學到消費品,也無論哪一個職能,從研發、製造到供應鏈管理,生成式AI正以新的方式提升員工賦能。舉例來說,這情況正發生在賓士(Mercedes-Benz)的生產現場、供應鏈職能及軟體設計。
這家公司的MO360數據平台,將它在全球各地的小客車工廠連接到雲端,提高了所有生產和供應鏈作業的透明度和可預測性,並讓公司能夠將AI和分析工具部署到全世界。當時擔任賓士集團資訊長的揚.布萊希特(Jan Brecht)今年稍早指出:「有了MO360數據平台,我們就能讓製造的科技和數據普及。數據正在成為賓士每位員工的事情。我們生產現場的同事能夠取得有關生產和管理的即時數據。他們可以使用下鑽式儀表板(drill-down dashboard),並以數據為基礎做出決策。」
生產單位的員工可以用日常語言下提示(prompt),不必使用技術性的資料庫查詢,就能詢問組裝線的瓶頸,或是難以注意到的流程簡化機會,並從AI取得數據豐富的見解。這些見解可以增強員工根據自身經驗、觀察力和創意來改進流程的能力,而不是取代員工的這種能力。
這個平台也幫助團隊找出供應鏈的瓶頸。同時,這家公司的軟體開發人員也使用GitHub Copilot這款AI驅動的助理,將自然語言的提示轉化為如何撰寫程式碼的建議。他們因此能夠騰出更多時間,去處理複雜的流程問題,並整合全公司的軟體開發工作。
為了讓數據的使用更加普及,賓士正協助所有員工取得新的AI技能。人資部門推出Turn2Learn計畫,提供第一線員工超過40,000門數據和AI課程,包括提示工程和自然語言處理等各項技能的廣泛訓練。藉由生成式AI、技能訓練計畫,以及MO360數據平台等數位生態系統,流程變革已經從小眾的技術技能,轉變為公司員工日常工作經驗的一部分。
汽車製造商馬亨達(Mahindra & Mahindra)的生產團隊,可以向生成式AI驅動的虛擬助理送出查詢,然後收到一步步的指示來維修工業機器人。這有助於他們快速解決技術問題,縮短機器停機的時間。母公司馬亨達集團(Mahindra Group)的AI主管布萬.洛達(Bhuwan Lodha)表示,這種科技已大幅提高生產現場的士氣,實現了「改善」所承諾的員工成就感。
重新設計科學流程
在製藥業,生成式AI產生的合成數據,正幫助員工建立數據豐富的流程、減少浪費、加快分析速度,以及強化品管。以藥品查驗流程來說,製藥公司一向依賴自動化視覺系統去偵測產品的瑕疵。遺憾的是,這些系統經常出現誤退良品(false reject)的情況,不僅減慢工作流程,還得耗費鉅資來重做。這種情況會發生,是因為系統需要使用大量圖像來訓練,但針對許多複雜的瑕疵,只有數量有限的圖像可用來訓練。
為了因應這項挑戰,默克(Merck)使用生成式AI方法,例如生成對抗網路(generative adversarial network)和變分自編碼器(variational autoencoder),來建立合成瑕疵圖像數據。IT架構副總監尼丁.高爾(Nitin Kaul)表示,經過生成式AI強化的系統幫助默克「了解瑕疵退回的根本原因、最佳化流程,並將各種產品線的總誤退數減少50%以上」。
生成式AI也正改造藥物探索(drug discovery)。藥物開發公司Absci現在能夠使用電腦和零樣本生成式AI,來創造與驗證治療性的新型抗體;在這種零樣本的生成式AI中,機器學習模型不必具備任何經過標記的範例,就能識別和分類新的概念。換句話說,AI設計的抗體會和特定目標結合,而不必事先從已知會和那些目標結合的抗體取得數據來訓練。藉由AI而非嘗試錯誤法來創造抗體,使原本需要6年才能將新的生物製劑推進到臨床使用,現在縮短為18個月,同時還提高成功的可能性。正如「改善」教導我們的那樣,浪費的不只是材料,也包含時間和心力。
擴增創意流程
幾家領先的消費品公司正利用尖端的AI和數位科技,來激發人類的創意,進而推動這個產業的成長。高露潔棕欖(Colgate-Palmolive)的員工現在使用生成式AI,來加快新產品配方的設計流程。據報導,雀巢(Nestlé)、金寶(Campbell's)和百事公司(PepsiCo)正在使用生成式AI平台,幫助員工驗證新產品構想和進行市場研究。可口可樂(Coca-Cola)正在試驗一個平台,可以結合GPT-4的語言能力和DALL-E根據文字指令產生圖像的能力。這個平台讓數位藝術家能夠從該公司的龐大檔案,擷取獨特的品牌元素,這等於是給他們一塊畫布,能夠在上面創造原創的藝術作品,用來做為廣告看板。
長久以來,產品和零組件的設計一直都是融合了藝術和科學——將設計師的經驗和感性,結合原型製作和測試的嚴謹。在各行各業,生成式AI正加速推動並改造這個設計流程的許多元素:為新構想建立3D模型、提出修改設計的建議、推薦可以使用的材料、最佳化成本、快速建立數位原型,以及找出哪些構想最有可能成功。
這些工具可以在多大程度上,賦予員工更多能力去改善創意流程?美國航太總署(NASA)的研究工程師瑞安.麥克萊蘭(Ryan McClelland)使用市售AI軟體,在馬里蘭州格林貝爾特(Greenbelt, Maryland)的NASA戈達德太空飛行中心(Goddard Space Flight Center)改造一次性專用零件的設計流程。很少有組織在製造獨一無二的零組件時,數量和標準的嚴格程度比NASA還高。從天文物理觀測氣球到大氣掃描儀、行星儀器、太空天氣監測器、太空望遠鏡,甚至火星樣本取回任務等,這些零組件都極為重要。
在麥克萊蘭的新流程中,電腦輔助設計專家先從任務的必要物件著手,繪製零件與儀器或太空船接觸的表面,也繪製其他硬體和電子設備的所有螺栓與配件。設計人員可能也必須為雷射光束或光學感測器預留一條路徑。麥克萊蘭指出:「演算法確實需要人類監控。人類直覺知道什麼看起來是對的。如果完全交給演算法處理,有時它會把結構設計得太薄。」在專業的人類工程師監督下,AI只需要一兩個小時,就能生成複雜的結構設計。在傳統的機械設計中,提出設計和分析設計可能要耗時一個星期,之後還需要多次迭代,直到專家評估該設計可以投入製造為止。因此,可能需要工作幾個月才能找出解決方案。AI設計的結構看起來可能有點奇怪,但它們比傳統設計流程研製的零組件輕三分之二,承受的壓力也少10倍。
以動畫呈現實體運作
生成式AI也正在改造人和複雜的實體系統互動的方式;這些實體系統包括機器人、人體,以及醫院之類的組織。
“生成式AI正在改造人和複雜的實體系統互動的方式;這些實體系統包括機器人、人體及醫院之類的組織。
總部設在德國斯圖加特(Stuttgart)的Sereact是一家AI軟體供應商,它推出的軟體可以自動化執行倉庫作業。Sereact率先推出第一款市面可購得的解決方案,使用ChatGPT底層的轉換器(transformer)科技,讓機器人能夠理解自然語言。這些機器人接受過數十億張模擬圖像的訓練,負責執行「撿貨和包裝」的任務,而這些任務通常占倉庫成本的55%。在這種稱為PickGPT的科技協助下,人類作業員只要在聊天介面輸入文字命令;缺乏技術專業知識的使用者,也能指導系統並為系統除錯。執行長拉爾夫.古爾德(Ralf Gulde)稱它為「世界上最容易和機器人互動的方式」。
接下來是什麼?生成式AI和數位雙生(digital twin)已經開始匯流,讓我們可以窺見,流程的持續改進在未來將會變得更加普及。數位雙生已經用來為複雜系統(如噴射引擎、風力渦輪機、工廠和人類心臟)建立模型,並且精確模擬它們的運作,讓使用者可以在系統出現問題時,從遠端制定解決方案(甚至常常是在問題出現前就制定了)。數位雙生可以用來提高生產流程的效率、改善品質、增強作業效能,並打造更穩健、更具韌性(resilient,或譯復原力)的供應鏈。
不妨看看醫療產業如何使用數位雙生。全球約90%的頂尖藥物和醫療實驗室已經在臨床前藥物開發等領域使用數位雙生。醫療科技公司Atlas Meditech建立一座平台,讓外科醫生在一個和患者大腦尺寸、形狀、病變位置相同的虛擬大腦上練習開刀。醫院的數位雙生可以用來制定日常決策,例如人員配置、手術、床位管理等。醫院也可以使用自己的數位雙生進行壓力測試,以了解自家組織如何應對未來可能發生的情況,例如造成大規模傷亡的地震。研究人員預計,有朝一日數位雙生會用來提供精準醫療、診斷疾病,並預測健康和疾病的變化結果。
由於生成式AI目前隨時可以擴大數位雙生的能力,包括增加自然語言介面,我們預料會有更多醫療工作者擁有這些工具來調整流程,並以近乎即時的方式回應新的需求。這是往持續改進邁出的一大步。
自主代理
新的AI代理(AI agent)將「改善」帶到新的層次,不只提供建議,也能自行決策、採取行動及改進流程。它們可以是簡單的聊天機器人,也可以是自動駕駛汽車、能夠自主執行複雜工作流程的機器人系統。
以DoNotPay公司為例,它想要執行多種任務,包括申訴違停罰單,或者取消分時度假(time-share)會員資格等等,以協助消費者節省荷包。不久之前,DoNotPay還只是協助顧客找出節省荷包的機會,並鼓勵他們採取行動。但後來這家公司將GPT-4和AutoGPT整合納入它的軟體。這些新功能的第一位使用者是DoNotPay的執行長。他允許代理進入他的財務帳戶,下給它的提示是一個簡潔卻複雜的命令:幫我把錢找出來。代理發現有81美元不必要的訂閱費用,以及異常的37美元機上Wi-Fi費用。然後它提議自動取消訂閱,也草擬一封Wi-Fi費用的申訴信,然後請執行長審閱。更棒的是,它甚至還草擬並發送電子郵件,透過協商將執行長的有線電視和網路費用減少20%。
傳統的軟體是由以規則為基礎的精確指令來驅動,而且預設要產出可預測的結果。這大幅限制了它自主行動的能力。它缺乏像人類那樣的推理能力;決策直接寫死在程式碼裡,沒有納入人類思維特有的細膩判斷和彈性。相較之下,建立在預訓練大型語言模型(pretrained LLM)之上的AI代理,能夠理解語言和提示,因此更能動態調整和適應。建立在多模態基礎模型之上的代理,能力更強得多,因為它們能夠同時針對多種資訊類型(文字、程式碼、聲音、圖像和影片),進行概化、理解、跨類型操作和結合。
在以「改善」為導向的環境中,自主代理還展現出另外3個和人類工作者相似的地方:
目標導向的行為。由人設定目標,但由AI代理獨立行動來實現這些目標,並在必要時調整策略。為了做到這一點,代理可以跨越到公司其他的軟體平台工作,並和其他組織的軟體與語言模型互動來執行任務。
邏輯推理和規畫。AI代理會感知並分析自身的環境。它們能將複雜的任務分解為各個組成部分,並運用理性找出實現目標的最佳方式。
長期記憶和反思。AI代理會藉由過去的互動,更清楚了解意圖和背景脈絡。它們會從經驗中學習如何改善工作績效。
不論哪一個產業,目前都有許多公司在部署自主程度不一的AI助理或代理。沃爾瑪(Walmart)使用它們來協助管理庫存。在萬豪國際集團(Marriott International),它們負責最佳化訂房流程。在雀巢,它們負責改進供應鏈流程。保全系統公司ADT正在打造一款代理,能夠幫助數百萬名顧客挑選、訂購和設定他們的家庭保全系統。豐田正在開發代理機器人,可以做為老年人的看護,或是在工廠作業區的生產流程中自主而順暢地作業。摩根大通(JPMorgan Chase)正在開發的自主代理,在不久的將來會執行複雜的多步驟任務。
同時,各家科技公司,從科技巨擘到較小型的企業和新創公司,也供應各種平台和工具,讓其他公司可用來建立自主代理和系統。微軟(Microsoft)的AutoGen是一個開源的程式設計架構,可以用來打造這種代理,並協調它們一起執行任務。透過這個架構,代理能夠彼此對話,並協助建立既自主、也和人類協作的工作流程。Meta的React是個免費的開源JavaScript程式庫,可以用來建立使用者介面,包括和自主代理互動。亞馬遜網路服務(Amazon Web Services)最近推出Amazon Q,幫助使用者設定半自主的AI代理去執行各種任務,包括撰寫程式碼、替程式碼除錯。Google的Vertex AI Agent Builder和Semantic Kernel開源開發套件,也幫助你輕鬆建立AI代理,並將最新的AI模型整合到你的程式庫中。OpenAI的Assistants API讓使用者能夠在自己的應用程式中建立代理。舊金山的新創公司LangChain提供一個開源架構,可以用來打造以LLM為基礎的應用程式。LlamaIndex協助使用者建立脈絡增強(context-augmented)的生成式AI應用程式,包括自主代理和工作流程。GenWorlds提供一個平台,可以用來建立一些環境,讓AI代理彼此互動以執行複雜任務。MemGPT讓代理聊天機器人能夠學習和你有關的資訊,並隨著時間調整它們自己的個性。
科技公司也在它們銷售的產品加入自主代理。例如,Salesforce銷售的Agentforce,是一款完全自主的AI代理,能夠理解顧客訊息的完整脈絡,並且獨立解決範圍廣泛的服務問題,不必像傳統聊天機器人那樣使用程式預先寫好的情境。(大多數聊天機器人只能處理已經用程式明確寫進系統的特定查詢。)
自主代理生態系統
要完成某些任務,需要超過一位代理。在這種情況下,公司可以客製化一套代理系統,其中每個代理都專精一項特定任務。以抵押貸款審核流程為例,當人類審核員下一道指令「根據我們公司的放款政策來審核這筆貸款申請」,一個代理可以從申請書提取相關的資訊。另一個代理可以扮演銀行政策庫管理員的角色,提供放款政策給其他代理,再由這些代理比對申請書和放款政策。另一名代理可以生成最後的報告,向檢視那筆貸款的審核員建議應該採取哪些行動。「連接器」代理可以監督和協調所有這些代理的活動。
企業必須結合多重代理,並讓它們能夠互相溝通與協作,才能開發出可以自主管理端到端流程的AI系統。這種解決方案可以改造整個職能,例如供應鏈管理、生產和行銷等。乍看之下,這也許像是要大規模實現自動化(也提供更多素材給那些擔心AI統治世界的科幻迷),但實際上這仍然與「改善」一脈相傳,提供了一個持續改進的機會。
舉例來說,Google和史丹福大學(Stanford University)的研究人員在2023年進行一項實驗。他們創造了25個數位人類化身,賦予每個化身獨特的個性和背景故事,並將它們放進模擬的線上世界中自由活動。隨著這些化身彼此互動、開始過著日常「生活」,它們複製出逼真的人類行為。它們根據自身記憶和過去的經驗做出決定,不需要真人介入。像這樣有能力依靠記憶並反思自身經驗和互動,使代理能夠相互學習,建立起可以持續改進流程的生態系統。
在最近另一項實驗中,史丹福大學的研究人員證明,相較於最廣泛使用的科技,也就是機器人流程自動化(robotic process automation, RPA),人類和代理協作遠遠更有可能促成複雜工作流程的自動化。RPA本質上是機器人,程式碼直接寫死,只能依照預先制定的規則來執行一系列動作。機器人缺乏概化的推理和規畫能力,因此很容易因為複雜流程難免出現的變異和例外情形而出錯。它們的設置成本也很高昂,而且面對不斷變化的狀況很難維護它們。
研究人員首先實驗的工作流程,是一家醫院的營收週期管理。大多數醫院都設有部門來負責及時處理收款、病患保險驗證、事先授權和保險理賠事宜。第二個實驗是針對一家大型B2B企業的發票處理流程,這個流程同樣十分複雜,因為這家公司要處理大量合約,而且這些合約條款差異很大。這兩個流程的大部分工作仍然依賴人工,雖然組織試圖將這些工作自動化。
研究人員為了克服RPA的局限,採用一個多模態基礎模型,透過觀看影片示範和閱讀文件來向人類學習,因而大幅降低設置成本。這個模型包含各式各樣執行不同任務的代理,以93%的準確率(accuracy)辨識出每一項工作流程的所有步驟。它利用推理和視覺理解能力來擬定行動計畫,進行自我監測和修正錯誤,並以90%的精確率(precision)和84%的召回率(recall),成功辨識工作流程已經完成。這些結果顯示,這個模型可以推動全新類別的工作流程自動化,例如有些工作流程包含難以描述的步驟、需要複雜的決策,或者是知識密集型的工作流程。
研究人員的模型會在執行工作流程時,觀察自身行動的效果,因此能夠匯集成一個技能資料庫,可以應用到其他的工作流程。雖然模型的目標是實現最少的人力干預,但研究人員發現,將人力整合納入流程非常重要:組織需要人類來確保流程符合整體目標、最佳化與員工互動的模型,並向代理提供訓練和回饋。
AI的成功取決於人
正如史丹福大學的研究顯示的,雖然AI代理代替我們工作,而且它們彼此協調一致,但這並不表示人類置身事外。AI的成功不只取決於科技,也同樣取決於人。當員工最佳化代理模型,以便適合與人類互動時,代理會以更高的自主性做出決策和運作。代理將隨著自身經驗的累積而持續改進,而監督流程的人類,也將持續完善它們的設計和表現。當員工和AI代理都得到賦能,人機協作的人、機雙方都會持續改進。
“AI代理將隨著自身經驗的累積而持續改進,而監督流程的人類,也將持續完善它們的設計和表現。
即使面對日益提高的機器自主性,流程仍然以人為中心。在即將到來的自主代理時代,這將是「改善」的其中一項關鍵。
文章來源:哈佛商業評論 1月號