直擊WAIC丨對話馬上消費CIO蔣寧:大模型技術(shù)在金融行業(yè)落地還存在四個挑戰(zhàn)
21世紀經(jīng)濟報道記者李覽青 上海報道
在2023年世界人工智能大會上,大模型技術(shù)是當之無愧的“話題王”。在通用大模型向前疾馳的同時,大模型技術(shù)如何應(yīng)用于金融等垂直領(lǐng)域,再次成為業(yè)界熱議的問題。
7月6日-8日,在世界人工智能大會舉辦期間,21世紀經(jīng)濟報道記者專訪了馬上消費金融首席信息官蔣寧,他坦言,如今市場廣泛討論的大模型是生成式模型,而金融行業(yè)真正需要的是多種模型的組合式AI系統(tǒng),如今大模型技術(shù)在金融行業(yè)的落地還存在四個方面的挑戰(zhàn)亟待突破,目前為解決金融機構(gòu)的魯棒性決策問題,依然需要實時人機協(xié)作的機制參與。
從“小學生”開始培養(yǎng)
《21世紀》:模型和強化學習并不是新鮮詞,大模型技術(shù)和過去相比,在技術(shù)層面帶來了怎樣的變革?
蔣寧:強化學習是發(fā)展很久的領(lǐng)域,從AlphaGo到現(xiàn)在OpenAI的ChatGPT,強化學習也在發(fā)生巨大的變化。
強化學習簡單來說是基于人輸入的策略,機器在執(zhí)行過程中不斷地調(diào)整這個策略。AlphaGo當年最偉大的突破在于,過去在封閉環(huán)境下機器可以通過強化學習測算博弈獲勝的概率,得到一個概率結(jié)果,而AlphaGo可以在兩者博弈的動態(tài)環(huán)境下測算勝率,但它不知道最終的結(jié)果。
今天大模型技術(shù)的強化學習是一個開放系統(tǒng),每個用戶輸入的內(nèi)容指令不一樣,機器不知道對方會問什么問題,也不知道該如何更好地回答這個問題。但在開放系統(tǒng)下,在不知道對與錯的情況下,它通過獎勵函數(shù)評估出哪個是更好的答案,它不斷通過強化學習實現(xiàn)“越用越聰明”,這就是持續(xù)反饋機制,這是OpenAI的突破。
《21世紀》:國內(nèi)已經(jīng)開啟“千模大戰(zhàn)”,今天人工智能大會上也有很多大模型產(chǎn)品發(fā)布,在您看來,您是如何看到國內(nèi)各家的大模型與Opan AI之間的差異?
蔣寧:我認為目前大模型的核心技術(shù)能力,是在于持續(xù)反饋機制。打個比方,企業(yè)推出的大模型相當于博士生畢業(yè),如果沒有高質(zhì)量的語料數(shù)據(jù)訓練來讓大模型進行持續(xù)反饋,那這個博士生的知識水平就停留在畢業(yè)時,很快就會被其他擁有自我反饋機制的AI追趕上。而OpenAI的大模型是從“小學生”階段就經(jīng)歷了全社會全平臺最好的教育,通過巨量數(shù)據(jù)來進行持續(xù)反饋與強化學習,這樣才能實現(xiàn)“越用越聰明”。
金融領(lǐng)域大模型落地遇四大挑戰(zhàn)
《21世紀》:今年WAIC大模型技術(shù)非?;鸨?,你認為金融行業(yè)適合大模型技術(shù)應(yīng)用嗎?
蔣寧:大語言模型技術(shù)出世后,對金融行業(yè)的人工智能技術(shù)應(yīng)用是“強心劑”,首先金融行業(yè)有三個特點。
第一,第一,金融行業(yè)天然是數(shù)據(jù)密集型、技術(shù)密集型行業(yè),其對數(shù)據(jù)和技術(shù)的使用在各行各業(yè)中都是最廣泛地。第二,金融行業(yè)目前面對的挑戰(zhàn)很多,如銀行線下網(wǎng)點的價值傳遞效率問題、用戶體驗問題,都需要機構(gòu)持續(xù)創(chuàng)新。第三,金融行業(yè)一直在探索數(shù)據(jù)資產(chǎn)化,挖掘數(shù)據(jù)價值,在風險、營銷、運營等方面進行嘗試。
《21世紀》:但是我們看到大模型技術(shù)目前在金融行業(yè)落地場景還是很有限,你認為存在哪些挑戰(zhàn)?
蔣寧:我認為挑戰(zhàn)是很多的,主要講四個方面。
第一個挑戰(zhàn)是關(guān)鍵性任務(wù)和動態(tài)適應(yīng)性。在動態(tài)系統(tǒng)里,大模型驅(qū)動下的人工智能還不具備100%精準決策能力。金融行業(yè)的場景不是一成不變的,面對不可預(yù)期的外界環(huán)境和突發(fā)意外情況,大模型并不能做一如既往地給出穩(wěn)定舉措,這給金融機構(gòu)在人工智能的技術(shù)應(yīng)用提出了一個非常大的挑戰(zhàn)。
第二個挑戰(zhàn)是個性化要求和隱私保護之間的矛盾。金融行業(yè)一直希望通過人工智能來實現(xiàn)極致的用戶體驗,特別是個性化的體驗,但這需要個人隱私數(shù)據(jù)與大模型技術(shù)相融合,這樣帶來的隱私數(shù)據(jù)保護問題目前還很難有一個解決方案。
第三個挑戰(zhàn)是群體智能與安全可控。大模型的訓練機制決定其需要大量數(shù)據(jù)來構(gòu)建增強學習、強化學習的網(wǎng)絡(luò),讓多方共同打造一個平臺,基于這一平臺持續(xù)貢獻數(shù)據(jù)與反饋,從而讓AI實現(xiàn)技能的進化。但目前出于數(shù)據(jù)安全考量,行業(yè)內(nèi)跨組織、跨機構(gòu)的數(shù)據(jù)共享機制仍然需要持續(xù)性的探索。
第四個挑戰(zhàn)是對大數(shù)據(jù)和基礎(chǔ)設(shè)施的能力挑戰(zhàn)。未來摩爾時代大模型技術(shù)的應(yīng)用需要高速增長的數(shù)據(jù)能力,對金融機構(gòu)網(wǎng)絡(luò)、服務(wù)器、芯片、底層架構(gòu)等等都提出了全新的要求,這也是未來需要突破的。
《21世紀》:為應(yīng)對這些挑戰(zhàn),你認為有哪些技術(shù)將被廣泛運用?
蔣寧:我看到三個關(guān)鍵技術(shù),概括來說是持續(xù)學習、魯棒性決策以及組合式AI系統(tǒng)。
持續(xù)學習,就像前面所說,它是大模型基于數(shù)據(jù)的反饋,讓系統(tǒng)越用越聰明。如何構(gòu)建一個增強的訪客系統(tǒng)讓更多人使用,這就是在線學習、持續(xù)學習、強化學習的技術(shù),這方面我們還有很多需要突破。
魯棒性決策,它是指即使面臨噪聲和突發(fā)情況干擾,大模型也可以作出一致性的可信回答,強調(diào)的是可信性。金融業(yè)和工業(yè)領(lǐng)域,0.1%的錯誤都是不被允許的,合規(guī)、安全是最基礎(chǔ)、最核心的要求。無論在怎樣的動態(tài)環(huán)境下,AI都需要排除噪聲干擾,為客戶做出合法合規(guī)的決策,這是魯棒性決策的要求。
組合式AI系統(tǒng),目前大家廣泛討論的AI是生成式大模型,而金融行業(yè)需要判別式大模型,必須直接給出正確或錯誤的結(jié)果,二者之間必須有效結(jié)合才能發(fā)揮更大價值。從兩類模型的區(qū)別來看,判別式模型的訓練成本很高,每個結(jié)果標記對、錯,都是機器不斷學習的過程,但這個結(jié)果很難適應(yīng)變化中的場景,開發(fā)成本很高。生成式大模型的訓練則是需要全員的不斷參與,泛化能力非常強,但它不能生成準確的結(jié)果判斷。因此這兩種技術(shù)需要相互融合。
金融機構(gòu)如何試水大模型?
《21世紀》:從這些挑戰(zhàn)來看,是否意味著目前金融行業(yè)的大模型落地還很難?
蔣寧:這要結(jié)合大模型從人工智能的布局來看,分為四個大類的象限。第一個象限是基礎(chǔ)領(lǐng)域,包括生成式AI、判別式AI,這是基礎(chǔ)模型領(lǐng)域;第二個象限是在基礎(chǔ)領(lǐng)域上的垂直領(lǐng)域模型,像金融垂直領(lǐng)域的模型;第三個象限是在基礎(chǔ)領(lǐng)域和垂直領(lǐng)域模型的基礎(chǔ)上,創(chuàng)新生產(chǎn)力工具,比如,代碼自動掃描,自動生成語句,這是屬于工具類的;第四類是象限是應(yīng)用領(lǐng)域,比如,智能客服就屬于應(yīng)用領(lǐng)域,因為智能客服不可能把大模型、垂直領(lǐng)域模型直接形成智能客服,所以需要第三象限內(nèi)智能審核工具等應(yīng)用。
目前金融行業(yè)在第一象限的基礎(chǔ)模型開發(fā)還非常困難,我們?nèi)狈Τ掷m(xù)投入信息數(shù)據(jù)的反饋機制,但在第三第四象限的工具和應(yīng)用類別上,已經(jīng)可以實現(xiàn)大模型技術(shù)在部分金融業(yè)務(wù)場景下的應(yīng)用了。
《21世紀》:目前馬上消費有嘗試大模型技術(shù)的應(yīng)用嗎?主要在哪些方面?
蔣寧:結(jié)合前面我們說的挑戰(zhàn)和技術(shù)應(yīng)用路徑,我們提出了“三橫三豎”戰(zhàn)略。
其中,“三橫”包括:通過持續(xù)學習技術(shù)、模型控制、組合式 AI 系統(tǒng)形成的安全、合規(guī)、可信的魯棒性決策能力?!叭Q”包括:一是數(shù)據(jù)智能,二是多模態(tài)大模型,三是實時人機協(xié)作。
目前在應(yīng)用方面,我們開發(fā)了智能生成報表的工具,在場景方面我們在智能客服上已經(jīng)有所涉獵。
得益于消費金融公司長期與社會有廣泛交流,在中文高質(zhì)量數(shù)據(jù)集相對有限的情況下,我們公司歷史上累加了將近40PB的客戶聲音數(shù)據(jù),來幫助我們訓練人機協(xié)作模型,訓練人機對話的模型,并且利用大模型技術(shù)為人機對話提供更好的幫助。我們基于這樣近千億的數(shù)據(jù)量和組合模型,結(jié)合機器的反饋機制進行強化學習,在不同場景下,把語音、聲紋,包括心理學這些模型融合在一起,同時為了應(yīng)對機器在突發(fā)情況下的問題,我們通過人機協(xié)作的形式實現(xiàn)魯棒性決策,這是我們科技方面的核心競爭能力。