以下文章來源于金融科技研究 ,作者金融科技50人論壇
導讀:近期,由金融科技50人論壇聯合神州信息、高景立學共同推出的“2023數字金融公益直播課”第二期順利開講。本期嘉賓邀請到光大信托信息技術部副總經理、數據中心總經理祝世虎,他分別從ChatGPT簡述、ChatGPT的技術分析、ChatGPT的應用邊界、法律與合規以及在金融行業的應用展望四個方面,闡述了“ChatGPT給金融機構帶來的思考”。
以下為實錄內容:
一、ChatGPT簡述
1、ChatGPT簡述
ChatGPT是自然語言對話方式的聊天機器人,”Chat”指聊天,GPT是一種算法。ChatGPT包含文本、圖畫、自動問答、翻譯和代碼等功能。“2022年末以來,它迅速走紅全球,全球客戶突破3億”充分說明產品評價取決于客戶數。ChatGPT由OpenAI公司開發,微軟為公司提供資金支持。目前國內與ChatGPT同類型的產品是百度研發的文心一言,已經推出測試版。網上有一位畫家用ChatGPT繪制名為《有光有愛有遠方》的畫作,得到廣泛關注。我也嘗試用ChatGPT撰寫一封表揚信的開放性作文,撰寫效果非常好,這封表揚信放在任何一家銀行、信托公司都是可以通用的。
2、ChatGPT:從技術到客戶的珠聯璧合
誠然ChatGPT的技術非常好,但我覺著其成功更多是產品的成功,因為產品具有易用、好用和實用的三個特征。易用方面,OpenAI公司斥巨資提供了便捷的API接口,使每個人都可以方便地用手機、筆記本接入,為ChatGPT產品吸引了大量客戶。好用方面,其效果遠高于同類型的傳統產品,讓很多出于好奇的客戶變成初級使用者。實用方面,學生可以用其寫作業,程序員可以用其寫代碼,畫師可以用其畫畫,這正是解決勞動力問題的地方。讓人們慢慢地從初級使用者變成了堅定的使用者,這個過程好比客戶旅程。因此,我認為易用、好用、實用所帶來的客戶旅程是ChatGPT成功的關鍵之一。
從技術和產品關系的角度分析,首先,我所經歷的AI史上第一個里程碑AlaphaGo,雖然其技術是很領先的,但是因為其產品設計使客戶群體僅局限于圍棋的垂直領域,難以形成ChatGPT這樣受歡迎的場景。技術好不是全面的,產品好才更重要。其次,以二維碼支付為例,現在大部分人都會用二維碼去支付,但是二維碼技術推廣同期有更先進的技術,比如門禁卡技術、芯片卡技術。二維碼的成功并不是源于技術先進,而是產品成功,也是延續易用、好用、實用的路線。以金融機構的視角來看,第一,創新產品、數字化轉型時一定是業務引領,而不是科技引領;第二,轉型和創新的成功一定是業務的成功,而不是科技和風險的成功;第三,業務成功的關鍵一定是產品的成功;第四,線上唯一可以調動客戶行為的是產品設計。綜上,ChatGPT帶給金融機構的啟示是:路線業務引領,標志業務成功,核心是產品成功,產品調動客戶。
3、OpenAI:工程師的桃花源
OpenAI成功的關鍵因素包括兩方面,一方面在于其有300多名工程師,這些工程師自由散漫但理想崇高,它可以無憂無慮地以工程師的思維改變世界。“自由散漫”指的是當技術路線和管理路線發生沖突時,工程師要站在技術角度進行取舍。“理想崇高”指的是堅定自身技術路線。OpenAI公司300名工程師中,包括模型人員90人,系統人員15人、數據人員180人、ITBP人員15人。模型人員和ITBP人員的占比從側面反映一家金融機構的數字化轉型的程度。對于金融機構而言,模型人員占比越高,機構的自動化程度越智能;ITBP人員占比越高,機構的科技和數字化轉型越貼近業務。
另一方面,OpenAI將算力、專業化的數據處理全部外包。這對于金融機構在設置外包和自主研發邊界中具有啟示:體現核心競爭力的地方一定要自主研發,非核心競爭力的專業能力可以外包,比如算力、簡單人工數據、人工標注等。
4、Microsoft:第三代的王者榮耀
微軟主要實現了三代“王者榮耀”時刻。第一代“王者榮耀”是Office,它實現了文字的電子化,但是本地化的Office存在問題,當我們進行“CTRL+C”和“CTRL+V”拷貝粘貼時,僅限于這臺電腦中的文字。第二代“王者榮耀”是搜索引擎,我們可以“CTRL+C”和“CTRL+V”拷貝粘貼所有互聯網的文字,文字范圍有所擴大。第二代半“王者榮耀”是搜索引擎變種即主動推薦,形成主動數據采集和搜索功能,相比于傳統搜索更加智能。第三代“王者榮耀”是ChatGPT,其范圍不再局限于歷史已有文字,而是可以組合形成新文字,讀起來更加合情合理。
5、崗位之爭:人與AI的邊界線
關于人和AI的邊界線究竟在什么地方。第一,體力勞動一定會被簡單機械所取代,這是已經發生的;第二,重復性勞動能被簡單智能機器所取代,比如金融機構OA系統、RPA機器人等。此外,目前90%的人相信自動駕駛會實現。ChatGPT可以取代什么工作,有些人總結成簡單的創造性工作,但是我覺得這種說法是不恰當的。第一,任何不需要深度感情交流的工作都可能會被AI所取代。以包餃子為例,機器包餃子早已實現且味道不錯。但餃子是容易被注入感情的,機器無論如何也包不出媽媽的味道。雖然機器有可能寫出有感情的作品,但是機器不一定能夠理解感情。因此,搶走工作的不是AI,而是先掌握AI的人。如何保證自己的工作不被AI所替代?這需要我們在工作中奉獻愛,用愛去工作,只要把愛心放到工作中,我們的工作就很難被取代。
第二,ChatGPT本質是生產力的躍升,這與歷史上的生產力提升是一樣的,蒸汽機替代馬車、電力替代蒸汽機。雖然會在短時間內對人類的就業結構產生沖擊,但由于人力資源的稀缺性,中長期不會存在大規模失業,只是就業結構發生了變化。啟示便是,我們可能需要提前考慮子女上學時什么專業不會被AI所取代,人與AI邊界線哲學觀點將會深刻影響下一代的就業結構、思維觀念等。傳統上,我們認為人類勞動者分為體力勞動者和智力勞動者,從AI視角看,可能只存在碳基勞動者(體力勞動者、智力勞動中)和硅基勞動者,并且它可能認為碳基勞動者是為硅基勞動者服務的,這就需要哲學家們幫我們區分人與AI的邊界線,以及AI算法的人工智能倫理。
6、崗位之爭:從社會主義的初級階段的基本理論去理解
ChatGPT時代會顛覆很多事情,引起崗位變化。很難想象在醫療資源相對貧瘠的非洲大陸上,昨天的一家網吧會在今天搖身一變成為互聯網醫院。但是現在可以相信互聯網技術的變化,無論是網吧還是醫院,對于互聯網、人工智能而言,無非是一個終端。在這種大變革下,某些崗位會發生變更。
從社會主義初級階段的基本理論來理解,社會主義初級階段主要矛盾是人們日益增長的物質文化需求同落后的社會生產之間的矛盾。落后的社會生產指的是兩點:人力資源稀缺和生產力。ChatGPT本質上是通過科技創新提高生產效率,以更少人力去生產原來商品,讓節約的人力進入新的行業,增加新的商品和服務供給。綜合來看,ChatGPT只會短期內對人類的就業結構造成沖擊,中長期并不會導致人類的大規模失業。
二、ChatGPT的技術分析
1、技術路線:工程師思維的成功
ChatGPT的成功是工程師思維的成功。第一,創建大腦。工程師思維中有一個“通用復用”的思維,即強調代碼、部件在各個場合可以通用的,生產的發動機在工廠各個汽車里是通用的。在工程師眼中,創建大腦一定是創建通用人工智能AGI大系統,系統中間有學習的大模型,靠大算力從大數據中學習人類的知識,從而形成AI智能。第二,從哪里學?人類的知識存儲在書本里、文字里、圖畫里、語言里。在工程師眼里,大模型要從人類語言中學,要建立大型語言模型LLM。工程師擁有建模型的想法和硬件后,隨著數據和算力越來越大,模型效果越來越好,這就是工程師們力大磚飛的思維。第三,怎么學?關于技術路線的選擇,當時NLP領域中存在著兩類技術路線,第一類是深度學習模型,第二類是預訓練模型。但深度學習模型已經遇到瓶頸,依靠增加深度學習的模型層深來提高模型效果微乎其微,此時深度學習已經逐漸被預訓練模型所取代。預訓練模型又存在了兩個技術方案:Bert方案和GPT方案,大部分研究者選擇Bert方案,而大部分工程師選擇GPT方案。Bert方案是雙向的方案,即我對你說話,你先聽明白我說的話,再回答我的問題。GPT方案是我說話你只需要回答,不用知道說了什么。這種一問一答的方案體現出工程師大道至簡的思維。這種雙向過程可能比直接回答更難。我認為GPT路線在開放式領域中的成功只是領域問題,在金融領域內,封閉性Bert技術路線或許更有優勢。第四,學成歸來。通過不停地堆模型、堆數據,最終實現成功是智力涌現的過程。智力涌現涌現后便可以做產品。學成歸來指的是厚積薄發以后形成產品成功,任何創新和數字化轉型的成功,都應該是產品的成功。
2、智能涌現:人工智能的厚積薄發
人工智能在GPT上變化體現很明顯,從2018年最初的GPT模型參數只有1.17億,到2020年GPT-3模型參數達到1750億,再到2022年產品化,其厚積薄發體現在三個方面。第一,技術積累。技術積累實際上是不斷試錯的過程,解決的是理論推導和工程實踐中的技術差異。不斷試錯就是技術的積累,任何產品的成功都需要兩個發明,一個是理論上科學家們在實驗室的發明;另一個是工程師們在實際應用中將科學家的發明低成本實現的過程。第二,知識積累。GPT模型參數從1.17億到1750億的積累,訓練成本極其昂貴。據傳聞,微軟為其訓練花費20~30億美金。第三,理念積累。在NLP領域中,曾經深度學習模型逐漸失效,GPT采用為自回歸的技術路線,后來出現的Bert采用的是雙向語言模型,而且當時Bert技術方案的效果遠遠優于GPT1的效果。直到GPT3的出現,其優勢才顯示出來,這就是工程師們對技術路線的厚積薄發。對于給金融機構的啟示是,并非誰的技術好就用誰的技術,應該用成本的思維去選擇適合自己的技術。
有些資深專家認為GPT3的成功不僅是技術,而且是代表AI模型的發展理念。我是同意這種觀點的。我認為AI理念包括以下幾個方面:一是對AGI架構設想的堅持;二是對LLM通往AGI道路的堅持;三是工程師們對未來“人與AI分工設想”的堅持。在人與AI共同寫作文時,人與AI的分工究竟是BERT技術路線還是GPT的技術路線。對于BERT和GPT之爭,它們只是各有所長,在開放式領域GPT有天然優勢,但在垂直場景與受控領域,只要堅持下去,BERT也會脫穎而出。
3、融合技術:多模態大模型
通用人工智能AGI的核心是與任務無關的大模型LLM,目前在自然語言相關領域有三大方向:GPT適用于語言領域、Codex適用于代碼領域、DALLE適用于圖像領域。上述應用讓ChatGPT成為多模態大模型,多模態大模型擁有兩種能力:一是尋找到不同模態數據之間的對應關系,例如將一段文本和對應圖片聯系起來;二是實現不同模態數據間的相互轉化與生成,例如根據一張圖片生成對應的語言描述。這種技術路線的關鍵是,將不同模態的原始數據映射到統一或相似語義空間當中,從而實現不同模態信號間的相互理解與對齊。
4、算法邏輯:ChatGPT寫文章的邏輯
AI寫作文會應用所有人的詞匯量,其作文空間比每個人的作文空間全且大。首先,必須把文字和圖片向量化,才能輸入到人工智能算法中。假設1頁PPT圖片為400×500的像素即2萬個像素點,每個點用0~255的灰度值描述。在二維空間中,2萬個像素點可以排成1張圖。上升至2萬維空間,這個圖片相當于2萬維空間中的1個點。假設作文空間2萬維,AI寫的作文就是2萬維空間中的一個點。其次,詞向量即在寫一句話或做語言標注時,通過將語言的詞匯標注出來,讓電腦理解詞之間的計算關系。當詞組成句子后,要判斷兩個句子之間的距離。比如有兩首古詩,“兩個黃鸝鳴翠柳,一行白鷺上青天”、“黃鸝百轉趁紅日,白鷺一行登碧霄”。我們能夠理解這兩首詩句是一個意思,計算機也能理解,因為計算機判斷兩首詩句中都有“白鷺”,“上”和“登”是一個意思,“青天”和“碧霄”也是一個意思。假設詩句中的七個字代表七維空間,每個詞匯代表七維空間不同的點,兩個點之間的距離一定很近即向量很近。
AI作文通過類似人類語言來訓練,突破了人類的詞匯量和語法的限制。中國有句古詩說得好,叫做“文章本天成,妙手偶得之”。在想象力之外還有巨大的作文空間。在互聯網上AIGC的文字將會超過人類五千年產生的文字,產生的圖畫量很快就超過人類五千年產生的書畫量。當AI產生的文字和書畫的量變得遠遠大于人類產生的文字和書畫數量,真理會被誰控制?我們要警惕真理被數據控制,數據被資本控制。這些真理包括共識、宗教、意識形態。比如當今社會普遍的共識是以瘦為為美,但在唐朝可能以胖為美。
三、ChatGPT的應用邊界、法律與合規
第一,應用平民化但建模貴族化。應用平民化體現在每個人都可以通過手機接入API以使用ChatGPT。建模貴族化體現在ChatGPT建模過程經歷300名工程師、1750億個參數、355塊高級顯卡以及長達1年的模型訓練,這是非常大的消耗和資源投入。由于這種重資源、重投入的底層能力建設,我覺得未來在AGI領域只有中國和美國具有構建基礎底層能力。
第二,AI出現“大而不能改”的現象,迫使人們適應AI。GPT有1750億參數存儲知識邏輯,其中邏輯關系、相互關系、學習過程等在技術上尚未完全明確。參數修改主要靠昂貴的模型訓練,這就容易出現“大而不能改”的缺陷。進而產生“反直覺”的問題:究竟是人去適應AI模型,還是AI模型適應人?
第三,智能缺陷。ChatGPT通過文本語言等訓練模型,其智能類型僅僅是感知智能,而不是決策智能,更不是計算智能。具體來看,感知智能基于Bayes公式,決策智能基于先驗概率,計算智能基于計算公式。智能缺陷在于ChatGPT的使用邊界。例如在金融機構中,由于ChatGPT不是決策智能,會在風險決策過程中受限;此外其不是計算智能,在資本計量方面會受限;作為語言領域的感知智能,它更多是以文字助手的身份嵌入與文本相關的工作中。
第四,技術缺陷。ChatGPT具有與傳統人工智能技術類似的缺陷,一是算法黑箱。由于算法模型的黑箱運作機制,其運行規律和因果邏輯不會顯而易見地呈現給研發者。二是算法穩健性。算法運行時容易受到數據、模型、訓練方法等綜合因素干擾,出現非穩健性的特征,這有可能會出現針對性的病毒。三是算法歧視。算法以數據為原料,如果初始使用的數據存在偏見,無形中會造成生成的內容存在偏見或歧視,引發用戶對于算法公平性的爭議,這種歧視主要來自于資本綁架,體現在訓練樣本數量上。
第五,數據安全缺陷。多個環節存在合規問題,一是在個人信息收集階段,用戶使用ChatGPT需要輸入個人數據,依據《個人信息保護法》需要強調用戶進行單獨授權。二是在個人數據的加工使用階段,ChatGPT使用RLHF的訓練方法,用戶使用過程中的輸入和交互信息可能會用于持續選代訓練,進一步被用于為其他用戶提供服務,造成數據共享,這或許與用戶最初使用目的相悖,根據《個人信息保護法》需要用戶重新授權。三是訓練數據獲取,ChatGPT抓取互聯網上信息的過程可能存在合規問題。四是數據泄漏,用戶在使用過程中輸入個人及企業相關的信息,可能導致公司敏感信息泄露。五是算法缺簡導致數據主體行權困難,例如更改權、刷除權、訪問權等行權困難。
此外,ChatGPT還可能存在3條法律紅線。一是版權問題,ChatGPT撰寫作品的版權歸屬問題。二是幫信罪,利用ChatGPT撰寫代碼并用于黑產上,個人和ChatGPT需要承擔哪些責任。三是關于拒不履行信息安全管理義務罪,比如科技公司被監管所約談整改,但是由于模型存在“大而不能改”的特性而難以及時修改和完善。
四、ChatGPT在金融行業的應用與展望
1、ChatGPT的直接應用
第一,ChatGPT的能力分為底層能力和應用能力。大公司應關注底層能力的建設,小公司可以在垂直領域開發應用能力。
第二,ChatGPT與人機設備的整合。ChatGPT能力需要有載體去實現,如手機是現實社會和虛擬社會中的載體,把人從現實社會拉到虛擬社會中,是現實社會到虛擬社會的入口。但當眼鏡、耳機擁有ChatGPT功能,會成為下一個虛擬社會和現實社會的顛覆性入口。
第三,ChatGPT與現有APP的整合。安卓市場排名前20的APP基本上都可以和ChatGPT的功能相結合。
第四,ChatGPT在金融領域的應用。首先,ChatGPT無法改變金融領域的運行規律,但能提升金融領域的現有智能。比如金融領域的RPA機器人和ChatGPT結合后變成智能RPA機器人;OA系統和ChatGPT結合變成智能OA系統。其次,智能客服,包括責任客服和非責任客服,責任客服更看好Bert方案,非責任客服更看好GPT方案。再次,ChatGPT是感知智能,而不是計算智能,它可以通過文字感知來解讀法律文本和合規文本,通過案例進行風險感知、審計感知以及反洗錢案例感知。最后,在保險領域的應用快于在銀行領域,相對銀行簡單的信貸產品,保險產品更復雜,疊加銀行業的約束更多一些,我認為ChatGPT在保險業優先發力更合適。
2、從業務角度看:改變客戶流量入口
從銀行的角度來看,ChatGPT顛覆了什么?銀行需要需要客戶,客戶就是流量。互聯網目前是“入口為王”和“內容為王”,ChatGPT可能會改變這一切。假設ChatGPT的賬號是這么設計:首先要注冊一個Chat號,然后用底層賬號登陸微信時,微信就成為智能微信;登錄抖音時,抖音就成為了智能抖音,此時ChatGPT可能在必要的底層能力成為流量入口。從銀行角度來看,我們要抓住可能會被ChatGPT改變的流量和客戶入口。
3、金融機構推動數據金融形態:資源化、資產化、要素化、市場化
未來,ChatGPT的發展特別是底層AI能力的發展,一定靠數據發展。數據越多,模型訓練越好。這體現數據資源化、資產化、要素化和市場化的過程。
首先,數據具有三重屬性,資源屬性、技術屬性和金融屬性,并且數據具有相關性和正外部性。將100萬的數據放在一起,可能產生“1+1>2”的效果。其次,數據作為生產要素,它和土地是不同的。數據的價值不在數據本身,而是源于技術加工,數據的價值體現于數據產品的權益分配,但它受制于傳統的知情同意的授權模式,形成市場化有一定的困難。對于數據本身,數據通過資源化將記錄進行標注,形成了數據資源,如果數據資源具備可控制、可獲益、可量化三個屬性,數據就由數據資源變成了數據資產。最后,數據資產形成數據要素需要三個條件:數據要素的過程需要其他生產要素的投入、數據要素可以賦能其他要素、數據要素可以催生新的生產方式。數據資產變成了數據要素后,便是數據要素的市場化。前一步數據資本化由金融工作者完成。主要途徑包括數據銀行、數據信托、數據證券化、數據信貸融資四個方面。當金融人實現了數據資本化后,可能會解決數據要素市場化的關鍵問題。
金融機構要參與人工智能治理中。第一是技術與內容并重;第二是行業自律,倫理先行;第三是企業治理,即主體責任與社會責任相結合。
4、數據信托:數據與信托的完美結合
第一,數據要素化過程中的信托雙層所有權架構優勢,將數據所有權與名義所有權分離,這恰恰與數據信托的雙層所有權架構榫卯相扣。
第二,數據確權中的數據信托制度優勢。“數據二十條”持有權、加工使用權、經營權的分置機制與信托制度的委托人、受托人、受益人的制度安排道同契合。
第三,數據流通中的數據信托風險隔離與信托制衡優勢。數據信托制度產生的信任制衡貫于風險隔離穿于數據全流通過程。
第四,數據要素收益分配中的數據信托的權益優勢。數據要素市場化配置與按價值貢獻的分配機制體現信托權益優勢與市場化優勢。
第五,數據要素治理中的數據信托服務優勢。服務信托則具備將政府、企業、社會等多方主體,資金方、資產方、技術方、交易商與交易所等多方角色的撮合能力。
第六,數據跨境流動中的信托制度的國際通用性優勢,信托制度的國際通用性。
5、從AI的視角看AI
第一,我認為AI興起堪比文藝復興,文藝復興破除了人類創造力的禁錮,實現了人類創造力“由0到1”,AI的復興使人類創造力“由1到100”。
第二,有一種思想為“萬事皆模型”。以畫家為例,任何一個畫家的主要風格為其畫風,畫家的風格就是一個模型。模型任何一個參數的調整就會生成該畫風的新畫作。以畢加索的畫風為模型,可以通過調整參數生成100幅畢加索的畫。
第三,自學習AI。當算法會寫算法,當機器人會生產自己時,這是多么恐怖的事情,需要解決人和AI倫理邊界線的問題。
第四,從AI視角來看,人類對AI的反應會認為硅基勞動力正在取代碳基勞動力。值得思考的是,人在利用AI擴展人的智能,還是AI在利用人展現智能。站在AI角度,人類對AI的反應可以分為兩類,一類人是開始對AI敵對和不屑,隨后發現效果很好便開始抵制和限制AI,最后發現限制不住而感到迷茫。另一類人對AI很友好,從起初的好奇、嘗試,到逐步學習,最后學會使用AI并和AI共存。我更希望我們是第二類人,這需要哲學家給提供指導,在明確與AI的邊界線后,立法、工程師、應用才具有邊界和方向。