99视频免费在线观看,先锋ady69xfplay色资源网站,又粗又硬麻豆传媒,成人不卡,99国产免费

首頁 >圖片 >
金融行業(yè)走入大模型時代,AI如何重塑產(chǎn)業(yè)生態(tài)?
發(fā)布時間:2023-08-27 21:33:45 文章來源:騰訊網(wǎng)
《投資者網(wǎng)》侯書青2023年8月23日,“北大光華-度小滿金融大模型技術(shù)與

《投資者網(wǎng)》侯書青


(資料圖)

2023年8月23日, “北大光華-度小滿金融大模型技術(shù)與應(yīng)用論壇”(下稱論壇)在北京舉辦,清華大學(xué)人工智能研究院常務(wù)副院長孫茂松,北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計與經(jīng)濟(jì)計量系教授王漢生,光大信托數(shù)據(jù)中心總經(jīng)理祝世虎,度小滿CTO許冬亮,度小滿數(shù)據(jù)智能部總經(jīng)理楊青等嘉賓出席了本次研討會。?

(度小滿CTO許冬亮)

通用大模型從問世至今接近一年,圍繞在身上的光環(huán)也逐漸褪去,人們對它的認(rèn)知也逐漸趨于理性:強(qiáng)如通用大模型,也有力所不及之處。行業(yè)想要依靠大模型產(chǎn)生新變革,首先要解決通用大模型在行業(yè)內(nèi)的落地應(yīng)用——開發(fā)行業(yè)大模型,成為AI技術(shù)實用化落地的新風(fēng)向標(biāo)。

2023年5月,度小滿率先發(fā)布國內(nèi)首個金融開源大模型“軒轅”,國內(nèi)金融行業(yè)自此走入大模型時代。大模型如何重塑產(chǎn)業(yè)生態(tài),金融大模型如何落地應(yīng)用等話題成為產(chǎn)學(xué)研界的共同關(guān)注。

行業(yè)需要金融大模型

AI技術(shù)經(jīng)過數(shù)十年的發(fā)展,逐漸從概念性較強(qiáng)、主要為C端提供新鮮感的“玩物”,轉(zhuǎn)變?yōu)樵贐端、C端都能找到應(yīng)用場景的工具。其中的商業(yè)潛力,在ChatGPT正式發(fā)布后顯現(xiàn)出來:不計其數(shù)的資金入局,眾多有技術(shù)實力的大企業(yè)不甘人后,爭相披露自家在大模型領(lǐng)域的技術(shù)潛力。

這背后,是市場對AI時代的憧憬。當(dāng)科幻照進(jìn)現(xiàn)實,概念變?yōu)槌蹙咭?guī)模的工具后,現(xiàn)有通用大模型的能力,能否滿足各行各業(yè)對它的期許呢?

騰訊高級執(zhí)行副總裁湯道生曾表示:“通用大模型可以在100個場景中解決七八成問題,但未必能100%滿足企業(yè)某個場景的需求”在專業(yè)問題方面通用大模型有自身的局限性?!痹?023年全球數(shù)字經(jīng)濟(jì)大會上,度小滿CTO許冬亮稱:“比起通用大模型能力而言,金融行業(yè)非常需要垂直行業(yè)大模型?!?/p>

許冬亮在論壇上表示:“大模型讓機(jī)器具有了常識,懂得了邏輯,學(xué)會了創(chuàng)作,讓人和機(jī)器能以更自然的方式互動,通過與周邊工具的結(jié)合,大模型已經(jīng)具有了通用人工智能的雛形。金融行業(yè)是高價值行業(yè),數(shù)字化基礎(chǔ)好,高度依賴數(shù)據(jù)和技術(shù),是大模型落地應(yīng)用的高潛場景。對于中小金融機(jī)構(gòu),在大模型的浪潮里,他們也有機(jī)會通過應(yīng)用創(chuàng)新,來加快自身的數(shù)字化和智能化進(jìn)程,跨越數(shù)字化鴻溝?!?/p>

專業(yè)性更強(qiáng),更細(xì)分的應(yīng)用場景,需要讓大模型擁有自己的“社會分工”,用垂直的能力適配垂直的市場需求。而金融行業(yè)尋求自己的垂直大模型,是該行業(yè)對專業(yè)度的需求使然,更是因為,金融行業(yè)的頭部企業(yè)有足夠的基礎(chǔ)條件。

大模型所需的三大支柱:算法、算力、數(shù)據(jù)。其中數(shù)據(jù)決定了大模型的智能范圍,而金融行業(yè)有許多公司在多年經(jīng)營中掌握了海量的歷史數(shù)據(jù)和文字資料等,為行業(yè)大模型的開發(fā)提供了天然的便利。且訓(xùn)練垂直大模型所需的數(shù)據(jù)量遠(yuǎn)小于通用大模型,在成本方面更具優(yōu)勢

而諸如度小滿等互聯(lián)網(wǎng)金融、金融科技企業(yè),經(jīng)過了多年經(jīng)營,在算法、算力方面都形成了自己的解決方案。此外,當(dāng)金融企業(yè)使用通用大模型解決專業(yè)性問題時,如果大模型并非本地部署,需要上傳數(shù)據(jù)到對方服務(wù)器。這一過程存在數(shù)據(jù)泄露的風(fēng)險,這對金融行業(yè)而言尤為致命。

2023年上半年,已經(jīng)有企業(yè)率先發(fā)布了自己的金融大模型。

2023年3月,全球領(lǐng)先的商業(yè)、金融信息和財經(jīng)資訊提供商彭博(Bloomberg)發(fā)布了BloombergGPT,該模型構(gòu)建了3630億個數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)總量約為5300億詞,其中金融行業(yè)數(shù)據(jù)占比約為54.2%,但出于數(shù)據(jù)安全考量,該模型尚未以任何形式對外開放。

就在彭博發(fā)布BloombergGPT僅2個月后,國內(nèi)領(lǐng)先的金融科技公司度小滿發(fā)布了國內(nèi)首個開源金融行業(yè)垂直大模型“軒轅”。度小滿方面稱,“軒轅”在金融名詞理解、市場評論、數(shù)據(jù)分析、新聞理解等方面具有明顯優(yōu)勢,在任務(wù)測試中相較于基座模型效果提升了70%。

度小滿CTO許冬亮表示,目前“軒轅”已經(jīng)面向上百家金融機(jī)構(gòu)開放試用。

除了度小滿的“軒轅”外,星環(huán)科技也發(fā)布了面向金融量化領(lǐng)域的生成式大語言模型“無涯Infinity”,恒生電子也預(yù)計在9月開放自研金融大模型LightGPT的試用接口。

行業(yè)大模型有何優(yōu)勢?

OpenAI發(fā)布的ChatGPT,率先在全球范圍內(nèi)掀起了AI熱潮,以及GPT-4的問世,都彰顯著它在通用大模型領(lǐng)域的前沿性。而彭博作為國外老牌咨詢提供商,訓(xùn)練BloombergGPT的大部分?jǐn)?shù)據(jù)來自彭博數(shù)據(jù)分析師們持續(xù)收集、維護(hù)了40年的金融語言文件,能夠先一步發(fā)布金融大模型也是其實力與積淀的表現(xiàn)。

那么國產(chǎn)行業(yè)大模型與上述二者相比,是否存在優(yōu)勢?

首先,與主流開源大模型之間的對比,度小滿發(fā)布的“軒轅”已經(jīng)在金融相關(guān)的專業(yè)性問題上展現(xiàn)出了較為明顯的優(yōu)勢。

公開資料顯示,“軒轅”在金融任務(wù)評測中,全面超越了目前主流的通用大模型。在150次回答中贏得了63.33%的勝率。而在通用能力評測中,軒轅有10.2%的任務(wù)表現(xiàn)超越ChatGPT3.5,另有61.22%的任務(wù)表現(xiàn)與之持平,題目涉及數(shù)學(xué)計算、場景寫作、邏輯推理、文本摘要等13個主要維度。

金融任務(wù)的評測成績意味著,比起目前的主流通用大模型,“軒轅”對于金融相關(guān)領(lǐng)域問題的回答會更具專業(yè)性;而通用能力評測中有超過71.42%的任務(wù)表現(xiàn)與主流通用大模型持平甚至超越,則表明“軒轅”在面對金融領(lǐng)域之外的普通問題時,表現(xiàn)與通用大模型較為接近,“軒轅”也能夠?qū)崿F(xiàn)大部分通用大模型的功能。

從參數(shù)的豐富度上看,“軒轅”基于1760億參數(shù)的Bloom訓(xùn)練而來,較彭博發(fā)布的大模型參數(shù)更豐富。此外,度小滿還將自身在實際業(yè)務(wù)中積累的、規(guī)模在千億級別的tokens的中文預(yù)訓(xùn)練數(shù)據(jù)集加入到“軒轅”大模型的研發(fā)中。

為此,《投資者網(wǎng)》根據(jù)伙乘平臺對“軒轅”大模型的提問結(jié)果,就同樣的問題向Bing AI提問,以簡單測試“軒轅”大模型與主流通用大模型之間的差異。

結(jié)果表明對于類似“如果一家公司總資產(chǎn)為500億美元,總負(fù)債為300億美元,股東權(quán)益是多少?”這類涉及簡單計算與概念解釋的問題,二者均給出了正確答案與計算步驟。差異在于,“軒轅”大模型的回答中,還額外解釋了“凈資產(chǎn)不等同于股東權(quán)益”的概念。??

(前者為Bing AI的回答,后者為“軒轅”的回答? ?《投資者網(wǎng)》研究員收集整理)

而對于“你能解釋一下什么是抵押貸款和信用貸款的區(qū)別嗎?”這一問題,Bing AI和“軒轅”給出的答案內(nèi)容基本一致,區(qū)別在于前者的答案概括性比較強(qiáng)且比較零散,后者的答案條理較為清晰,便于提問者快速找出自己需要的部分。

經(jīng)過一系列問題的對比,能夠明顯發(fā)現(xiàn),在通常的名詞解釋類問題中,二者的表現(xiàn)不相上下。而在回答比較專業(yè)的金融類問題時,“軒轅”的回答不僅能夠讓使用者了解答案本身,還能夠根據(jù)問題引申出一些容易混淆的概念并給出具體的解釋。

在2023年全球數(shù)字經(jīng)濟(jì)大會人工智能高峰論壇上,“度小滿軒轅大模型在金融領(lǐng)域的應(yīng)用”入選“北京市人工智能行業(yè)(大模型類)賦能典型案例(2023)”。

在“軒轅”發(fā)布的一個月后,恒生電子也發(fā)布了自研的金融大模型LightGPT,國產(chǎn)行業(yè)大模型再傳佳訊。恒生電子首席科學(xué)家白碩介紹稱,LightGPT使用了超過4000億tokens的金融領(lǐng)域數(shù)據(jù),輔以超過400億tokens的語種強(qiáng)化數(shù)據(jù),能夠滿足各類金融企業(yè)的業(yè)務(wù)需求。

與海外企業(yè)發(fā)布的金融大模型相比,國內(nèi)企業(yè)發(fā)布的大模型在訓(xùn)練階段采用的數(shù)據(jù)會更貼合國內(nèi)金融實踐,得出的結(jié)論也更適合國內(nèi)金融行業(yè)發(fā)展的實際情況。與BloombergGPT尚未開放不同,目前“軒轅”已經(jīng)可以在Huggingface中申請下載,面向上百家金融機(jī)構(gòu)開放試用;恒生電子發(fā)布的LightGPT也將于9月份開放試用接口。

國產(chǎn)行業(yè)大模型的逐漸鋪開,會為國內(nèi)金融行業(yè)帶來怎樣的改變?是一個值得行業(yè)關(guān)注的重要趨勢。

大模型時代的前夜

眼下,國內(nèi)金融行業(yè)已經(jīng)來到大模型時代的前夜,天邊已經(jīng)泛起一抹魚肚白,而當(dāng)這一縷名為“大模型”的曙光真正照進(jìn)行業(yè)時,我們眼前看到的,將會怎樣的一番天地呢?

首先,大模型將極大提升金融機(jī)構(gòu)收集、整理信息的能力。

還是以度小滿為例,最新數(shù)據(jù)顯示,度小滿已經(jīng)累計為超過1800萬小微企業(yè)主和個體工商戶授信。整個2022年,度小滿為小微企業(yè)發(fā)放信用貸款超過5200億元。在長期的業(yè)務(wù)實踐中,度小滿在大數(shù)據(jù)技術(shù)的支持下已經(jīng)建立了較為完善的征信中臺。

小微企業(yè)常常會因為規(guī)模小、質(zhì)押物不足等問題,在面臨資金短缺時找不到合適的融資渠道。而傳統(tǒng)的征信報告解讀方式,也存在誤判企業(yè)成色的可能:征信報告干凈的客戶,或許與黑產(chǎn)有關(guān),部分優(yōu)質(zhì)客戶,有時也會因為近期資金緊張而無法通過征信評估。

而大數(shù)據(jù),作為大模型的前置科技,其海量的專業(yè)數(shù)據(jù)能夠保障大模型的專業(yè)性、精確度。如今,度小滿的征信中臺能夠結(jié)合大語言模型,將征信報告解讀出40多萬個與風(fēng)險相關(guān)的指標(biāo),把銀行風(fēng)控模型的風(fēng)險區(qū)分度提升了26%。

與傳統(tǒng)評估方式涉及的幾百個指標(biāo)相比,度小滿在大模型的支持下,能夠更全面地評估貸款人的基本情況,在降低信貸風(fēng)險的同時,切實解決優(yōu)質(zhì)小微企業(yè)融資難的問題。

度小滿表示,經(jīng)過清洗和標(biāo)注的高質(zhì)量數(shù)據(jù)集,不僅在通用性方面與ChatGPT達(dá)到持平成為可能,且顯著提升了模型在金融垂直領(lǐng)域的性能。軒轅大模型的數(shù)據(jù)集覆蓋了金融研報、股票、基金、銀行、保險大多數(shù)金融領(lǐng)域中常見的應(yīng)用場景。

恒生電子發(fā)布的LightGPT的功能與“軒轅”相近,能夠為投顧、客服、投研、運(yùn)營、風(fēng)控、合規(guī)、研發(fā)等金融業(yè)務(wù)場景提供底層 AI 能力支持。

隨著大模型技術(shù)在金融行業(yè)各領(lǐng)域的參與度逐漸加深,金融機(jī)構(gòu)的業(yè)務(wù)也將會朝著更加科學(xué)、高效的方向發(fā)展。大模型時代的金融業(yè),值得每一個人期待。(思維財經(jīng)出品)■

標(biāo)簽:

精彩文檔: