21世紀經(jīng)濟報道記者 陳植 上海報道
AI大模型技術(shù)正悄然改變?nèi)虣C構(gòu)開戶業(yè)務(wù)場景操作生態(tài)。
一位券商IT部門人士向記者透露,以往在機構(gòu)開戶業(yè)務(wù)辦理過程,私募基金、信托、銀行、保險、公募基金等各類金融機構(gòu)需遞交上傳大量影像資料,且主要由人工操作進行逐項分揀,導(dǎo)致匹配速度慢、效率低下,且容易出錯。有些時候券商業(yè)務(wù)人員不得不要求金融機構(gòu)反復(fù)上傳并核對資料,耗時耗力。
“我們也曾考慮借助OCR(光學(xué)字符識別)技術(shù)設(shè)立標準化的線上操作流程,但在實際操作環(huán)節(jié),不同金融機構(gòu)的開戶申請表、交易所風(fēng)險揭示書、內(nèi)部使用的各種表單盡管要素一致但格式各不相同,加之有些手寫材料的字跡差別較大,靠傳統(tǒng)OCR技術(shù)難以解決,最終又回到人工操作環(huán)節(jié),令材料審核流程與效率持續(xù)低下。”他指出。這已經(jīng)影響到他們的機構(gòu)開戶業(yè)務(wù)拓展——隨著市場競爭日益激烈,誰能給機構(gòu)客戶提供更佳的服務(wù)體驗,誰就有望獲得更大的機構(gòu)業(yè)務(wù)市場蛋糕,而開戶場景恰恰是機構(gòu)客戶衡量券商服務(wù)能力的一塊“試金石”。
記者獲悉,這驅(qū)動越來越多券商開始考慮引入AI大模型技術(shù)解決機構(gòu)開戶業(yè)務(wù)場景的諸多痛點。
華福證券數(shù)智賦能部研發(fā)中心總經(jīng)理謝琪近日接受本報記者采訪時表示,華福證券已依托騰訊云TI-OCR平臺的賦能,嘗試將大模型技術(shù)用于機構(gòu)開戶業(yè)務(wù)場景。
在他看來,AI大模型技術(shù)在機構(gòu)業(yè)務(wù)開戶場景的主要應(yīng)用,是以較低資金、人力與時間的投入,一站式地解決券商在機構(gòu)開戶復(fù)雜環(huán)境下的開戶協(xié)議識別、開戶材料智能分揀、票據(jù)識別等諸多挑戰(zhàn)。比如在當前機構(gòu)開戶業(yè)務(wù)場景,券商工作人員完成資料上傳耗時久,主要原因是資料數(shù)量多、手動分揀與匹配速度慢、拍照次數(shù)多。若能通過AI大模型技術(shù)優(yōu)化資料采集方式,允許券商工作人員批量拍照上傳,系統(tǒng)隨即自動將照片歸類到對應(yīng)類別下,快速解決手動分揀與匹配上傳慢等問題,就能大幅提升機構(gòu)開戶效率。
據(jù)悉,騰訊云TI-OCR平臺通過搭載大模型能力,主要解決圖像干擾、混合版式、表格結(jié)構(gòu)化識別等傳統(tǒng)OCR領(lǐng)域核心痛點。
上述券商IT部門人士向記者透露,為了提升機構(gòu)開戶業(yè)務(wù)場景的操作效率,此前不少券商都引入了不同功能的OCR技術(shù),但在實際操作環(huán)節(jié),傳統(tǒng)OCR技術(shù)仍面臨對手寫體識別效果不佳、數(shù)字間有柵欄易受干擾;在密集表格、單元格中文本換行等場景下識別效果不佳;長文提取關(guān)鍵字段信息難,段落之間沒有關(guān)聯(lián)關(guān)系;對自然場景下的圖片識別效果不佳;訓(xùn)練樣本需求龐大,訓(xùn)練時間長等痛點。這也是當前越來越多券商紛紛試水大模型技術(shù)在機構(gòu)開戶業(yè)務(wù)場景應(yīng)用的一大關(guān)鍵因素。
在他看來,大模型技術(shù)若要在券商機構(gòu)開戶業(yè)務(wù)場景獲得廣泛應(yīng)用,還需具備多項能力,一是其智能結(jié)構(gòu)化模型能在數(shù)千版式識別方面實現(xiàn)極高的泛化準確率;二是泛化能力強且能開箱即用,有效降低券商的技術(shù)接入使用成本;三是擁有成熟的多模態(tài)技術(shù)并突破檢測識別領(lǐng)域痛點,比如在手寫體識別、套打/印章/水印干擾等場景能通過小樣本精調(diào)大幅提升召回率;四是精細化的標注模式;五是便捷的生成方式以大幅提升機構(gòu)開戶資料的識別及使用核查效率等。
騰訊云智能高級產(chǎn)品架構(gòu)師丁鵬告訴記者,為了達到券商機構(gòu)開戶業(yè)務(wù)場景所要求的大模型技術(shù)性能要求,騰訊云針對TI-OCR 平臺做了大量大模型技術(shù)訓(xùn)練,解決傳統(tǒng)OCR技術(shù)尚未解決的痛點,比如在印章干擾(單據(jù)上面蓋有多個合同章或公章等,在識別環(huán)節(jié)存在相互干擾問題)、手寫識別等相對復(fù)雜的識別場景,傳統(tǒng)OCR技術(shù)需先將整個識別拆成很多段,先檢測再識別再做結(jié)構(gòu)化,沒有辦法通過端到端的方式實現(xiàn)每一個層面的“理解”。
如今。大模型技術(shù)可以先對圖像進行增強,對表格類材料里某些相對潦草的文字書寫進行有效識別,從而在“端到端”過程避開每個環(huán)節(jié)可能出現(xiàn)的問題,避免多個階段的錯誤累積,有效提升開戶申請材料的識別準確性,減少重復(fù)索取材料反復(fù)核對的工作流程。
謝琪告訴記者,經(jīng)過一段時間的實踐測試,在騰訊云基于大模型技術(shù)的TI-OCR平臺支持下,華福證券的機構(gòu)開戶系統(tǒng)資料上傳環(huán)節(jié)的準確率和時效性提高約50%。
“尤其是隨著線上業(yè)務(wù)的日益普及,越來越多員工都開始主動上門,為機構(gòu)客戶辦理非現(xiàn)場見證開戶。以往在沒有AI大模型技術(shù)支持的情況下,業(yè)務(wù)人員必須根據(jù)系統(tǒng)提示,將機構(gòu)資料逐一上傳到指定位置,但這需要券商對業(yè)務(wù)人員加大培訓(xùn),以免他們在實際操作環(huán)節(jié)出錯導(dǎo)致開戶流程更加復(fù)雜。”他舉例說,如今基于AI大模型技術(shù)的智能分揀環(huán)節(jié),業(yè)務(wù)人員只需將客戶開戶材料拍照并點擊上傳,系統(tǒng)就能自動將這些材料“分配”到指定位置,大幅降低了操作出錯率并提升了開戶流程效率。
謝琪表示,隨著TI-OCR平臺應(yīng)用在機構(gòu)開戶、智能分揀等領(lǐng)域并取得不錯效果,華福證券正計劃將TI-OCR平臺作為OCR原子服務(wù)能力上架到公司AI中臺,賦能更多的業(yè)務(wù)應(yīng)用場景。
記者獲悉,如今AI大模型技術(shù)除了在文檔多模態(tài)識別等領(lǐng)域的應(yīng)用,也正廣泛應(yīng)用在券商投研、輿情采集等領(lǐng)域,成為投顧助手、智能輿情等相關(guān)應(yīng)用迭代升級的“新突破口”。
但是,大模型技術(shù)要在券商更多業(yè)務(wù)場景實現(xiàn)廣泛應(yīng)用,仍需解決數(shù)據(jù)保護、生成式結(jié)論“幻覺”等挑戰(zhàn)。
丁鵬向記者透露,結(jié)論“幻覺”和數(shù)據(jù)合規(guī)使用一直是大模型技術(shù)應(yīng)用經(jīng)常碰到的挑戰(zhàn),也是金融機構(gòu)特別關(guān)注的問題。騰訊云正多管齊下著手解決,在數(shù)據(jù)方面,當前訓(xùn)練數(shù)據(jù)都源于自有或公開收集的合理數(shù)據(jù),且對數(shù)據(jù)進行安全過濾;在算法研究方面,通過有監(jiān)督強化學(xué)習(xí)的技術(shù)手段規(guī)避垃圾檔案等幻覺現(xiàn)象的生成;在產(chǎn)業(yè)實際應(yīng)用方面,通過增強檢索,RAG框架等技術(shù)手段,基于企業(yè)的數(shù)據(jù)庫解決相關(guān)事實的一致性問題,確保回復(fù)合規(guī)且專業(yè);在安全方面,騰訊云在大模型應(yīng)用的輸入端與輸出端都會接入文本、圖片、音視頻審核模型并進行安全過濾。
他直言,要真正做好能提升業(yè)務(wù)效率的大模型,務(wù)必要從實際業(yè)務(wù)需求出發(fā),而不是“為了做大模型而做大模型”。尤其是在金融領(lǐng)域的大模型技術(shù)應(yīng)用,需充分兼顧金融業(yè)務(wù)的復(fù)雜、數(shù)據(jù)保護與合規(guī)安全等問題。
本文鏈接:券商機構(gòu)開戶場景“試水”大模型技術(shù) 傳統(tǒng)OCR技術(shù)痛點瓶頸能否“迎刃而解”http://www.lensthegame.com/show-3-9003-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。