7月28日,在2025世界人工智能大會(huì)論壇上,螞蟻數(shù)科正式發(fā)布金融推理大模型Agentar-Fin-R1,為金融AI應(yīng)用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權(quán)威金融大模型評(píng)測(cè)基準(zhǔn)上超越DeepSeek-R1等同尺寸開源通用大模型以及金融大模型,顯示其更強(qiáng)的金融專業(yè)性、推理能力以及安全合規(guī)能力。
隨著金融業(yè)數(shù)智化轉(zhuǎn)型不斷提速,大模型在金融領(lǐng)域的應(yīng)用正持續(xù)深化,然而在實(shí)際業(yè)務(wù)場(chǎng)景中,往往需要高度專業(yè)的金融知識(shí)、復(fù)雜的業(yè)務(wù)邏輯推理能力以及嚴(yán)格的金融級(jí)安全合規(guī)等要求,現(xiàn)有的大模型在解決實(shí)際金融任務(wù)時(shí)仍然存在諸多挑戰(zhàn)。
“通用大模型距離產(chǎn)業(yè)實(shí)際應(yīng)用存在‘知識(shí)鴻溝’。構(gòu)建專業(yè)的金融大模型是推進(jìn)金融與AI深度融合的必然路徑,未來,金融大模型的應(yīng)用深度將成為金融機(jī)構(gòu)競(jìng)爭(zhēng)力的關(guān)鍵要素?!蔽浵仈?shù)科CEO趙聞飆在演講中表示。
據(jù)悉,螞蟻數(shù)科通過構(gòu)建全面的金融任務(wù)數(shù)據(jù)體系以及模型訓(xùn)練算法創(chuàng)新,實(shí)現(xiàn)模型更強(qiáng)的金融推理能力及可信性。評(píng)測(cè)結(jié)果顯示:相較于通用開源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ兩大主流金融基準(zhǔn)測(cè)試中均取得最高評(píng)分。并且模型在金融能力顯著增強(qiáng)的同時(shí),通用能力也表現(xiàn)出較高水準(zhǔn)。
在數(shù)據(jù)層面,螞蟻數(shù)科構(gòu)建了業(yè)內(nèi)最全面與專業(yè)的金融任務(wù)分類體系,包括6大類、66小類場(chǎng)景,覆蓋銀行、證券、保險(xiǎn)、基金、信托等金融全場(chǎng)景。基于千億級(jí)金融專業(yè)數(shù)據(jù)語料,通過可信數(shù)據(jù)合成技術(shù)以及結(jié)合專家標(biāo)注的金融長(zhǎng)思維鏈(CoT)構(gòu)造機(jī)制,顯著提升模型處理復(fù)雜任務(wù)的能力,讓大模型“天生懂金融,出廠即專家”。
在訓(xùn)練層面,創(chuàng)新的加權(quán)訓(xùn)練算法,提高大模型對(duì)復(fù)雜金融任務(wù)學(xué)習(xí)效率與性能。在后續(xù)業(yè)務(wù)應(yīng)用中,可顯著減少二次微調(diào)的數(shù)據(jù)需求與算力消耗,有效降低大模型在企業(yè)落地的門檻與成本。此外,Agentar-Fin-R1還能不斷更新迭代,吸收最新的金融政策、市場(chǎng)動(dòng)態(tài)等關(guān)鍵信息,并通過配套評(píng)測(cè)工具進(jìn)行針對(duì)性優(yōu)化,讓模型能力在真實(shí)業(yè)務(wù)場(chǎng)景中不斷提升。
據(jù)悉,Agentar-Fin-R1包括32B和8B參數(shù)兩個(gè)版本。螞蟻數(shù)科還推出基于百靈大模型的MOE架構(gòu)模型,獲得更優(yōu)推理速度。此外,還有非推理版本的14B和72B參數(shù)大模型,以滿足金融機(jī)構(gòu)在多樣化場(chǎng)景下的部署需求。
為了考察大模型在實(shí)際金融場(chǎng)景中部署的能力,螞蟻數(shù)科還聯(lián)合中國(guó)工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會(huì)等機(jī)構(gòu)聯(lián)合推出Finova大模型金融應(yīng)用評(píng)測(cè)基準(zhǔn),深度考察智能體能力、復(fù)雜推理以及安全合規(guī)能力。在Finova評(píng)測(cè)中,Agentar-Fin-R1也取得最高評(píng)分,甚至超越更大參數(shù)規(guī)模的通用模型。目前Finova已經(jīng)全面開源,推動(dòng)行業(yè)共同提升大模型在金融領(lǐng)域的應(yīng)用水平。
螞蟻數(shù)科是螞蟻集團(tuán)旗下獨(dú)立科技子公司,致力于以AI及Web3技術(shù)助力產(chǎn)業(yè)數(shù)智化升級(jí)。今年以來,螞蟻數(shù)科加速布局企業(yè)級(jí)大模型服務(wù),并聚焦金融與新能源兩大行業(yè)場(chǎng)景。在金融領(lǐng)域,螞蟻數(shù)科此前推出金融智能體平臺(tái)Agentar,成為首批通過信通院評(píng)測(cè)的智能體平臺(tái)產(chǎn)品,并獲最高評(píng)級(jí)5級(jí)。螞蟻數(shù)科還聯(lián)合行業(yè)合作伙伴,推出超百個(gè)金融智能體解決方案,加速大模型在金融業(yè)規(guī)?;瘧?yīng)用。
以上海某銀行為例,螞蟻數(shù)科助力上海某銀行打造的AI手機(jī)銀行,創(chuàng)新“對(duì)話即服務(wù)”模式,用戶通過自然對(duì)話即可獲取各類金融服務(wù),推動(dòng)銀行老年客戶滿意度顯著提升,月活用戶同比增長(zhǎng)25%。目前,螞蟻數(shù)科累計(jì)已服務(wù)100%的國(guó)有銀行和股份制銀行、超60%的地方性商業(yè)銀行、數(shù)百家金融機(jī)構(gòu)。
原標(biāo)題:《螞蟻數(shù)科發(fā)布金融推理大模型,助力金融機(jī)構(gòu)加速落地智能體應(yīng)用》
欄目裘穎瓊題圖來源:采訪對(duì)象提供圖片來源:采訪對(duì)象提供
來源:作者:新民晚報(bào)金志剛
13本能讓書友重復(fù)閱讀的超級(jí)爽文,精彩程度拉滿,推薦收藏關(guān)注!
我的世界:不可思議的10個(gè)種子,5顆末影之眼激活末地門,沒騙你
特別推薦的經(jīng)典大作《開局獲得傳送門,已上交國(guó)家》,追書的動(dòng)力有了!
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。