林禎珠
7月28日,在2025世界人工智能大會論壇上,螞蟻數科正式發(fā)布金融推理大模型Agentar-Fin-R1,為金融AI應用打造“可靠、可控、可優(yōu)化”的智能中樞。Agentar-Fin-R1基于Qwen3研發(fā),在FinEval1.0、FinanceIQ等權威金融大模型評測基準上超越DeepSeek-R1等同尺寸開源通用大模型以及金融大模型,顯示其更強的金融專業(yè)性、推理能力以及安全合規(guī)能力。
隨著金融業(yè)數智化轉型不斷提速,大模型在金融領域的應用正持續(xù)深化,然而在實際業(yè)務場景中,往往需要高度專業(yè)的金融知識、復雜的業(yè)務邏輯推理能力以及嚴格的金融級安全合規(guī)等要求,現有的大模型在解決實際金融任務時仍然存在諸多挑戰(zhàn)。
“通用大模型距離產業(yè)實際應用存在‘知識鴻溝’。構建專業(yè)的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素?!蔽浵仈悼艭EO趙聞飆在演講中表示。
據悉,螞蟻數科通過構建全面的金融任務數據體系以及模型訓練算法創(chuàng)新,實現模型更強的金融推理能力及可信性。評測結果顯示:相較于通用開源模型及其他金融模型,Agentar-Fin-R1在FinEval1.0、FinanceIQ兩大主流金融基準測試中均取得最高評分。并且模型在金融能力顯著增強的同時,通用能力也表現出較高水準。
在數據層面,螞蟻數科構建了業(yè)內最全面與專業(yè)的金融任務分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信托等金融全場景?;谇|級金融專業(yè)數據語料,通過可信數據合成技術以及結合專家標注的金融長思維鏈(CoT)構造機制,顯著提升模型處理復雜任務的能力,讓大模型“天生懂金融,出廠即專家”。
在訓練層面,創(chuàng)新的加權訓練算法,提高大模型對復雜金融任務學習效率與性能。在后續(xù)業(yè)務應用中,可顯著減少二次微調的數據需求與算力消耗,有效降低大模型在企業(yè)落地的門檻與成本。此外,Agentar-Fin-R1還能不斷更新迭代,吸收最新的金融政策、市場動態(tài)等關鍵信息,并通過配套評測工具進行針對性優(yōu)化,讓模型能力在真實業(yè)務場景中不斷提升。
據悉,Agentar-Fin-R1包括32B和8B參數兩個版本。螞蟻數科還推出基于百靈大模型的MOE架構模型,獲得更優(yōu)推理速度。此外,還有非推理版本的14B和72B參數大模型,以滿足金融機構在多樣化場景下的部署需求。
為了考察大模型在實際金融場景中部署的能力,螞蟻數科還聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構聯(lián)合推出Finova大模型金融應用評測基準,深度考察智能體能力、復雜推理以及安全合規(guī)能力。在Finova評測中,Agentar-Fin-R1也取得最高評分,甚至超越更大參數規(guī)模的通用模型。目前Finova已經全面開源,推動行業(yè)共同提升大模型在金融領域的應用水平。
螞蟻數科是螞蟻集團旗下獨立科技子公司,致力于以AI及Web3技術助力產業(yè)數智化升級。今年以來,螞蟻數科加速布局企業(yè)級大模型服務,并聚焦金融與新能源兩大行業(yè)場景。在金融領域,螞蟻數科此前推出金融智能體平臺Agentar,成為首批通過信通院評測的智能體平臺產品,并獲最高評級5級。螞蟻數科還聯(lián)合行業(yè)合作伙伴,推出超百個金融智能體解決方案,加速大模型在金融業(yè)規(guī)?;瘧?。
以上海某銀行為例,螞蟻數科助力上海某銀行打造的AI手機銀行,創(chuàng)新“對話即服務”模式,用戶通過自然對話即可獲取各類金融服務,推動銀行老年客戶滿意度顯著提升,月活用戶同比增長25%。目前,螞蟻數科累計已服務100%的國有銀行和股份制銀行、超60%的地方性商業(yè)銀行、數百家金融機構。
原標題:《螞蟻數科發(fā)布金融推理大模型,助力金融機構加速落地智能體應用》
欄目裘穎瓊題圖來源:采訪對象提供圖片來源:采訪對象提供
來源:作者:新民晚報金志剛
女特工一朝穿成官家千金 馬上就要嫁給傻世子 浴火重來, 她的人生豈能容人擺布 母親慘死, 父親功利, 姨娘惡毒, 姐妹偽善, 極品親戚組團秀下限 夾縫中求生存, 如何才能肆意人生? 只有靠自己! 嫡女歸來, 醫(yī)毒雙絕, 文能宅斗撕綠茶, 武能揮拳揍人渣, 有仇必報, 有恩必償, 復仇路上快意恩仇! 論虐渣, 她是專業(yè)的! 只是她如何也想不到, 這些對她糾纏不休的公子們, 竟一個比一個有底牌 我家瀾瀾溫柔嫻靜, 從來舍不得揍我…… 哎瀾瀾, 你看我跪的還標準嗎? 眾情敵……來源:紅網
作者:老訪風
編輯:洛詩珊
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。