(來源:財通證券研究)
中國AI新浪潮:KimiK2“開源沖擊波”,“又一個DeepSeek時刻”。2025年全球AI高速發(fā)展,中美大模型競爭激烈。7月11日MoonshotAI發(fā)布的KimiK2開源模型成焦點,被視為中國AI差異化競爭策略,獲“又一個DeepSeek時刻”評價,標志中國開源大模型具世界級競爭力。該模型采用MoE架構,總參數量1萬億,激活參數約320億,以“智能體潛能”見長,編碼能力突出。技術上優(yōu)化自DeepSeek-V3,擅長執(zhí)行明確計劃,是自動化工作流理想“執(zhí)行者”,聚焦編碼等場景極致表現。此前Kimi推出內測產品Kimi-Researcher,依托K1.5的Agent能力完成復雜研究,多項基準測試成績良好,K2推出后其能力將升級。K2開源且API定價極低,遠低于同類產品,通過低成本吸引開發(fā)者構建生態(tài),未來可通過企業(yè)服務等盈利。綜上,K2標志中國AI在大模型領域重大突破,開源策略能吸引開發(fā)者、挑戰(zhàn)閉源巨頭,提供高性價比替代方案。
美國AI雙雄會:Grok4與ChatGPTAgent的策略分野。馬斯克旗下xAI于7月10日推出Grok4,其訓練量較Grok2提升100倍。工具使用能力內化訓練,20萬張GPU超算支持,Colossus超算總內存帶寬達194PB/s,存儲容量超1EB。Grok4能力卓越,推理與多模態(tài)表現突出:SAT、GRE接近滿分,HLE無工具解決率25.4%,Heavy版本超50%;GPQA等多個基準測試全面超越ClaudeOpus4等對手。多模態(tài)上,ARC-AGI-2刷新紀錄達15.9%。xAI計劃8月發(fā)布代碼模型,9月推多模態(tài)智能體,10月出視頻生成模型,明年有望推出AI生成游戲,將構建技術-場景-生態(tài)三級平臺。7月18日,OpenAI發(fā)布ChatGPTAgent,這是基于GPT-4架構的先進多模態(tài)通用AI代理系統(tǒng),實現從被動應達到主動代理的升級,能規(guī)劃任務、調用工具并自主執(zhí)行,具備強大多模態(tài)理解和超長上下文處理能力,結合Operator和DeepResearch形成端到端通用Agent。其在復雜任務中表現出色:HLE評估Pass@1分數41.6;DSBench測試顯著超越此前最先進模型,數據分析任務表現優(yōu)于人類。
海內外大模型百花齊放,AI新時代悄然已至。我們認為,未來1-2年全球AI將以加速融合、能力躍升和應用深化為主線:Agent能力、多模態(tài)理解生成成標配,上下文窗口擴大,混合專家架構平衡性能與成本;開源閉源競合加劇,推動技術進步與成本下降,倫理安全監(jiān)管標準趨完善;AI深度滲透多行業(yè),通過API服務和行業(yè)模型驅動轉型,催生新商業(yè)模式。投資上,AI硬件與應用共譜新篇章。
風險提示:技術迭代不及預期的風險;商業(yè)化落地不及預期的風險;政策支持不及預期風險;全球宏觀經濟風險。
正文內容
01
中國AI新浪潮:KimiK2“開源沖擊波”,“又一個DeepSeek時刻”
月之暗面MoonshotAI發(fā)布KimiK2基座模型吹響“又一個DeepSeek時刻”。2025年,全球人工智能領域持續(xù)經歷著前所未有的高速發(fā)展與激烈競爭,中美大模型研發(fā)和產品迭代尤為引人注目。近日,一批業(yè)內領先的AI大模型相繼涌現,正深刻地改變著人機交互的方式,并有望在各行各業(yè)催生創(chuàng)新應用。7月11日,MoonshotAI發(fā)布KimiK2開源模型,成為全球AI領域的一大焦點。我們認為,它不僅是性能強大的模型,更代表中國AI力量在全球競爭中采取的一種差異化、高影響力的策略。KimiK2的出現,被業(yè)界評價為“又一個DeepSeek時刻”,標志著中國在開源大模型領域已具備世界級的競爭力。
1.1目前最大開源模型之一,基于DeepSeek-V3優(yōu)化推進底層技術創(chuàng)新
KimiK2具有龐大參數規(guī)模與高效MoE架構,擅長執(zhí)行自動化工作流長任務。KimiK2采用了混合專家(Mixture-of-Experts,MoE)架構,總參數量高達1萬億,在處理每個任務時激活約320億參數。在模擬真實世界軟件開發(fā)任務的SWE-bench上,KimiK2的性能與閉源模型Claude4Opus非常接近;而在衡量實時互動編程能力的LiveCodeBench上,KimiK2以53.7%的準確率超越了GPT-4.1和Claude4Opus。我們認為,綜合以上數據,KimiK2尤其擅長執(zhí)行具體的、定義明確的計劃,是構建自動化工作流的理想“執(zhí)行者”。
KimiK2的核心技術優(yōu)勢主要體現在以下幾個方面:
基于DeepSeek-V3的繼承與優(yōu)化。在設計之初團隊進行了大量模型結構相關的scaling實驗,基于實驗結果的準確有效性和成本的考量,模型結構的設計問題主要集中于如何在給定DeepSeek-V3結構的框架下選擇合適的參數使得模型在訓練、推理成本與DeepSeek-V3相當的前提下,獲得明顯更低的數據損失。為此,技術團隊在復用DeepSeek的MLA(Multi-HeadLatentAttention)的基礎上進行優(yōu)化,具體的改動主要包含:
減少注意力頭:減半attentionheads以降低Infra的壓力,同時減少num_heads變數以實現時間和成本的平衡;
提升專家數量:將專家數量從256升到384,既為了補回沒有doubleheads帶來的損失,同時也能符合實測的ScalingLaw。即在一定范圍內,固定激活的專家數量,使得增加總專家數帶來的效果收益,大于增加的Infra成本;
精簡前期Dense層:將前置Dense層數由3降至1。與DeepSeek的觀察類似,第一層MoE的router很難做到負載均衡,但第二層之后則未出現問題;為了更充分利用MoE優(yōu)勢,技術團隊只保留第一層Dense,其余全用MoE;
MoERouter簡化,n_group=1:在當前模型參數規(guī)模下,為保證MoE計算耗時在合理范圍內,采用更自由的router方案使得expert的組合空間顯著增大,從而進一步提升模型能力。
總結來看,K2技術團隊在DeepSeek-V3原有框架基礎上進行優(yōu)化,通過減少“注意力頭”來降低服務器壓力,同時增加專家數量以補回效果損失;此外還精簡了前期固定層,僅保留一層,并讓專家調度更靈活,取消分組搭配,從而使組合方式更多樣,效果也更好。
底層技術創(chuàng)新提升訓練穩(wěn)定性:月之暗面團隊自研“MuonClip”優(yōu)化器,克服“訓練崩潰”問題。根據其技術報告,MuonClip通過一種創(chuàng)新的“qk-clip”技術,在訓練過程中動態(tài)調整權重,有效防止了注意力分數的爆炸,從而確保了在15.5萬億tokens的龐大數據集上訓練過程的“零不穩(wěn)定”。這一底層工程和算法的突破,是KimiK2能夠成功問世的核心技術保障之一。
1.2Kimi:主打AIAgent與“高性價比”的實戰(zhàn)派
KimiK2作為優(yōu)化AIAgent的實戰(zhàn)模型,其功能并非追求在所有領域都做到頂尖,而是在開發(fā)者最需要的編碼和工具調用等場景中做到極致,在智能體任務的完成速度與質量中進步。
工具調用及數學推理能力:在工具調用能力測試中表現接近行業(yè)領先水平,具備穩(wěn)定的復雜指令解析能力,可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的ToolCall結構;在AIME2025中得分高達49.5,在數學定理和邏輯判斷方面表現出色,是研究和教育用戶的高性價比方案。
前端開發(fā)能力和APP兼容性:擅長生成兼具設計感與視覺表現力的代碼,支持粒子系統(tǒng)、可視化和3D場景等表現形式,具備較強的圖形能力與交互性。
性能與局限性的平衡視角:作為一個“非思考”模型,KimiK2的優(yōu)點在于響應速度快,擁有128K的長上下文處理能力,并且在編碼等特定任務上表現優(yōu)異。局限性在于,對于需要深度、多步、復雜邏輯推理的任務,其能力可能不及思考型模型。
Kimi-Researcher在應用場景、成本、生態(tài)全方位撬動市場格局。在KimiK2發(fā)布前夕,Kimi發(fā)布Agent產品Kimi-Researcher。其作為MoonshotAI在2025年6月底開啟內測的垂直場景應用產品,其底層模型當前調用K1.5,通過K1.5的Agent能力,自動完成復雜研究任務,并輸出交互式內容,而非傳統(tǒng)文本對話。目前,KimiResearcher在Humanity’sLastExam(HLE)中獲得了26.9%的Pass@1分數,Pass@4準確率為40.17%。此外,在xbench-DeepSearch上實現了69%的通過率。在多輪搜索推理FRAMES,Seal-0和事實信息SimpleQA的基準測試中,Kimi-Researcher也取得了很好的表現。后續(xù),隨著KimiK2模型的推出,Kimi-Researcher能力也將更上一層樓。
極具性價比的定價與生態(tài)驅動的商業(yè)模式。KimiK2此次不僅以開源形式大方問世,同時采用極具性價比的API定價策略,其價格遠低于OpenAI和Anthropic的同類產品,極大程度上吸引了對成本敏感的開發(fā)者和企業(yè)。與此同時,KimiK2秉持生態(tài)驅動的商業(yè)模式,商業(yè)邏輯是通過免費和極低成本的API服務吸引海量開發(fā)者和用戶,迅速擴大在AI應用層的基礎,以此培養(yǎng)用戶習慣并形成強大網絡效應;隨著生態(tài)成熟,月之暗面未來可通過提供企業(yè)級解決方案、定制化服務或與云廠商合作分潤等方式實現盈利,而其寬松的商業(yè)使用條款則有望進一步加速這一進程。
綜上,我們認為KimiK2的發(fā)布標志著中國AI公司在大規(guī)模語言模型領域的重大突破,展示了其在萬億參數模型訓練、MoE架構設計和代碼能力方面的技術實力,同時也反映了開源AI模型在中國的快速發(fā)展和廣泛應用。在OpenAI等巨頭對核心模型愈發(fā)封閉的背景下,KimiK2開源策略既能迅速吸引全球開發(fā)者的關注和使用,構建起一個龐大的開發(fā)者生態(tài),亦能挑戰(zhàn)頂級閉源模型的技術護城河,為開發(fā)者和企業(yè)提供了高性價比的替代方案。
02
?美國AI雙雄會:Grok4與ChatGPTAgent的策略分野
2.1Grok4:專攻高難任務的“理科博士”,10x算力訓練量延續(xù)ScalingLaw躍遷奇跡
xAI構建全球頂級超算集群,刷新Grok4模型訓練新高度。馬斯克旗下xAI公司于北京時間7月10日推出新一代旗艦模型Grok4,代表了美國AI技術的最新發(fā)展方向。在訓練規(guī)模上,相比Grok2的訓練量提升了100倍,特別是在強化學習(RL)階段投入的算力是市面上其他任何模型的10倍以上;同時,構建了全球頂級超算集群(20萬張H100GPU)支持訓練,總內存帶寬達194PB/s,存儲容量超1EB。
多項測評表現刷新SOTA,HLE超越50%。Grok4在多個領域展現出卓越能力,在推理能力和多模態(tài)處理方面尤其突出。在SAT、GRE等高難度考試中接近滿分,展現出超越人類的推理水平。馬斯克稱,Grok4卻在HLE的所有領域,都達到了博士級別,甚至勝過了大多數人類博士生。其在沒有使用工具的情況下解決了HLE中25.4%的問題,多智能體版本Grok4Heavy解決率更是超過了50%,成為所有模型中的首次突破。Grok4及Grok4Heavy在GPQA、AIME25、HMMT等多個頂級基準測試中,表現全面超越所有競爭對手,包括ClaudeOpus4與Gemini2.5Pro。此外,在多模態(tài)理解方面,Grok4能理解主觀概念,搜索和分析圖片,在ARC-AGI測試中,Grok4在ARC-AGI-2大幅刷新紀錄達15.9%,較第二名ClaudeOpus4(8.6%)接近翻倍。
Grok4采取高端定價策略,同時積極拓展應用場景。Grok4目前C端價格為$30/月(Grok4)及$300/月(Grok4Heavy)。截至目前,SuperGrok的用戶已經可以使用,Grok4API也已向所有開發(fā)者正式開放,并將登錄第三方云平臺。在未來,xAI宣布計劃于2025年8月發(fā)布代碼模型,9月發(fā)布多模態(tài)智能體,10月發(fā)布視頻生成模型,并且在明年有望推出第一款AI生成的游戲。我們認為,此次階梯式定價本質是以技術分層實現用戶分層,既維持品牌高端形象,又為中低端產品留出空間。API的開放有望進一步降低基于Grok4的企業(yè)大模型集成門檻。xAI的更新路線圖進一步表明,盡管目前Grok4存在一定的提升空間,其未來也將構建出技術-場景-生態(tài)的三級平臺。
2.2ChatGPTAgent:端到端任務的“全能管家”
端到端通用AIAgent近在咫尺。北京時間7月18日,OpenAI發(fā)布ChatGPTAgent。ChatGPTAgent是基于GPT-4架構構建的、具備高級推理和自主執(zhí)行能力的智能代理模型,是目前最先進的多模態(tài)、具備類人任務規(guī)劃和執(zhí)行能力的通用人工智能代理系統(tǒng)之一。其核心進步在于從被動應答升級為主動代理,能規(guī)劃任務、調用工具并自主執(zhí)行目標,且具備強大的多模態(tài)理解和超長上下文處理能力。ChatGPTAgent結合Operator和DeepResearch形成了統(tǒng)一的智能體,實現了端到端的通用Agent。
ChatGPTAgent實現從問答機器人到通用AI代理的跨越,能夠完成復雜任務。在HLE中,支持ChatGPTAgent的模型在該評估中的Pass@1分數為41.6。在旨在評估智能體在涵蓋數據分析和建模等現實數據科學任務中表現的DSBench?測試中,ChatGPTAgent顯著超越了之前的最先進模型,尤其在數據分析任務中,其表現優(yōu)于人類水平。在定位于評估模型在處理基于真實世界場景的電子表格編輯任務時的表現的SpreadsheetBench平臺中,ChatGPTAgent也取得了SOTA,其性能較當前行業(yè)領先的GPT?4o提升了超過一倍。當具備直接編輯電子表格的能力時,ChatGPTAgent的得分進一步提升至45.5%,大幅超越CopilotinExcel。在內部基準測試中展現出入門級投資銀行分析師(1-3年工作經驗)的能力,在InverstmentBankingModelingTasks測試中優(yōu)于DeepResearch和o3模型。
OpenAI將ChatGPTAgent作為其現有付費方案(Plus、Team和Enterprise)的一項增值功能推出,并對Plus和Team用戶設置了每月40次的使用配額限制。Pro、Plus和Team用戶可以通過聊天框下方的工具下拉菜單,選擇"agentmode"(代理模式)來激活此功能。此外,ChatGPTAgent還集成了文本瀏覽器、GUI瀏覽器、終端和圖像生成工具,為用戶提供了全面的工具支持,同時也支持與用戶進行交互式、多輪對話,允許用戶實時指導和調整任務方向。
03
?海內外大模型百花齊放,AI新時代悄然已至
AGI漸行漸近。對KimiK2、Grok4和ChatGPTAgent和的深入分析揭示了當前全球AI發(fā)展的核心圖景:盡管中美頂尖參與者在戰(zhàn)略、技術和商業(yè)模式上選擇了迥異的道路,但他們正朝著殊途同歸的大模型未來前進,預示著一個更加多元、競爭激烈且充滿機遇的AI新時代的到來。
觀察海內外近期的模型與產品進展,我們認為當前AI產業(yè)趨勢可以歸納為以下幾點:
混合專家(MoE)架構應用趨勢顯著:將模型拆分為多個相對獨立的“專家”子網絡,推理時僅激活部分專家,大幅降低計算成本與能耗,使得更大規(guī)模模型的訓練與部署成為可能。
高效訓練與輕量推理:除了MoE之外,還廣泛采用模型量化、知識蒸餾等技術,在保證性能的前提下進一步壓縮模型體積、提升推理速度并降低部署門檻。
強化邏輯推理與數學能力:模型不再僅靠模式匹配,而是具備更深層次的思考和分析能力,能夠解答復雜邏輯問題、執(zhí)行代碼生成以及為科學研究和決策支持提供技術保障。
極長上下文窗口:支持處理數萬乃至數十萬Token的輸入,使其在長文檔理解、持續(xù)對話和大規(guī)模代碼庫分析等場景中表現更連貫、信息覆蓋更全面。
跨模態(tài)理解成為多模態(tài)能力的核心:
■?多模態(tài)輸入/輸出:不僅處理文本,還能理解并生成圖像、音頻、視頻等多種數據形式。
■??跨模態(tài)融合:能夠將不同模態(tài)的信息關聯、融合并進行綜合推理,支撐更自然的多模態(tài)人機交互。
從“被動響應”到“主動行動”的Agent能力:新一代大模型被賦予更強的自主性,能夠理解復雜目標、制定執(zhí)行計劃、調用外部工具并完成多步任務,真正實現以目標驅動的智能代理。
從AI產業(yè)商業(yè)化程度看,我們認為海內外大模型將采取相似但又具市場特色的商業(yè)化方案。
商業(yè)策略日益多樣化。從傳統(tǒng)的API按調用次數收費,逐漸擴展到訂閱模式、開源增值服務、平臺生態(tài)構建等多種形式,反映了市場需求的差異化和廠商對不同商業(yè)模式可行性的探索。
市場采用速度在不同地區(qū)表現出差異。中國市場在AI大模型的應用和商業(yè)化方面呈現出快速增長的趨勢,特別是在代理智能和本地化部署方面需求強烈。相比之下,美國市場雖然技術領先,但在某些傳統(tǒng)行業(yè)的滲透和應用深化方面或將面臨不同的挑戰(zhàn)和機遇。
政府合作成為AI商業(yè)化的重要方向。AI公司與政府機構如國防、醫(yī)療、科研等部門的合作日益緊密。Grok4明確將政府合作作為其商業(yè)化的重要一環(huán)。而在中國,商業(yè)化更側重于消費市場和企業(yè)級應用,通過滿足市場需求來驅動增長。
開源與閉源的商業(yè)模式并行發(fā)展。以Meta的Llama系列和月之暗面的KimiK2為代表的開源策略通過降低技術門檻、構建開發(fā)者生態(tài)來推動技術普及和應用創(chuàng)新,并在此基礎上探索商業(yè)機會。以OpenAI的GPT系列和xAI的Grok系列為代表的閉源或部分閉源策略更側重于通過提供高性能的API和訂閱產品來直接獲取商業(yè)回報。
AI新時代:大模型融合躍升與應用深耕落地。我們認為,未來1-2年全球AI將以加速融合、能力躍升和應用深化為主線:在復雜推理、規(guī)劃及與物理世界交互的Agent能力方面將取得重大突破,多模態(tài)理解與生成(文本、圖像、音頻、視頻)成為標配,上下文窗口持續(xù)擴大支持更長程任務,而混合專家等高效架構則在提升性能與降低成本之間取得平衡;與此同時,開源與閉源的競合格局將更加激烈,推動技術進步與成本下降,并在倫理、安全和監(jiān)管領域形成更完善的國際標準;AI也將深度滲透金融、制造、科研、政府、醫(yī)療等行業(yè),通過靈活多樣的API服務和定制化行業(yè)模型驅動數字化轉型,并在內容創(chuàng)作、軟件開發(fā)、數據分析、教育娛樂等領域催生新商業(yè)模式和增長點。投資上,AI硬件與AI應用交相輝映的時代正在書寫新篇章。
技術迭代不及預期的風險:若AI技術迭代不及預期,大模型優(yōu)化受限,則相關產業(yè)發(fā)展進度會受到影響。
商業(yè)化落地不及預期的風險:大模型盈利模式尚處于探索階段,后續(xù)商業(yè)化落地進展有待觀察。
政策支持不及預期風險:新行業(yè)新技術的推廣需要政策支持,存在政策支持不及預期風險。
全球宏觀經濟風險:垂直領域公司與下游經濟情況相關,存在全球宏觀經濟風險。
注:文中報告節(jié)選自財通證券研究所已公開發(fā)布研究報告,具體報告內容及相關風險提示等詳見完整版報告。
證券研究報告:《中美AI百花齊放,開啟AI新時代》
對外發(fā)布時間:2025年7月20日
報告發(fā)布機構:財通證券股份有限公司(已獲中國證監(jiān)會許可的證券投資咨詢業(yè)務資格)
分析師?楊?燁
SAC證書編號:S0160522050001
聯系人?陳夢筆
團隊介紹
首席分析師楊燁
SAC證書編號:S0160522050001
清華大學計算機軟件專業(yè)學士、中山大學MBA;
八年IT產業(yè)經歷,曾就職于銀行、互聯網公司和券商,2021年新財富最佳分析師計算機行業(yè)第一名團隊核心成員。
分析師王妍丹
SAC證書編號:S0160524040002
上海交通大學工學學士、倫敦瑪麗女王大學金融碩士;
研究方向為智能汽車、能源IT、工業(yè)軟件。
分析師李宇軒
SAC證書編號:S0160524080001
北京航空航天大學工學學士、上海交通大學工學碩士;
研究方向為AI應用、工業(yè)智能化、教育信息化、金融IT。
聯系人鄭元昊
山東大學管理學學士、香港大學商業(yè)分析碩士;
研究方向為政務IT、AI應用、支付IT、銀行IT。
聯系人陳夢筆
紐約大學經濟學和環(huán)境學學士、哥倫比亞大學環(huán)境科學與政策MPA;
研究方向為AI大模型、AI應用等。
聯系人許思琪
渥太華大學學士、澳大利亞國立大學碩士;
研究方向為IDC、AI應用等。
十二本書荒不可錯過的高評分小說,故事情節(jié)震撼,推薦收藏關注!
第十二部、《我死黨穿越了》,作者:白胡子徐提莫,類別:都市都市生活,字數:203萬(已完本)標簽:穿越,日常文,時空門,學生簡介:小說開局主角青梅竹馬的?;ㄅ笥迅铝?,正在傷心的時候,好友的消息發(fā)了過來,說她穿越到了異世界,成了一名強大的法師,手機也跟著她穿越過去,還成了她的金手指-——。接著通過手機將異界 但在現實世界找了兩年,沒有找到妖怪,也沒有獲得修行功法和靈丹妙藥,就在準備放棄時,發(fā)現靈氣復蘇,妖怪出現了,還有魔界入侵,各種仙家寶物也隨之出現。在到后面依靠煉妖壺的幫助,種田發(fā)展自己的勢力,實力在這個過程快速的變強。擊敗入侵的各種怪物,成功拯救世界,踏上巔峰的故事。書評:質量還不錯的都市修仙類等會說-。修仙玄幻文大合集(下),女配要翻身,沙雕群像風,大女主蘇爽文