機(jī)器之心報(bào)道
機(jī)器之心編輯部
剛剛,騰訊混元團(tuán)隊(duì)宣布一口氣開源了4款小模型——最大的只有7B,另外還包括4B、1.8B和0.5B三個(gè)型號(hào)。
這些小語言模型使用「消費(fèi)級(jí)顯卡即可運(yùn)行,適用于筆記本電腦、手機(jī)、智能座艙、智能家居等低功耗場(chǎng)景,且支持垂直領(lǐng)域低成本微調(diào)。」
目前,這四個(gè)模型已在GitHub和HuggingFace上線。騰訊混元團(tuán)隊(duì)表示,ARM、高通、英特爾、聯(lián)發(fā)科技等多個(gè)消費(fèi)級(jí)終端芯片平臺(tái)也都宣布支持部署這些模型。
GitHub:
Hunyuan-0.5B:GitHub-Tencent-Hunyuan/Hunyuan-0.5BHunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8BHunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4BHunyuan-7B:https://github.com/Tencent-Hunyuan/Hunyuan-7B
HuggingFace:
Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-InstructHunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-InstructHunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-InstructHunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct
更重要的是,這4個(gè)開源模型的特點(diǎn)不僅是小,而且還都屬于融合推理模型,具備推理速度快、性價(jià)比高的特點(diǎn),用戶可根據(jù)使用場(chǎng)景靈活選擇模型思考模式:
快思考(fastthinking)模式提供簡(jiǎn)潔、高效的輸出;慢思考(slowthinking)涉及解決復(fù)雜問題,具備更全面的推理步驟。
效果上,四個(gè)模型均實(shí)現(xiàn)了跟業(yè)界同尺寸模型的對(duì)標(biāo),特別是在語言理解、數(shù)學(xué)、推理等領(lǐng)域有出色表現(xiàn),在多個(gè)公開測(cè)試集上得分達(dá)到了領(lǐng)先水平。
騰訊混元表示,這四個(gè)模型的亮點(diǎn)在于agent和長(zhǎng)文能力。跟此前開源的Hunyuan-A13B模型一樣,技術(shù)上通過精心的數(shù)據(jù)構(gòu)建和強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)信號(hào)設(shè)計(jì),提升了模型在任務(wù)規(guī)劃、工具調(diào)用和復(fù)雜決策以及反思等agent能力上的表現(xiàn),讓模型實(shí)際應(yīng)用中可以輕松勝任深度搜索、電子表格操作、旅行攻略規(guī)劃等任務(wù)。
此外,模型原生長(zhǎng)上下文窗口達(dá)到了256k,意味著模型可以一次性記住并處理相當(dāng)于40萬中文漢字或50萬英文單詞的超長(zhǎng)內(nèi)容,相當(dāng)于一口氣讀完3本《哈利波特》小說,并且能記住所有人物關(guān)系、劇情細(xì)節(jié),還能根據(jù)這些內(nèi)容討論后續(xù)故事發(fā)展。
部署上,四個(gè)模型均只需單卡即可部署,部分PC、手機(jī)、平板等設(shè)備可直接接入。并且,模型具有較強(qiáng)的開放性,主流推理框架(例如,SGLang,vLLM和TensorRT-LLM)和多種量化格式均能夠支持。
機(jī)器之心也做了簡(jiǎn)單的嘗試,其整體表現(xiàn)相當(dāng)不錯(cuò)。
體驗(yàn)地址:https://hunyuan.tencent.com/modelSquare/home/list
已落地多元業(yè)務(wù)場(chǎng)景
騰訊透露,該系列模型已在內(nèi)部多個(gè)核心業(yè)務(wù)中「身經(jīng)百戰(zhàn)」,其可用性和實(shí)用性得到了充分檢驗(yàn):
生產(chǎn)力工具:騰訊會(huì)議AI小助手、微信讀書AI問書等,利用其超長(zhǎng)上下文能力,實(shí)現(xiàn)對(duì)萬字會(huì)議紀(jì)要、全本圖書的精準(zhǔn)理解和摘要。端側(cè)應(yīng)用:騰訊手機(jī)管家利用小模型實(shí)現(xiàn)毫秒級(jí)的垃圾短信精準(zhǔn)攔截,且全程保護(hù)用戶隱私(隱私零上傳);騰訊智能座艙則通過雙模型協(xié)作架構(gòu),解決了車載環(huán)境的功耗與響應(yīng)難題。高并發(fā)場(chǎng)景:搜狗輸入法、騰訊地圖、微信輸入法「問AI」等產(chǎn)品,借助模型的快速推理和意圖識(shí)別能力,顯著提升了嘈雜環(huán)境下的識(shí)別準(zhǔn)確率和用戶交互體驗(yàn)。垂直行業(yè):在金融領(lǐng)域,AI助手通過少量微調(diào)即可實(shí)現(xiàn)超過95%的意圖識(shí)別準(zhǔn)確率;在游戲領(lǐng)域,《QQ飛車》手游的NPC對(duì)話、多語言及方言翻譯也因模型的加持而變得更加智能和流暢。
中國(guó)AI開源浪潮中的騰訊布局
「小語言模型是智能體AI的未來?!埂ミ_(dá)近期的研究《SmallLanguageModelsaretheFutureofAgenticAI》似乎為騰訊此次的開源行動(dòng)寫下了最好的注腳。
眾所周知,最近的開源AI模型可以說是異常熱鬧,來自中國(guó)的玩家們已經(jīng)掀起了好幾股熱潮。而騰訊混元也是其中一大主要「弄潮兒」,其開源模型已覆蓋文本、圖像、視頻和3D生成等多個(gè)模態(tài)。
騰訊混元此前已經(jīng)陸續(xù)開源了激活參數(shù)量達(dá)52B(總參數(shù)量389B)的HunyuanLarge和首個(gè)混合推理MoE模型Hunyuan-A13B,這些模型憑借架構(gòu)上的創(chuàng)新以及在性能和效果上的不錯(cuò)表現(xiàn),在開源社區(qū)受到廣泛關(guān)注。
多模態(tài)方面,混元還開放了完整多模態(tài)生成能力及工具集插件,陸續(xù)開源了業(yè)界領(lǐng)先的文生圖、視頻生成和3D生成能力,提供接近商業(yè)模型性能的開源基座,方便社區(qū)基于業(yè)務(wù)和使用場(chǎng)景定制,圖像、視頻衍生模型數(shù)量達(dá)到3000個(gè)。
上周,騰訊發(fā)布并開源混元3D世界模型1.0,這一模型一經(jīng)發(fā)布即迅速登上HuggingFace趨勢(shì)榜第二,下載量飆到近9k,混元3D世界模型技術(shù)報(bào)告還拿下了HuggingFace論文熱榜第一。
很顯然,不管是科技巨頭,還是創(chuàng)業(yè)公司,中國(guó)的AI模型開發(fā)者們都越來越喜歡開源了,甚至可以說已經(jīng)成為一種共識(shí)。你覺得這一趨勢(shì)背后的原因是什么呢?
https://x.com/TencentHunyuan/status/1952262079051940322
https://arxiv.org/abs/2506.02153
林暖回到了1990年。重生回來的林暖下定決心上大學(xué),行醫(yī)救人
小說:重生1990,余飛揚(yáng)借改革東風(fēng),登頂時(shí)代風(fēng)云榜
言情小說《重生1990》如何能撩到常年單身的你
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。