蔡姿婷
【導(dǎo)讀】最小僅0.5B,騰訊混元推出4款開源模型
中國基金報記者張燕北
持續(xù)開源。
8月4日,騰訊混元宣布開源四款小尺寸模型,其中最小僅0.5B。據(jù)了解,這四個模型的亮點在于Agent和長文能力,能夠滿足從端側(cè)到云端、從通用到專業(yè)的多樣化需求,“手機(jī)也能跑”。今年以來,開源成為全球大模型領(lǐng)域的重要主題,中國大模型表現(xiàn)尤為亮眼。
騰訊混元推出多款小尺寸開源模型
騰訊混元此次宣布開源的四款小尺寸模型,參數(shù)分別為0.5B、1.8B、4B、7B,消費級顯卡即可運行,適用于筆記本電腦、手機(jī)、智能座艙、智能家居等低功耗場景,且支持垂直領(lǐng)域低成本微調(diào)。
“這四個模型的亮點在于Agent和長文能力,跟此前開源的Hunyuan-A13B模型一樣,技術(shù)上通過數(shù)據(jù)構(gòu)建和強(qiáng)化學(xué)習(xí)獎勵信號設(shè)計,提升了模型在任務(wù)規(guī)劃、工具調(diào)用和復(fù)雜決策以及反思等Agent能力上的表現(xiàn),讓模型實際應(yīng)用中可以勝任深度搜索、Excel操作、旅行攻略規(guī)劃等任務(wù)?!币晃恢槿私榻B稱。
值得一提的是,模型原生長上下文窗口達(dá)到了256k,意味著模型可以一次性記住并處理相當(dāng)于40萬中文漢字或50萬英文單詞的超長內(nèi)容,相當(dāng)于一口氣讀完3本《哈利·波特》小說,并且能記住所有人物關(guān)系、劇情細(xì)節(jié),還能根據(jù)這些內(nèi)容討論后續(xù)故事發(fā)展。
據(jù)了解,目前四個模型均在Github和HuggingFace等開源社區(qū)上線,Arm、高通、Intel、聯(lián)發(fā)科技等多個消費級終端芯片平臺也都宣布支持部署。
部署上,四個模型均只需單卡即可部署,部分PC、手機(jī)、平板等設(shè)備可直接接入。并且,模型具有較強(qiáng)的開放性,主流推理框架和多種量化格式均能夠支持。目前四款小尺寸模型已經(jīng)在騰訊多個業(yè)務(wù)中應(yīng)用。
例如,依托模型原生的超長上下文能力,騰訊會議AI小助手、微信讀書AI問書AI助手均實現(xiàn)對完整會議內(nèi)容、整本書籍的一次性理解和處理。
目前,四個模型均在Github和HuggingFace等開源社區(qū)上線,Arm、高通、Intel、聯(lián)發(fā)科技等多個消費級終端芯片平臺也都宣布支持部署。
中國大模型加速開源
最近,全球開源領(lǐng)域異常熱鬧,中國大模型表現(xiàn)搶眼。
就騰訊而言,騰訊混元大語言模型也在持續(xù)推進(jìn)開源,其開源模型已覆蓋文本、圖像、視頻和3D生成等多個模態(tài)。
騰訊官方表示,開源是騰訊混元大模型長期堅持的方向,未來騰訊混元也將不斷提升模型能力,繼續(xù)積極擁抱開源,推出更多尺寸、更多模態(tài)的模型,加速產(chǎn)業(yè)落地和應(yīng)用,與開發(fā)者和合作伙伴共建大模型開源生態(tài)。
對其他科技巨頭而言,阿里近期接連發(fā)布三款重磅大模型,分別斬獲基礎(chǔ)模型、編程模型和推理模型等主流領(lǐng)域全球開源冠軍。
字節(jié)跳動旗下的AIAgent開發(fā)平臺——扣子(Coze)也于近期正式宣布開源其開發(fā)環(huán)境CozeStudio。扣子是由字節(jié)跳動公司推出的一款創(chuàng)新型AIAgent開發(fā)平臺,自推出以來,便以其獨特的低代碼開發(fā)方式和強(qiáng)大的功能模塊,迅速在AI開發(fā)領(lǐng)域占據(jù)了一席之地。作為字節(jié)跳動在AI領(lǐng)域的重要布局,扣子平臺旨在降低AI應(yīng)用開發(fā)的門檻。
小米公司則正式開源聲音理解大模型MiDashengLM-7B,其聲音理解性能在22個公開評測集上刷新多模態(tài)大模型最好成績(SOTA)。
6月30日,百度正式開源文心大模型4.5系列模型,涵蓋47B、3B激活參數(shù)的混合專家(MoE)模型,與0.3B參數(shù)的稠密型模型等10款模型,并實現(xiàn)預(yù)訓(xùn)練權(quán)重和推理代碼的完全開源。
中型互聯(lián)網(wǎng)公司也在積極行動。6月初,昆侖萬維剛剛發(fā)文,宣布推出并開源全新推理大模型SkyworkMindLink。據(jù)介紹,這套全新的推理范式,能夠根據(jù)任務(wù)難度自適應(yīng)整合推理和非推理的生成回復(fù),極大減少了推理成本,增強(qiáng)了推理過程的可讀性和有效性。
AI獨角獸方面,智譜(ZhipuAI)于上周一晚間正式發(fā)布新一代旗艦大模型GLM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,在復(fù)雜推理、代碼生成及智能體交互等通用能力上實現(xiàn)融合與技術(shù)突破。
業(yè)內(nèi)認(rèn)為,開源模型將成為推動中國人工智能發(fā)展最強(qiáng)勁的引擎。中國科技公司選擇開源路線,不僅是為了與同類型公司展開競爭,更是為了加速AI的采用和創(chuàng)新。這一趨勢不僅將推動中國AI領(lǐng)域的快速發(fā)展,甚至可能縮短技術(shù)差距。
格林
校對:王玥
制作:鹿米
審核:木魚
版權(quán)聲明
《中國基金報》對本平臺所刊載的原創(chuàng)內(nèi)容享有著作權(quán),未經(jīng)授權(quán)禁止轉(zhuǎn)載,否則將追究法律責(zé)任。
授權(quán)轉(zhuǎn)載合作聯(lián)系人:于先生(電話:0755-82468670)
前世十八線擦邊歌手陳天凡 被東家歐亞音樂陷害后重生了 他回到了十年前的大學(xué)時代。 舞臺中央, 一段別樣旋律響起 只因你實在是太美baby~ 超前藝術(shù), 評委震驚了, 觀眾傻眼了, 驚艷四方 而陳天凡只是淺淺一笑。 故事, 才剛剛開始......來源:紅網(wǎng)
作者:陳致昀
編輯:陳廷華
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。