在家電領(lǐng)域,有哪些需求看似簡(jiǎn)單合理,但解決起來卻是「地獄難度」?
蔣介石押注美國(guó)大選期望絕地翻盤!結(jié)果。。。【思維實(shí)驗(yàn)室】
是的,我們終于將改版做成了商業(yè)二游的水準(zhǔn)
【導(dǎo)讀】最小僅0.5B,騰訊混元推出4款開源模型
中國(guó)基金報(bào)記者張燕北
持續(xù)開源。
8月4日,騰訊混元宣布開源四款小尺寸模型,其中最小僅0.5B。據(jù)了解,這四個(gè)模型的亮點(diǎn)在于Agent和長(zhǎng)文能力,能夠滿足從端側(cè)到云端、從通用到專業(yè)的多樣化需求,“手機(jī)也能跑”。今年以來,開源成為全球大模型領(lǐng)域的重要主題,中國(guó)大模型表現(xiàn)尤為亮眼。
騰訊混元推出多款小尺寸開源模型
騰訊混元此次宣布開源的四款小尺寸模型,參數(shù)分別為0.5B、1.8B、4B、7B,消費(fèi)級(jí)顯卡即可運(yùn)行,適用于筆記本電腦、手機(jī)、智能座艙、智能家居等低功耗場(chǎng)景,且支持垂直領(lǐng)域低成本微調(diào)。
“這四個(gè)模型的亮點(diǎn)在于Agent和長(zhǎng)文能力,跟此前開源的Hunyuan-A13B模型一樣,技術(shù)上通過數(shù)據(jù)構(gòu)建和強(qiáng)化學(xué)習(xí)獎(jiǎng)勵(lì)信號(hào)設(shè)計(jì),提升了模型在任務(wù)規(guī)劃、工具調(diào)用和復(fù)雜決策以及反思等Agent能力上的表現(xiàn),讓模型實(shí)際應(yīng)用中可以勝任深度搜索、Excel操作、旅行攻略規(guī)劃等任務(wù)。”一位知情人介紹稱。
值得一提的是,模型原生長(zhǎng)上下文窗口達(dá)到了256k,意味著模型可以一次性記住并處理相當(dāng)于40萬(wàn)中文漢字或50萬(wàn)英文單詞的超長(zhǎng)內(nèi)容,相當(dāng)于一口氣讀完3本《哈利·波特》小說,并且能記住所有人物關(guān)系、劇情細(xì)節(jié),還能根據(jù)這些內(nèi)容討論后續(xù)故事發(fā)展。
據(jù)了解,目前四個(gè)模型均在Github和HuggingFace等開源社區(qū)上線,Arm、高通、Intel、聯(lián)發(fā)科技等多個(gè)消費(fèi)級(jí)終端芯片平臺(tái)也都宣布支持部署。
部署上,四個(gè)模型均只需單卡即可部署,部分PC、手機(jī)、平板等設(shè)備可直接接入。并且,模型具有較強(qiáng)的開放性,主流推理框架和多種量化格式均能夠支持。目前四款小尺寸模型已經(jīng)在騰訊多個(gè)業(yè)務(wù)中應(yīng)用。
例如,依托模型原生的超長(zhǎng)上下文能力,騰訊會(huì)議AI小助手、微信讀書AI問書AI助手均實(shí)現(xiàn)對(duì)完整會(huì)議內(nèi)容、整本書籍的一次性理解和處理。
目前,四個(gè)模型均在Github和HuggingFace等開源社區(qū)上線,Arm、高通、Intel、聯(lián)發(fā)科技等多個(gè)消費(fèi)級(jí)終端芯片平臺(tái)也都宣布支持部署。
中國(guó)大模型加速開源
最近,全球開源領(lǐng)域異常熱鬧,中國(guó)大模型表現(xiàn)搶眼。
就騰訊而言,騰訊混元大語(yǔ)言模型也在持續(xù)推進(jìn)開源,其開源模型已覆蓋文本、圖像、視頻和3D生成等多個(gè)模態(tài)。
騰訊官方表示,開源是騰訊混元大模型長(zhǎng)期堅(jiān)持的方向,未來騰訊混元也將不斷提升模型能力,繼續(xù)積極擁抱開源,推出更多尺寸、更多模態(tài)的模型,加速產(chǎn)業(yè)落地和應(yīng)用,與開發(fā)者和合作伙伴共建大模型開源生態(tài)。
對(duì)其他科技巨頭而言,阿里近期接連發(fā)布三款重磅大模型,分別斬獲基礎(chǔ)模型、編程模型和推理模型等主流領(lǐng)域全球開源冠軍。
字節(jié)跳動(dòng)旗下的AIAgent開發(fā)平臺(tái)——扣子(Coze)也于近期正式宣布開源其開發(fā)環(huán)境CozeStudio。扣子是由字節(jié)跳動(dòng)公司推出的一款創(chuàng)新型AIAgent開發(fā)平臺(tái),自推出以來,便以其獨(dú)特的低代碼開發(fā)方式和強(qiáng)大的功能模塊,迅速在AI開發(fā)領(lǐng)域占據(jù)了一席之地。作為字節(jié)跳動(dòng)在AI領(lǐng)域的重要布局,扣子平臺(tái)旨在降低AI應(yīng)用開發(fā)的門檻。
小米公司則正式開源聲音理解大模型MiDashengLM-7B,其聲音理解性能在22個(gè)公開評(píng)測(cè)集上刷新多模態(tài)大模型最好成績(jī)(SOTA)。
6月30日,百度正式開源文心大模型4.5系列模型,涵蓋47B、3B激活參數(shù)的混合專家(MoE)模型,與0.3B參數(shù)的稠密型模型等10款模型,并實(shí)現(xiàn)預(yù)訓(xùn)練權(quán)重和推理代碼的完全開源。
中型互聯(lián)網(wǎng)公司也在積極行動(dòng)。6月初,昆侖萬(wàn)維剛剛發(fā)文,宣布推出并開源全新推理大模型SkyworkMindLink。據(jù)介紹,這套全新的推理范式,能夠根據(jù)任務(wù)難度自適應(yīng)整合推理和非推理的生成回復(fù),極大減少了推理成本,增強(qiáng)了推理過程的可讀性和有效性。
AI獨(dú)角獸方面,智譜(ZhipuAI)于上周一晚間正式發(fā)布新一代旗艦大模型GLM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,在復(fù)雜推理、代碼生成及智能體交互等通用能力上實(shí)現(xiàn)融合與技術(shù)突破。
業(yè)內(nèi)認(rèn)為,開源模型將成為推動(dòng)中國(guó)人工智能發(fā)展最強(qiáng)勁的引擎。中國(guó)科技公司選擇開源路線,不僅是為了與同類型公司展開競(jìng)爭(zhēng),更是為了加速AI的采用和創(chuàng)新。這一趨勢(shì)不僅將推動(dòng)中國(guó)AI領(lǐng)域的快速發(fā)展,甚至可能縮短技術(shù)差距。
格林
校對(duì):王玥
制作:鹿米
審核:木魚
版權(quán)聲明
《中國(guó)基金報(bào)》對(duì)本平臺(tái)所刊載的原創(chuàng)內(nèi)容享有著作權(quán),未經(jīng)授權(quán)禁止轉(zhuǎn)載,否則將追究法律責(zé)任。
授權(quán)轉(zhuǎn)載合作聯(lián)系人:于先生(電話:0755-82468670)
深度科普:宇宙起源于無窮小的奇點(diǎn),奇點(diǎn)為何能裝下那么多物質(zhì)?
宇宙的起源究竟是什么?世界上眾多科學(xué)家對(duì)此提出的不同看法??大...
宇宙起源于黑洞中嗎?科學(xué)發(fā)現(xiàn)越來越有可能,但最終或?qū)⒁粺o所有...