過冰嵐
機(jī)器之心原創(chuàng)
機(jī)器之心編輯部
AI正悄悄「攻占」你的歌單。
前幾天在網(wǎng)易云音樂上瞎逛,被意外種草一首歌,真一開口就是月色迷蒙的味道。
目前,該歌曲拿下了15萬(wàn)小紅心。本想看看是哪位大神的作品,沒想到底下一水的評(píng)論:這是AI生成的!
其實(shí)細(xì)聽之下還是能找出「端倪」的,比如音質(zhì)糊的像畫面馬賽克、人聲跟牙齒漏風(fēng)似的。但經(jīng)過持續(xù)的進(jìn)化,AI音樂越來(lái)越真假難辨。
現(xiàn)在,AI音樂的這把火,越燒越旺。
7月23日,大模型廠商昆侖萬(wàn)維正式發(fā)布了新一代音樂大模型MurekaV7,成為了當(dāng)前國(guó)產(chǎn)最強(qiáng),并在多個(gè)關(guān)鍵指標(biāo)上顯著超越海外AI音樂平臺(tái)Suno(V4.5),包括平均表現(xiàn)評(píng)分、混音質(zhì)量與質(zhì)感、人聲真實(shí)感與表現(xiàn)力、整體音質(zhì)評(píng)價(jià)。
不僅如此,與上一版本V6相比,MurekaV7生成的音樂品質(zhì)更高,不僅大幅提升旋律動(dòng)機(jī)和編曲質(zhì)量,還進(jìn)一步增強(qiáng)了人聲與樂器真實(shí)度。
這么說吧,即使你是個(gè)五音不全的音樂小白,也能拿它做出超細(xì)膩的個(gè)人獨(dú)家BGM。而對(duì)于專業(yè)的音樂人而言,MurekaV7生成的音樂又極具創(chuàng)新性,在一定程度上可以啟發(fā)靈感。
MurekaV7作品《杜甫》
目前,MurekaV7已經(jīng)全面上線,感興趣的小伙伴可以前往官網(wǎng)進(jìn)行體驗(yàn)。
官網(wǎng)地址:https://www.mureka.cn/
接下來(lái),我們就來(lái)實(shí)測(cè)一下,看看MurekaV7在搞音樂創(chuàng)作時(shí)是否還有那種「牙齒漏風(fēng)」的感覺。
一手實(shí)測(cè)
能模仿王菲,還能生成「土味」MV
MurekaV7真不只是「AI幫你寫首歌」那么簡(jiǎn)單,現(xiàn)在它還上線了新功能——自定義歌手
我們可以上傳音頻,或者直接丟一個(gè)視頻鏈接進(jìn)去,AI就能自動(dòng)模仿音色,唱出全新創(chuàng)作的歌曲。
以天后王菲為例。眾所周知,王菲是鄧麗君的鐵桿粉絲,在2013年「鄧麗君60追夢(mèng)紀(jì)念演唱會(huì)」上,鮮少出席活動(dòng)的王菲與偶像隔空對(duì)唱了這首《清平調(diào)》。
王菲演唱會(huì)原唱
這一次,我們讓Mureka模擬王菲的音色,并在此基礎(chǔ)上重新譜曲、演唱。
Mureka生成的聲線再現(xiàn)了王菲特有的空靈、通透,處理歌曲中的弱唱又模擬出王菲標(biāo)志性的氣聲效果。咬字方面,Mureka同樣還原了王菲不咬死字頭,讓聲音在口腔中自然流淌的唱法,尤其在尾音收放上,更是有股菲式慵懶感。
我們?cè)賮?lái)試試它的「音樂參考」功能。
所謂音樂參考,就是通過分析用戶上傳的音樂,Mureka能夠精準(zhǔn)識(shí)別原曲的類型、節(jié)奏、配器和情緒,并據(jù)此生成具有相似風(fēng)格的原創(chuàng)作品。
前段時(shí)間,中國(guó)網(wǎng)紅「豪哥哥」改編印度神曲《TunakTunakTun》(也就是那首著名的《我在東北玩泥巴》),創(chuàng)作出這首魔性十足的《剛買的飛機(jī)被打啦》。
視頻來(lái)自博主「豪哥哥-魔性改歌」
這首歌一經(jīng)發(fā)布就在全球社交媒體瘋狂刷屏,甚至一度把印度網(wǎng)友搞破防,聯(lián)名「上書」聯(lián)合國(guó)。
我們也拿Mureka做了一版,曲風(fēng)相當(dāng)洗腦,要是口音咖喱味再濃點(diǎn)就好了。更有意思的是,Mureka還能自動(dòng)生成MV,抽象畫面配上黃色描邊歌詞,又土又上頭。
此外,Mureka還升級(jí)了歌曲描述、純音樂生成等常規(guī)功能。
比如,我們輸入李白的《將進(jìn)酒》,再選擇音樂風(fēng)格「說唱金屬,另類金屬,說唱搖滾,男聲」,Mureka立馬化身?yè)u滾老炮,激情開唱。
或者通過文字Prompt直接生成免版權(quán)的BGM:
提示詞:回憶童年的溫暖鋼琴旋律
也可以上傳參考音頻,讓模型創(chuàng)作出風(fēng)格相近的純音樂片段。
如果對(duì)生成的音樂不滿意,MurekaV7還提供音頻編輯功能,可以局部編輯、延長(zhǎng)歌曲、樂器分軌甚至裁剪音頻,并支持10種語(yǔ)言的AI音樂創(chuàng)作。
自研音樂思維鏈「MusiCoT」再次進(jìn)化
不到四個(gè)月的時(shí)間,MurekaV7相較于上代MurekaV6的表現(xiàn)又提升了一大截,這源自昆侖萬(wàn)維對(duì)自研音樂生成專用思維鏈——MusiCoT的持續(xù)優(yōu)化。
我們知道,大語(yǔ)言模型的內(nèi)容輸出方式是「預(yù)測(cè)下一個(gè)token」,這顯然與音樂創(chuàng)作的過程不同。為此,昆侖萬(wàn)維在Mureka中引入了生成式AI領(lǐng)域流行的思維鏈(CoT)提示方法,并通過V6版本完成了首秀。
此次,MurekaV7進(jìn)一步優(yōu)化了MusiCoT(AnalyzableChain-of-Musical-ThoughtPrompting)技術(shù),顯著提升了模型生成結(jié)果的整體性與發(fā)聲表現(xiàn),具體包括以下三大方面的創(chuàng)新。
一是,先想結(jié)構(gòu)后生成,符合人類創(chuàng)作邏輯
MusiCoT在輸出音頻token之前,會(huì)先讓模型生成對(duì)音樂結(jié)構(gòu)的全局規(guī)劃,確定整體的段落、情緒、編排等布局。這就能讓AI生成的作品具備清晰的結(jié)構(gòu)。
二是,生成結(jié)構(gòu)可解釋、可控
通過CLAP(對(duì)比式語(yǔ)言-音頻預(yù)訓(xùn)練模型),MusiCoT的明確思維鏈讓AI生成的音樂具有明確的可讀性和可控性。用戶可以輸入任意長(zhǎng)度的參考音頻作為風(fēng)格提示。
三是,主觀+客觀驗(yàn)證效果全面領(lǐng)先
基于大量實(shí)驗(yàn),MusiCoT在主客觀雙重指標(biāo)下均展現(xiàn)出了卓越的效果。無(wú)論是結(jié)構(gòu)完整、旋律連貫還是整體音樂性均優(yōu)于傳統(tǒng)方法,在多項(xiàng)評(píng)測(cè)中表現(xiàn)達(dá)到行業(yè)頂流水準(zhǔn)。
在MurekaV7上,MusiCoT不僅在結(jié)構(gòu)層面實(shí)現(xiàn)對(duì)音樂創(chuàng)作思維的擬合與對(duì)齊,更借助數(shù)據(jù)的進(jìn)一步擴(kuò)展、嵌入信息粒度的細(xì)化,完善了可控性與可擴(kuò)展性。
得益于MusiCoT的升級(jí)和應(yīng)用,Mureka部分生成作品已經(jīng)能夠?yàn)橐魳啡颂峁└鄤?chuàng)作靈感,并加速?gòu)撵`感到成品的落地過程。
定制語(yǔ)音有了更好的國(guó)產(chǎn)選擇
此次,除了更強(qiáng)、更擬人、更自然的音樂生成之外,昆侖萬(wàn)維還帶來(lái)了一款音頻模型——MurekaTTSV1。該模型支持的語(yǔ)音創(chuàng)作功能也已經(jīng)上線官網(wǎng)。
與音樂生成強(qiáng)調(diào)旋律、和聲、節(jié)奏、風(fēng)格等音樂語(yǔ)言的表達(dá)不同,音頻模型更關(guān)注對(duì)所有聲音類型的通用表示與理解,包括語(yǔ)音、人聲、環(huán)境音、音效等。MurekaTTSV1的最大亮點(diǎn)是引入了VoiceDesign能力,可以通過文本輸入想要的語(yǔ)音特征來(lái)獲得對(duì)應(yīng)的音色。
這意味著,不論是真實(shí)人物、虛擬人物還是配音角色都能夠通過文本來(lái)控制,不用像過去一樣只能通過預(yù)設(shè)音色庫(kù)來(lái)實(shí)現(xiàn)音色克隆。相反,用戶能夠通過自然語(yǔ)言指令靈活定義聲音的性別、年齡、情感狀態(tài)、語(yǔ)氣風(fēng)格、表達(dá)節(jié)奏,達(dá)成真正個(gè)性化、場(chǎng)景化的語(yǔ)音合成體驗(yàn)。
跑分結(jié)果顯示,在與競(jìng)對(duì)ElevenLabsTTSV2的較量中,MurekaTTSV1的語(yǔ)音質(zhì)量、分詞與語(yǔ)句節(jié)奏準(zhǔn)確性以及整體聽感體驗(yàn)均實(shí)現(xiàn)了超越,只在發(fā)音準(zhǔn)確性方面略遜一籌。如此一來(lái),昆侖萬(wàn)維在語(yǔ)音合成的多個(gè)核心維度上已具備行業(yè)領(lǐng)先優(yōu)勢(shì),可以進(jìn)一步滿足更高階的語(yǔ)音創(chuàng)作與交互場(chǎng)景的需求。
最終好不好,還是得看實(shí)際效果。
我們來(lái)聽一段人聲,「童音女聲,12歲左右,聲音清脆悅耳,熱情洋溢,語(yǔ)速略快但不慌亂。」
再來(lái)一個(gè)「男性新聞播音員,語(yǔ)音清晰且穩(wěn)定,語(yǔ)調(diào)平穩(wěn)、沉著,語(yǔ)速適中,語(yǔ)氣冷靜理性,情感中性且客觀,音量適中,聲音具有一定的厚重感,體現(xiàn)專業(yè)性與可信度」。
可以看到,MurekaTTSV1從創(chuàng)意描述到聲音輸出實(shí)現(xiàn)了全流程生成,聲音創(chuàng)造更加高效與自由,不僅大大拓展了語(yǔ)音生成的應(yīng)用邊界,也為內(nèi)容創(chuàng)作與交互體驗(yàn)打開了想象空間。未來(lái),該模型可以進(jìn)一步在影視、游戲、廣告等行業(yè)的配音場(chǎng)景大顯身手。
最近一段時(shí)間,隨著Scalinglaws放緩,模型規(guī)模擴(kuò)展所帶來(lái)的邊際收益減弱,各家廠商卷基礎(chǔ)大模型的步伐也開始放緩。相反,大模型的「價(jià)值兌現(xiàn)」與「商業(yè)化落地」正在加速推進(jìn)中。
隨之而來(lái),一些垂直大模型成為新一輪技術(shù)博弈與產(chǎn)品競(jìng)速的焦點(diǎn),如AIGC領(lǐng)域的視頻大模型、音樂大模型等。大家都卯足了勁搶占規(guī)模化落地的紅利,率先打通從技術(shù)到產(chǎn)品的轉(zhuǎn)化路徑,占據(jù)內(nèi)容創(chuàng)作、營(yíng)銷、娛樂等高頻應(yīng)用場(chǎng)景的生態(tài)入口。
這一趨勢(shì)與昆侖萬(wàn)維長(zhǎng)久以來(lái)的戰(zhàn)略天然契合。在「實(shí)現(xiàn)通用人工智能,讓每個(gè)人能夠更好地表達(dá)自我」的使命驅(qū)使下,該公司形成了「AI前沿基礎(chǔ)研究——基座模型——AI矩陣產(chǎn)品/應(yīng)用」的全產(chǎn)業(yè)鏈,持續(xù)發(fā)力AIGC創(chuàng)作領(lǐng)域,并推出覆蓋視頻、音樂、Agent等多個(gè)方向的創(chuàng)新型產(chǎn)品。
其中自2024年4月亮相以來(lái),Mureka作為「會(huì)思考」音樂模型的名頭越打越響。今年,Mureka已經(jīng)迎來(lái)了兩次大版本更新,上個(gè)版本V6直到最近仍被很多國(guó)外網(wǎng)友「安利」。
甚至從3月底到現(xiàn)在,Mureka的新增用戶就接近300萬(wàn)。顯然,昆侖萬(wàn)維的音樂大模型獲得了用戶的高度認(rèn)可,并正在引領(lǐng)音樂創(chuàng)作方式的變革。
未來(lái),隨著模型能力的持續(xù)增強(qiáng)與創(chuàng)作門檻的進(jìn)一步降低,AI有望演變成為音樂創(chuàng)作的核心驅(qū)動(dòng)力。同時(shí),音樂創(chuàng)作也將繼續(xù)打破專業(yè)壁壘,走向全民表達(dá)。
文中視頻音頻鏈接:https://mp.weixin.qq.com/s/D-Qq9QvAQZzfTEAT_NrxlA
古言:成婚當(dāng)日他同時(shí)納妾,準(zhǔn)王妃散發(fā)扔掉首飾離去,眾人傻眼!
文明火光,地球,都不過是深空中的一粒塵埃。星空一瞬,人間千年——_。蟲鳴一世不過秋,你我一樣在爭(zhēng)渡——。深空盡頭到底有什么?愛閱小說app列車遠(yuǎn)去,在與鐵軌的震動(dòng)聲中帶起大片枯黃的落葉,也帶起秋的蕭瑟-|。王煊注視,直至列車漸消失,他才收回目光,又送走了幾位同學(xué)。(點(diǎn)擊下方免費(fèi)閱讀)第二本:《傾世醫(yī)妃要休夫還有呢?
倍受好評(píng)的穿越重生合集,《我就是如此嬌花》穩(wěn)坐第一
(點(diǎn)擊下方免費(fèi)閱讀)第三本:《傾世毒妃》作者:魚青霄簡(jiǎn)介:眾叛親離,尸骨無(wú)存|。這些都是上輩子的事——。老天爺好不容易給了她一次重生的機(jī)會(huì),從今以后,她說了算。精彩內(nèi)容:這次的遇襲雖然兇險(xiǎn),好在他們的人一個(gè)都沒死,受傷最重的竟然是溫桐顏。 等錢太醫(yī)點(diǎn)了盞燈湊近一看,眾人都被她的傷口嚇好了吧!
古言神醫(yī)文,強(qiáng)推《神醫(yī)嫡女》劇情超驚艷,一點(diǎn)不輸《神醫(yī)凰后》
(點(diǎn)擊下方免費(fèi)閱讀)第三本:《傾世醫(yī)妃要休夫》作者:六月簡(jiǎn)介:寵文:大婚當(dāng)天他同時(shí)納妾,王妃散開發(fā)髻扔掉頭飾離開,賓客驚呆陳雨竹聽到身邊的男人傳來(lái)沉緩地呼吸聲,一陣濃烈的酒味刺鼻而來(lái),她掀開頭巾,略帶嬌羞瞧著床上的男人,他面如冠玉,俊朗非凡,喜袍加身,更顯得俊美|。她癡癡地看著他,以前從未有幫助請(qǐng)點(diǎn)贊。
來(lái)源:紅網(wǎng)
作者:尋芳春
編輯:騰鴻博
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。