機(jī)器之心報(bào)道
機(jī)器之心編輯部
MistralAI只是想做歐洲版的OpenAI?
最近幾個(gè)月,由谷歌和Meta前研究人員建立的歐洲的AI初創(chuàng)公司MistralAI有些躁動(dòng)不安。
他們接連發(fā)布了好些個(gè)開源模型,覆蓋不同的領(lǐng)域,包含號稱「世界上最優(yōu)秀」的OCR模型、「對標(biāo)Claude」的多模態(tài)模型、首個(gè)推理大模型Magistral以及兩天前發(fā)布的「全球最佳」的開源語音模型Voxtral。
這樣似乎也很難讓這位歐洲AI「新貴」感到滿意,他們還想在應(yīng)用層面好好地卷一卷OpenAI。
他們將LeChat再一次升級,引入了一些強(qiáng)大的新功能,使其更強(qiáng)大、更直觀,也更有趣,在功能上幾乎全方位對標(biāo)ChatGPT。
LeChat的新功能
深度研究模式:即使是復(fù)雜主題,也能快速生成結(jié)構(gòu)化的研究報(bào)告。
語音模式:使用我們的新Voxtral模型與LeChat對話,而不是用鍵盤輸入。
原生多語言推理:借助我們的推理模型——Magistral,獲取深思熟慮的答案。
項(xiàng)目管理:將您的對話組織到內(nèi)容豐富的文件夾中。
高級圖像編輯,在LeChat中直接進(jìn)行,與BlackForestLabs合作。
LeChat新功能宣傳片
研究模式可將LeChat轉(zhuǎn)變?yōu)橐粋€(gè)協(xié)調(diào)的研究助手,能夠規(guī)劃、明確需求、搜索和綜合信息。提出一個(gè)有深度的問題,它會將其分解,收集可靠的資料,并構(gòu)建一個(gè)結(jié)構(gòu)清晰、有參考文獻(xiàn)支持且易于理解的報(bào)告。
它由工具增強(qiáng)型深度研究Agent驅(qū)動(dòng),但設(shè)計(jì)得簡單、透明且真正有幫助,仿佛與一個(gè)組織良好的研究伙伴合作。
MistralAI也在官網(wǎng)展示了一些用例。深度研究模式能夠追蹤市場趨勢、撰寫商業(yè)策略書、做個(gè)人計(jì)劃以及最重要的、進(jìn)行學(xué)術(shù)研究。
語音模式可以像和人聊天一樣與LeChat交流——無需打字。你可以在散步時(shí)頭腦風(fēng)暴、在處理雜事時(shí)快速獲取答案或轉(zhuǎn)錄會議內(nèi)容。它由Mistral新的語音輸入模型Voxtral驅(qū)動(dòng),專為自然、低延遲的語音識別而構(gòu)建,能跟上用戶的工作速度。
但目前LeChat僅支持語音轉(zhuǎn)文字的輸入,該功能并非實(shí)時(shí)語音對話。
所以,跟電子助手聊天的功能依舊沒有實(shí)現(xiàn),更別提Grok4Ani那樣的數(shù)字伴侶了。
在圖像編輯功能方面,可以通過「移除物體」或「將我放置在另一個(gè)城市」等簡單提示來創(chuàng)建并編輯圖像。模型支持轉(zhuǎn)換場景,同時(shí)保留角色和細(xì)節(jié)。這有助于保證編輯的一致性:可以保持人物、物體和設(shè)計(jì)元素在圖像之間的不會變得認(rèn)不出來。
圖像編輯這塊,LeChat似乎做得出人意料的好。網(wǎng)友在論壇分享了使用體驗(yàn),認(rèn)為LeChat做得比OpenAI更好。
「OpenAI的模型在編輯時(shí)會改變整個(gè)圖像,導(dǎo)致無關(guān)區(qū)域出現(xiàn)細(xì)節(jié)錯(cuò)誤。(LeChat)似乎完美地保留了與查詢無關(guān)的圖像部分,并選擇性地應(yīng)用編輯,這令人印象深刻!」
網(wǎng)友上傳了一張家庭辦公室的照片,并提出了以下提示:「修復(fù)照片底部略微撕裂的灰色面板,讓它們看起來像全新的」,編輯結(jié)果非常令人滿意。
上圖為原始圖像,下圖為編輯后圖像
對于這些新功能,我們的讀者想必已經(jīng)非常熟悉。在這一次的大更新之后,LeChat在功能上基本實(shí)現(xiàn)了與ChatGPT等行業(yè)領(lǐng)先的產(chǎn)品保持一致。
最近MistralAI的動(dòng)作確實(shí)讓人看到了歐洲在大模型領(lǐng)域保持追趕的勢頭。對此,網(wǎng)友們表達(dá)了對Mistral快速追趕的興奮。
值得分享的是,LeChat在法語中意為「貓」,而MistralAI的主頁底部就有一只像素貓咪,MistralAI圖標(biāo)也形似一只貓貓頭,非??蓯?。
MistralAI的語音識別模型
7月15日,MistralAI發(fā)布了全新的語音識別模型Voxtral,號稱是「全球最佳(且開源)」的語音識別模型。
Voxtral在語音轉(zhuǎn)寫方面全面超越了Whisperlarge-v3,當(dāng)前領(lǐng)先的開放源代碼語音轉(zhuǎn)寫模型。它在所有任務(wù)中都擊敗了GPT-4ominiTranscribe和Gemini2.5Flash,并在英語短形式和MozillaCommonVoice上取得了最先進(jìn)的結(jié)果,超越了ElevenLabsScribe,展示了其強(qiáng)大的多語言能力。
Voxtral3B和Voxtral24B模型不僅僅具備語音轉(zhuǎn)錄功能,還具備以下能力:
超長上下文理解:支持最長32ktoken的上下文,轉(zhuǎn)錄最長達(dá)30分鐘音頻,理解可達(dá)40分鐘;
內(nèi)置問答與摘要功能:無需將語音識別與語言模型串聯(lián),即可直接針對音頻內(nèi)容提問或生成結(jié)構(gòu)化摘要;
原生多語種支持:具備自動(dòng)語言識別功能,在全球主流語言(如英語、西班牙語、法語、葡萄牙語、印地語、德語、荷蘭語、意大利語等)中均達(dá)到業(yè)內(nèi)領(lǐng)先表現(xiàn),助力團(tuán)隊(duì)以單一系統(tǒng)服務(wù)全球用戶;
從語音直接觸發(fā)函數(shù)調(diào)用:可根據(jù)用戶的語音意圖直接觸發(fā)后端函數(shù)、工作流或API調(diào)用,無需中間解析步驟,實(shí)現(xiàn)語音到系統(tǒng)指令的無縫轉(zhuǎn)換;
強(qiáng)大的文本理解能力:延續(xù)其語言模型基礎(chǔ)(MistralSmall3.1)在文本處理方面的高性能表現(xiàn)。
《神武天帝》:陸宇,神武天域最傳奇的圣魂天師,卻被妻子與兄弟聯(lián)手...
《神武天帝》:陸宇,神武天域最傳奇的圣魂天師,卻被妻子與兄弟聯(lián)手暗害,重生到數(shù)百年后的同名少年《神武天帝》作者:心夢無痕 陸宇這一生有三大引以為傲的事情,貌美無雙的嬌妻,神勇無敵的兄弟,功成名就的事業(yè),那是無數(shù)人都夢寐以求的東西,他都得到了,可他卻沒有猜到結(jié)局。陸宇的成長并不順利,但是開創(chuàng)武魂進(jìn)化之術(shù)改變了他的一生,讓他娶到了神武天域十大美女之一的馬靈月為妻,曾羨煞無數(shù)人。后來,陸宇又結(jié)識了宋凌云,兩人肝膽等我繼續(xù)說。4本東方玄幻小說:本本超《斗破蒼穹》,錯(cuò)過了別喊書荒!