在AI語音賽道競爭下,WisprFlow的AI語音輸入應用脫穎而出。它不僅能實現高效的語音轉文字,還能精準捕捉用戶意圖并自動編輯文本。憑借高留存率、高付費轉化率等亮眼表現,贏得了用戶青睞及大額融資,成為AI語音領域的一匹黑馬。
靠著一個快捷鍵,顛覆長達幾十年的文字輸入習慣。這就是AI語音輸入應用WisprFlow在做的事情。
今年,AI語音無疑成了硅谷最卷的賽道。Meta、OpenAI、Google集體發(fā)力,而WisprFlow卻悄悄在這場競賽中沖了出來。
就在不久前,WisprFlow完成了3000萬美元A輪融資,累計融資額達5600萬美元。
公司CEOTanayKothari透露,硅谷幾乎每一家一線風投機構內部都在用WisprFlow來處理郵件、寫備忘、記錄文檔。
作為一款AI語音輸入法,WisprFlow的核心功能很直接:你說話,它轉文字。相比傳統(tǒng)轉錄軟件,它最大的亮點在于兩個字:絲滑。
用戶體驗有多絲滑?說兩組數據大家就明白了:
用戶下載WisprFlow六個月后,仍有80%保持活躍使用。更重要的是,其中一半以上的用戶,已經用它完成了超70%的文字輸入。
這不僅是高粘性,更意味著——語音輸入正在從“輔助工具”變成主力交互方式。
靠著超高的用戶粘性,WisprFlow取得了令人矚目的商業(yè)化成績。
截至目前,WisprFlow的付費轉化率高達19%,遠超大多數SaaS產品。與此同時,用戶規(guī)模月環(huán)比增長高達50%,月收入環(huán)比增長60%,年收入已達380萬美元。
今天,烏鴉君就帶你來看看這一款AI語音鍵盤是怎么變成這么多人的心頭好。
01大模型用說話代替打字,輸入效率提升4倍
說服用戶從鍵盤轉向語音,不是容易的事,但WisprFlow只用了一個快捷鍵,就做到了。
只需按住Fn鍵開始說話,松開后,你的語音內容就會自動出現在鼠標所在的輸入框中,無需切換應用,幾乎適用于所有軟件。
據說,用WisprFlow進行輸入,會比手動打字快3-4倍。
能達到這么快,關鍵不在于轉錄功能,而在于準確識別和自動編輯。它對小語種、罕見字的識別不在話下,其涵蓋了110+種語言。
更重要的是,它能直接交付你最終想要表達的文本。如果說話時間間隔長、中途改變了想法,它都可以自動修改,也支持語音指令改寫文本。好比我們的一段漫談,WisprFlow也能將其轉化為結構化的文本。
小說作家JeannetteTan:“心流是你大腦中額外的一小部分,當你陷入思考時,它能幫助你形成完整的句子?!?/p>
當傳統(tǒng)工具還在琢磨“單詞錯誤率”時,WisprFlow早已以“零編輯率”為產品革新的目標,他們想直接解決用戶對最終文本可用性的需求。對于“零編輯率”,官方說法是“大于80%”,而用戶反映實際體驗接近100%。
為了更“懂你”,WisprFlow對你苦心鉆研?!安幌衲愕那叭?,它確實從錯誤中吸取教訓?!盬isprFlow在最新的廣告里如此調侃。
它會自建屬于你的“黑話字典”。它會消化你的行話或者俚語,并以“專屬字典”來調整轉錄文字,結果就是連標點符號和斷句都能符合你的原意。對于行業(yè)術語壁壘,它通過共享上下文和自定義術語API,來攻克這一點。用戶還可按場景定制語氣(郵件/文檔等)。
MenloVenturesCEO馬特·克蘭寧談道:“WisprFlow創(chuàng)建高效轉化數字思維和意圖的方式,精準捕捉用戶語音和真實表達意圖,其開發(fā)模型更關注自然說話方式?!?/p>
與競品SuperWhisper/Aqua/Talktastic對標,WisprFlow功能深度顯著領先(自動編輯+語調調整+命令模式)。深扒其技術,主要靠兩點完成突破:
意圖驅動轉錄:深度定制模型,從專注理解用戶意圖,到生成結構化、符合語境的文本(如自動刪填充詞、修正語義錯誤、自動標點),大幅降低模型幻覺率,確保意圖映射精準。
超低延遲&高兼容性:系統(tǒng)級集成(OS層運行),支持110+語言零延遲轉錄,跨平臺兼容(Mac/Windows/iOS,Android開發(fā)中)。
WisprFlow的團隊擁有頂級AI實驗室背景,音頻處理及消費者應用開發(fā)的積累深厚,并擁有端到端模型定制能力。聯(lián)創(chuàng)TanaySethi和SahajMehra均為資深技術開發(fā)者,前者曾任職埃隆馬斯克的腦機接口公司,后者在Snapchat和Robinhood負責語音UI、移動基建等工程。
團隊的下一步計劃是向代理型AI演進,將應用拓展至提醒、上下文感知任務處理。他們也有意將WisprFlow與硬件集成,或打造軟硬一體生態(tài),增強場景控制力。
02VC精英起手,形成自然裂變
在產品推廣方面,WisprFlow走了一條不同尋常的金字塔式滲透路線。
誰能像WisprFlow一樣,第一批用戶就是VC/技術精英。硅谷VC和專業(yè)人士日常十分依賴該軟件。DigitsAICEOJeffSeibert用其完成70%董事會文檔,SuperhumanCEORahulVohra稱贊其為“ChatGPT后最佳AI產品”。
WisprFlow為自己的產品找到了超高契合度的需求場景,并能讓行業(yè)影響力背書,自然裂變效果極強。
這讓我聯(lián)想到國內有一個總結文檔的小產品叫“會讀”,它的增長策略也是通過VC、行業(yè)人士在微信朋友圈的社交傳遞,利用他們的影響力進行推廣,這種方式在早期幫助產品迅速積累了目標用戶。
接著,WisprFlow通過ProductHunt(4.8/5分)和專業(yè)社區(qū)滲透技術人群。Reddit(r/macapps)網友AnConnor說:“早期我批評了他們很多,但現在我是他們最直言不諱的客戶之一,它幫助我避免在某些任務上浪費時間。
這群人也有著愛學習、愛分享的特性,WisprFlow在沒有設計任何裂變獎勵機制的情況下,他們仍然自發(fā)地分享。
去年6月,在大家都把模型層的事兒討論完后,也開始關注能實際上手的AI產品,WisprFlow作為技術力較為突出的產品也收獲了一批關注。
對于更廣泛的消費用戶,WisprFlow提供了免費套餐(每周2000字)和12美元/月付費套餐。如今,Wisprflow的全球用戶,美國占40%,歐洲占30%。
通過“精英用戶驅動+免費引流”策略,它構建高黏性口碑生態(tài),推動語音輸入從工具向工作基礎設施躍遷。如今,WisprFlow一半的新用戶來自Reddit和X,這是由口碑和對產品質量的信任驅動的,產品變成了最好的渠道。
在此背后,是創(chuàng)始人IP與產品哲學的深度綁定。神童創(chuàng)始人TanayKothari擁有連續(xù)創(chuàng)業(yè)背景,12歲自學大學課程、13歲創(chuàng)建病毒式增長產品、IOI選手,在斯坦福大學求學期間創(chuàng)辦并成功出售公司。
創(chuàng)業(yè)過程中,Kothari從默念輸入設備這個失敗的硬件項目,轉向了軟件交互界面WisprFlow,應用的早期版本發(fā)布就受硅谷風投機構青睞,產生入站投資和口碑。
有意思的是,投資人還特別關注WisprFlow對殘障人士(例如ADHD、腕管、帕金森氏癥)用戶的吸引力。NEA合伙人AndrewSchoen談道:“WisprFlow吸引了受多動癥、腕管綜合癥、截肢和帕金森病影響的人群,幫助他們實現無縫溝通和創(chuàng)意表達?!?/p>
資本押注WisprFlow背后,是語音界面將引發(fā)“從打字到說話的大遷移”的行業(yè)共識。
WisprFlow被定位為工作場景的SaaS級入口,而大模型成熟(解決意圖理解)和移動設備交互瓶頸(語音>觸屏輸入效率)都會成為支撐這一點的趨勢。