另一家典型的代表是出門問問。公司在進(jìn)入智能音箱領(lǐng)域之前,一直專注智能手表,而「智能可穿戴之于語音交互,肯定不是最好的落地場(chǎng)景」,出門問問 AI 音頻事業(yè)部總經(jīng)理吳玉錦說道。基于車載后視鏡——問問魔鏡的成功,出門問問開始了家居場(chǎng)景的探索。2016 年,出門問問第一代智能音箱 Tic Home 立項(xiàng)。
吳玉錦坦言,最初接手音箱項(xiàng)目時(shí),內(nèi)心其實(shí)寫滿了問號(hào):「畢竟行業(yè)整體的語音技術(shù)遠(yuǎn)未成熟,缺乏『support domain』,很多領(lǐng)域的問題,智能語音助手沒法作答。」考慮到這一因素的掣肘,出門問問的首款智能音箱 Tic Home 向做工和音質(zhì)側(cè)重,投入了大量的研發(fā)精力和物料成本。
「第一代音箱取得了階段性成功,在淘寶眾籌平臺(tái)上的眾籌金額突破 400 萬」,不幸的是,Tic Home 發(fā)售不久,巨頭便紛至沓來。
如今,出門問問的音箱業(yè)務(wù)已經(jīng)轉(zhuǎn)向 To B 市場(chǎng),并找到了巨大的市場(chǎng)潛在機(jī)會(huì)。來自電信運(yùn)營(yíng)商和酒店品牌的訂單占絕大多數(shù),他們對(duì)智能音箱打開 IoT 的潛在機(jī)遇同樣看重。
能夠認(rèn)清形勢(shì)并抓住 To B 市場(chǎng),創(chuàng)業(yè)公司可以過得「相當(dāng)滋潤(rùn)」。畢竟,「BAT 不會(huì)為某一個(gè)行業(yè)或企業(yè)從頭到尾的專門定制,他們看不上那個(gè)量,而輕量型的企業(yè)能做好智能音箱的所剩無幾。有能力做的(企業(yè)),還要看它有沒有端到端的能力,是不是還得整合進(jìn)別家的技術(shù)才能完成交付」,吳玉錦告訴極客公園(ID:geekpark),經(jīng)歷了 C 端市場(chǎng)全鏈路的打通和嘗試,出門問問已經(jīng)具備 to B 能力輸出的要求。
巨頭的生態(tài)博弈
在 2017 年的盛夏,小米 AI 音箱以 299 元的售價(jià)貫徹了小米「不靠硬件賺錢」的一貫作風(fēng)。采訪中,唐沐絲毫不避諱這一話題,首度承認(rèn)小米是智能音箱價(jià)格戰(zhàn)的「發(fā)起者」。
盡管阿里、百度和小米布局智能音響的想法和切入點(diǎn)不盡相同,但巨頭誓死捍衛(wèi)智能音箱戰(zhàn)場(chǎng)的本源殊途同歸,唐沐指出:「比如 BAT 當(dāng)年抓互聯(lián)網(wǎng)入口,雖然各有各的切入點(diǎn),但是他們只要抓到了這個(gè)入口,牢牢吸附在這些入口之上的時(shí)候,他們就會(huì)發(fā)展全領(lǐng)域的應(yīng)用,然后構(gòu)建閉環(huán)。」
在唐沐看來,巨頭以補(bǔ)貼的方式進(jìn)入音箱市場(chǎng),看似野蠻,可選之路卻唯有如此。畢竟每家公司在成長(zhǎng)路徑上的差異,導(dǎo)致用戶對(duì)品牌形象的認(rèn)知相對(duì)固化,很難相信「提供電商服務(wù)的公司和提供即時(shí)通訊的企業(yè)可以做好一款硬件產(chǎn)品」。同理,用戶也很難相信「小米可以做一款很 NB 的互聯(lián)網(wǎng)服務(wù)」。他直言:「企業(yè)想要打破這種偏見,就必須付出比別人更大的代價(jià)」。在智能硬件領(lǐng)域,低價(jià)仍是打破品牌刻板偏見的有效手段之一。
很多時(shí)候,用戶交互過程中,至少需要三輪對(duì)話才能得到令人滿意的結(jié)果。小魚在家 CEO 宋晨楓提到,多輪交互中,一旦用戶的表述相對(duì)復(fù)雜,機(jī)器很可能無法準(zhǔn)確理解語義,導(dǎo)致交互被迫中斷。這種效率低下的交互體驗(yàn),通常會(huì)讓用戶在檢索信息的過程中產(chǎn)生倦怠感。
百度 AI 交互設(shè)計(jì)院基于對(duì)大量的智能語音交互產(chǎn)品用戶測(cè)試的經(jīng)驗(yàn)發(fā)現(xiàn),影響語音喚醒體驗(yàn)的因素包含兩個(gè)維度——輸入和輸出。而產(chǎn)業(yè)內(nèi)也正在形成一種共識(shí),那就是 I/O(輸入和輸出)能力的提升,是智能設(shè)備在未來取得突破和發(fā)展的關(guān)鍵。
從上述探討中不難看出,由于智能音箱尚未實(shí)現(xiàn)「真智能」,導(dǎo)致產(chǎn)品對(duì)于屏幕的依賴程度。但不可否認(rèn)的是,屏幕讓產(chǎn)品的邊界和功能變得模糊和冗余的現(xiàn)象正在發(fā)生。所謂「帶屏音箱」,或許正在朝著以看為主的方向進(jìn)化。有觀點(diǎn)認(rèn)為,未來智能音箱的演變路徑,大概率是融合進(jìn)智能電視之中。帶屏音箱獲或?qū)⒊蔀榫揞^提前搶占智能電視生態(tài)的工具,這是亞馬遜在 Google Home Hub 之后,推出了帶屏版 Echo 的大概率目的。
縱使 AI 技術(shù)是制約智能音箱行業(yè)發(fā)展的最大瓶頸,「可如果加屏幕是為了繞過技術(shù),緩解多輪交互的局限和語音的一些缺失,這個(gè)點(diǎn)是不成立的」,龍夢(mèng)竹直言不諱。畢竟,智能音箱從一開始就不是近場(chǎng)語音交互的工具,也不是供用戶把玩的掌機(jī)。「雖然屏幕的加持,有這樣那樣的好處,但把這些優(yōu)勢(shì)和特色作用于一臺(tái)音箱上,似乎是不成立的。」
聲智科技 CEO 陳孝良指出,帶屏智能音箱在未來擠壓智能平板市場(chǎng)的可能性更高。盡管目前帶屏音箱朝著融合交互的方向發(fā)展,但屏幕自然會(huì)讓用戶默認(rèn)為是可觸摸的交互手段,弱化并逐漸遺忘語音交互。在市場(chǎng)培育期,品牌方應(yīng)該先讓用戶養(yǎng)成語音交互的習(xí)慣,再慢慢推出帶屏音箱。
可喜的是,消費(fèi)者看到了智能音箱的迭代進(jìn)化。在今年 7 月初舉辦的百度 AI 開發(fā)者大會(huì)上,李彥宏為現(xiàn)場(chǎng)觀眾演示了小度自研的全雙工免喚醒技術(shù)。一次喚醒,多輪交互的使用體驗(yàn),或?qū)⑹且粝渥呦颉刚嬷悄堋沟牡谝徊健?梢悦鞔_的是,語音助手和人類自如對(duì)話的日子指日可待了。
在上一輪的比拼中,一些專注 2B 語音技術(shù)的創(chuàng)業(yè)公司雖然生存了下來,有些玩家還成為了巨頭的合作伙伴,但唐沐放言,當(dāng)智能音箱 2.0 時(shí)代來臨,這些 B 端公司可能會(huì)遭遇前所未有的生存挑戰(zhàn)。因?yàn)?C 端的大玩家都會(huì)為「真智能」提高核心壁壘,很可能不再需要解決方案商作為合作伙伴了。
屆時(shí),巨頭會(huì)把 ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)、NLP(Natural Language Processing,自然語言處理)、TTS(Text To Speech,從文本到語音)等技術(shù)變?yōu)樽匝械幕A(chǔ)能力。