
ROOBO CTO 雷宇
以下為會(huì)議演講速記:
行業(yè)標(biāo)準(zhǔn)化是宇A(yù)用戶推動(dòng)物聯(lián)網(wǎng)發(fā)展的重要因素
大家上午好!
人工智能和物聯(lián)網(wǎng)之間有什么關(guān)系?職責(zé)于我認(rèn)為物聯(lián)網(wǎng)主要是?解決連接的問題,這是縮短第一個(gè)階段。我們現(xiàn)在在做一件重要的服務(wù)事情,就是雷路徑把第一階段的物聯(lián)網(wǎng)發(fā)展?jié)u漸往?人工智能、往更多的宇A(yù)用戶感知技術(shù)上轉(zhuǎn)變,這是職責(zé)于物聯(lián)網(wǎng)發(fā)展的第二階段。
在IO輸入輸出方面,縮短我們傾向于應(yīng)用語音圖像這一類更自然的服務(wù)交互手段。同時(shí),我們希望把更多的內(nèi)容和服務(wù),賦予傳統(tǒng)設(shè)備、新的設(shè)備。
物聯(lián)網(wǎng)和互聯(lián)網(wǎng)的本質(zhì)區(qū)別在哪里?物聯(lián)網(wǎng)的話,比如說你做一設(shè)備,把它放在摩拜單車?yán)铮a(chǎn)生的價(jià)值是一個(gè)工具性的價(jià)值,它不是一種服務(wù)和內(nèi)容性的價(jià)值。
我們想在眾多的無錫外圍收費(fèi)標(biāo)準(zhǔn)(微信156-8194-*7106)無錫外圍收費(fèi)標(biāo)準(zhǔn)快餐全套一條龍包夜互聯(lián)網(wǎng)設(shè)備里找到具備深度內(nèi)容特點(diǎn)的設(shè)備,它能夠被賦予更多交互和內(nèi)容。在探索過程中,我們發(fā)現(xiàn)三個(gè)問題。第一個(gè)問題就是硬件的標(biāo)準(zhǔn)化的問題。未來的智能設(shè)備,它不像現(xiàn)在的電腦、手機(jī),它是一種標(biāo)準(zhǔn)化的東西。只有硬件方案或硬件模組的標(biāo)準(zhǔn)化,才能推動(dòng)它的發(fā)展。
第二就是交互在哪里。現(xiàn)在物聯(lián)網(wǎng)交互大多是通過APP實(shí)現(xiàn),物聯(lián)網(wǎng)本身其實(shí)沒有交互。那么真正的智能設(shè)備它的交互是什么?手機(jī)時(shí)代,安卓、IOS它之所以能夠成功,是因?yàn)樗诮换ド鲜怯型黄频模虼瞬拍軌虮唤K端用戶所接受。那未來物聯(lián)網(wǎng)智能設(shè)備的突破口在哪里?
第三點(diǎn),這個(gè)應(yīng)用開發(fā)平臺(tái)到底是什么??當(dāng)年Andy Rubin(安迪·魯賓)為什么堅(jiān)持一定要把VM裝到一個(gè)這么小的設(shè)備里去,那個(gè)時(shí)候是被很多人詬病的,說這個(gè)算力這么低,怎么可能把一個(gè)VM放進(jìn)去。但是Andy Rubin仍然堅(jiān)持說,只有更多的開發(fā)者進(jìn)來一起開發(fā),有更多的應(yīng)用才有更多的功能,才會(huì)有更多的資源,才能讓用戶去買單,有了用戶買單才能反向的把這個(gè)市場(chǎng)做大,反向市場(chǎng)做大之后算力才會(huì)提升。這個(gè)世界上沒有哪個(gè)芯片公司會(huì)說我先投十個(gè)億把這個(gè)市場(chǎng)做大,我告訴你沒有。
這是智能網(wǎng)絡(luò)、智能終端必須要解決的三個(gè)根本問題。基于行業(yè)背景,我們推出了ROS.AI人工智能平臺(tái),平臺(tái)主要分為硬件、系統(tǒng)以及軟件三個(gè)層面。在硬件層面,我們向行業(yè)推出了一些標(biāo)準(zhǔn)模組,包含麥克風(fēng)陣列等等。再下面則是系統(tǒng)層,比如Linux、Android、RTOS。我們向客戶提供這類標(biāo)準(zhǔn)化的方案,幫助他們?nèi)プ鲆恍┎煌螤睢⒉煌x、不同成本的智能交互設(shè)備。

在軟件層,我們主要和RT-Thread?這類優(yōu)秀的公司合作,因?yàn)槲覀儽旧韺I(yè)領(lǐng)域并不在這里,我們主要解決的是交互問題和應(yīng)用開發(fā)問題。我們把所有的引擎囊括在開發(fā)平臺(tái)上。
人工智能加現(xiàn)實(shí)應(yīng)用場(chǎng)景才具備價(jià)值
ROOBO其實(shí)始于機(jī)器人。我們不想閉門造車,而?智能機(jī)器人又是人工智能平臺(tái)的最佳載體,所以我們推出了布丁系列產(chǎn)品。布丁系列在市場(chǎng)上的反饋相當(dāng)不錯(cuò),但更重要的是它承載了ROS.AI系統(tǒng)。ROS.AI在智能家居方面也已經(jīng)有了實(shí)際應(yīng)用案例。我們?yōu)闃I(yè)內(nèi)知名的家電廠商提供標(biāo)準(zhǔn)模組和整套R(shí)OS.AI解決方案,幫助客戶解決存量設(shè)備以及新設(shè)備智能化的問題。

在智能車載方面,我們和吉利,長城,威馬,奔馳等汽車品牌達(dá)成了合作,主要提供一些人機(jī)交互套件,以及云端的解決方案。
在落地過程中,我們需要具體解決哪些問題?首先我們要解決前端的聲音。語音識(shí)別有一個(gè)很重要技術(shù)要點(diǎn)就是前端的信號(hào)處理技術(shù)。也就是說耳朵這個(gè)事情我們一定要做好,耳朵做不好的話,語音識(shí)別是達(dá)不到99分的。
結(jié)合ROOBO多年從事機(jī)器人和智能家居語音交互產(chǎn)品的研發(fā)、設(shè)計(jì)和生產(chǎn)經(jīng)驗(yàn),我們與微軟在今年五月合作推出了微軟認(rèn)知服務(wù)開發(fā)者套件,包含麥克風(fēng)陣列等等硬件參考設(shè)計(jì)是由ROOBO完成的。
左邊這個(gè)是他們今年推出的智能會(huì)議系統(tǒng)。這個(gè)智能會(huì)議系統(tǒng)我認(rèn)為是下一代人機(jī)交互技術(shù)的典型案例。現(xiàn)在所謂的人機(jī)交互還是單人對(duì)單人的,其實(shí)人類不是這樣的,我們真正的通路是多路的。現(xiàn)實(shí)情況是可以有N個(gè)人跟我對(duì)話,我們可以選擇聽哪一個(gè)不聽哪一個(gè),或者說反饋哪一個(gè)不反饋哪一個(gè),我們想真正解決復(fù)雜環(huán)境下的人機(jī)交互問題。這個(gè)會(huì)議系統(tǒng)上面是一個(gè)Camera,下面是一個(gè)麥陣。在開會(huì)的時(shí)候,系統(tǒng)可以把每一個(gè)人的聲音記錄下來形成會(huì)議記錄和會(huì)議摘要。
我們的設(shè)備基本上都是in house的,為了讀懂這個(gè)場(chǎng)景,我們對(duì)人的屬性、場(chǎng)景屬性都有大量的數(shù)據(jù)沉淀,從而幫助平臺(tái)上的設(shè)備讀懂特定場(chǎng)景,讀懂用戶的命令。比如我們給家電廠商提供了圖像模組后,在一些大的場(chǎng)景環(huán)境或者大家庭里,設(shè)備能夠自主去感知人多還是人少,是老年人還是兒童,從而實(shí)現(xiàn)綠色空調(diào)、健康空調(diào)這一功能屬性。
單純的AI是沒有用戶去買的。如果人工智能加上一個(gè)現(xiàn)實(shí)的應(yīng)用場(chǎng)景,讓這個(gè)場(chǎng)景更具有溫度,讓這個(gè)場(chǎng)景更具有價(jià)值,這樣才有意義。另外,客戶對(duì)于平臺(tái)安全性和反應(yīng)速度有著相當(dāng)高的要求,特別是一些工業(yè)場(chǎng)景。因此我們大多數(shù)的引擎沒有放在云端,而是在設(shè)備終端運(yùn)行,這其實(shí)是一種邊緣計(jì)算。
這樣的好處一是反應(yīng)速度快,二是說我不需要把原始數(shù)據(jù)放到后臺(tái)去傳,語音數(shù)據(jù)也是同理。智能家電對(duì)于這個(gè)問題可能更敏感些,因此我們?yōu)橹惪蛻魩缀醵际翘峁┝穗x線和在線相結(jié)合的方案。
AI的職責(zé)就是縮短用戶獲得服務(wù)的路徑
在理解用戶的意圖之后,我們需要把更多的內(nèi)容和服務(wù)給到用戶。我們剛才提到的幾個(gè)領(lǐng)域里的客戶,他會(huì)告訴你,沒有用戶會(huì)直接說去買AI。用戶會(huì)覺得的AI+的體驗(yàn)會(huì)不會(huì)更好?確實(shí)會(huì)更好。比如說像開車的時(shí)候,你真的不用用手去點(diǎn),對(duì)吧?聽歌你買的不是一個(gè)簡單的FM,不是一個(gè)radio,你可能買到的是一個(gè)DJ,他不但更懂你,它可以更理解你。
AI的職責(zé)就是縮短用戶獲得服務(wù)的路徑。所以說我們?cè)趦?nèi)容這一塊介紹得比較多,特別是像娛樂教育和生活服務(wù)類,我們其實(shí)都有對(duì)接。
國內(nèi)物聯(lián)網(wǎng)設(shè)備未來的發(fā)展方向是什么?包括我們自己也在做AI低成本方案。我們做的量比較大的方案是故事機(jī)。你會(huì)發(fā)覺第一代的故事機(jī)非常簡單,而現(xiàn)在客戶的需求希望能夠運(yùn)用上云端,這樣設(shè)備資源就得到了一個(gè)巨大的提升,這是第一個(gè)需求。
第二需求就是你能不能讓我也能夠用語音去點(diǎn)播,甚至于說能不能給我加上APP、微信通訊功能,當(dāng)家長不在家的時(shí)候,孩子可以通過這些功能給家長留言、溝通。其實(shí)這種想法我覺得是很正常的,但是在做的過程中我們發(fā)現(xiàn)挑戰(zhàn)特別大,因?yàn)檫@個(gè)系統(tǒng)本身并不是為了這些功能而生的,它更多的是系統(tǒng)控制方面的。我們當(dāng)時(shí)做了很多優(yōu)化,包含我們模型DNN也放不上去,只能用傳統(tǒng)技術(shù)去做。這件事情過后,我們發(fā)覺其實(shí)應(yīng)該和行業(yè)優(yōu)秀的公司去合作,因?yàn)槲覀冏约菏且还闪α浚瑓R集其他公司優(yōu)秀的能力,那我就可以同時(shí)做兩件事情。
第一件事情,我們?yōu)楹献骰锇榈哪K提更多的能力,而他們自己解決WiFi問題,解決NB-IOT的問題等。第二件事,我們也有自己的開發(fā)者,我們沒有to D,我們是to B。因?yàn)槲以谄脚_(tái)上面做應(yīng)用,永遠(yuǎn)是做不完的。所以ROS.AI是一個(gè)非常大的一個(gè)開發(fā)平臺(tái),開發(fā)者有一套賬號(hào),他在上面可以去做形式化編程的東西,我們稱之為BOT能力。開發(fā)者實(shí)際上是是多層的,它并不只有操作系統(tǒng)開發(fā),因?yàn)槲磥碓O(shè)備就像剛才提到的邊緣計(jì)算和云端計(jì)算,邊緣應(yīng)用和云端應(yīng)用,它其實(shí)界限是越來越不清晰了。
所以說其實(shí)因?yàn)閷?duì)用戶而言,他要的是幾乎所有的服務(wù)都在云端。所以我們也想通過跟RT-Thread的合作,去吸引更多的開發(fā)者,然后去熟悉整個(gè)從底層到上層的整體開發(fā)的模式,因?yàn)橹挥羞@樣才能保證它的流暢性。
我舉個(gè)例子,比如說你作為開發(fā)者或者廠商,會(huì)發(fā)覺只解決一個(gè)技術(shù)問題,離客戶想要的還是差太遠(yuǎn)了,實(shí)際上這個(gè)問題必須統(tǒng)一考慮、統(tǒng)一整合。比如在智能駕駛領(lǐng)域,我們首先要解決聲音的信號(hào)處理問題,解決喚醒問題,解決識(shí)別問題,解決語義理解問題,然后你要糾錯(cuò)要改寫,并且將知識(shí)圖譜一一點(diǎn)亮。我們?cè)O(shè)計(jì)產(chǎn)品的初衷在于讓用戶更方便更快捷地獲得服務(wù),這是一個(gè)永恒不變的課題。但是開發(fā)者要做的事情并沒有減少。也就是說如果系統(tǒng)和開發(fā)者做的事情越多,那么用戶要做的事情就越少。只有像我們這種平臺(tái)公司和開發(fā)者充分地配合,讓開發(fā)者充分地融入到整個(gè)鏈條中來,這個(gè)事情才能做好。
未來,我們希望能夠跟更多像RT-Thread這樣的優(yōu)秀公司,以及更多的生態(tài)企業(yè)一起在萬物互聯(lián)的時(shí)代里把市場(chǎng)做得越來越大,謝謝大家。