“在這個(gè)時(shí)代,如果想要獲取信息,你很難不通過(guò)嘴。” 思必馳首席科學(xué)家、聯(lián)合創(chuàng)始人俞凱在上海市北·GMIS 全球人工智能峰會(huì)的現(xiàn)場(chǎng)演講中的短短一句話(huà),卻總結(jié)了目前人類(lèi)的交互習(xí)慣發(fā)展趨勢(shì)。

思必馳首席科學(xué)家、聯(lián)合創(chuàng)始人俞凱
在智能終端時(shí)代,有人認(rèn)為 AR 眼鏡或許會(huì)是人類(lèi)需要的 “最后一塊屏”,這種感覺(jué)在語(yǔ)音交互技術(shù)出現(xiàn)后可能表現(xiàn)得更加強(qiáng)烈。前瞻產(chǎn)業(yè)研究院發(fā)布的《2018-2023 年中國(guó)物聯(lián)網(wǎng)行業(yè)細(xì)分市場(chǎng)需求與投資機(jī)會(huì)分析報(bào)告》曾發(fā)布了初步估算的數(shù)據(jù):2017 年全球物聯(lián)網(wǎng)設(shè)備數(shù)量達(dá)到 84 億,比 2016 年的 64 億增長(zhǎng) 31%,2020 年物聯(lián)網(wǎng)設(shè)備數(shù)量將達(dá)到 204 億。在這些智能設(shè)備中,屏幕已經(jīng)越來(lái)越小,而語(yǔ)音交互能力幾乎成了標(biāo)配??梢?jiàn),智能語(yǔ)音交互擁有極具誘惑力的諾大市場(chǎng)。
不過(guò),在這個(gè)百家爭(zhēng)鳴的科技時(shí)代,有趣的不僅是宏觀的市場(chǎng)增量。企業(yè)在實(shí)踐摸索出規(guī)律,并對(duì)未來(lái)進(jìn)行大膽、前瞻性的判斷,才更值得津津樂(lè)道。作為語(yǔ)音技術(shù)領(lǐng)域的平臺(tái)交互型公司,同時(shí)也是行業(yè)前列的探索者,思必馳對(duì)于如何打造更加人性化的語(yǔ)音交互技術(shù)也提出了自己的新見(jiàn)解。
“通用的語(yǔ)音識(shí)別率基本上能到 95% 以上,語(yǔ)義識(shí)別率能到 90% 以上。但是語(yǔ)音交互本身是一個(gè)鏈條,盡管每個(gè)體系可達(dá)到 90% 的可用度,但是技術(shù)加在一起的整體可用率會(huì)降低很多?!?俞凱先提出了現(xiàn)在語(yǔ)音交互行業(yè)面臨的技術(shù)問(wèn)題。他認(rèn)為,導(dǎo)致問(wèn)題的原因主要是 “沒(méi)有做聯(lián)合優(yōu)化”,即大家都是在每個(gè)任務(wù)上是獨(dú)立優(yōu)化。為了提高整個(gè)語(yǔ)音交互技術(shù)的可用性,思必馳實(shí)行了技術(shù)上的全鏈路,如以語(yǔ)義理解為目標(biāo)來(lái)優(yōu)化語(yǔ)音識(shí)別,即目標(biāo)不是看字的錯(cuò)誤率,而是看理解上的偏差。簡(jiǎn)單來(lái)說(shuō),思必馳的技術(shù)全鏈路 AI 可以把語(yǔ)音交互技術(shù)中,前面產(chǎn)生的錯(cuò)誤在后面環(huán)節(jié)中自動(dòng)做糾正,提高整體的可用率。
當(dāng)然,除了技術(shù)層面的優(yōu)化,優(yōu)質(zhì)的語(yǔ)音交互技術(shù)還需要產(chǎn)品設(shè)計(jì)的加持,以保證體驗(yàn)升級(jí)。此前,有很多基于語(yǔ)音交互技術(shù)的產(chǎn)品,如娛樂(lè)、教育機(jī)器人等遭到了用戶(hù)的 “拋棄”。這給企業(yè)帶來(lái)了技術(shù)邊界與用戶(hù)期望之間關(guān)系的深思。我們目前的語(yǔ)音技術(shù)究竟足夠支撐多強(qiáng)大的產(chǎn)品?什么樣的語(yǔ)音產(chǎn)品會(huì)減小用戶(hù)的失望程度?
“技術(shù)邊界和用戶(hù)期望平衡的核心點(diǎn)是產(chǎn)品設(shè)計(jì)?!?俞凱表示,合理的產(chǎn)品設(shè)計(jì)可以有效地 “揚(yáng)長(zhǎng)避短”。他認(rèn)為,以目前的技術(shù)發(fā)展?fàn)顟B(tài)來(lái)看,需要做一些用戶(hù)可配合的場(chǎng)景應(yīng)用,即場(chǎng)景的可控性較高。“讓用戶(hù)在合適的情況下去做一些交互,那么產(chǎn)品的性能就比較有保障?!?他以思必馳和順豐合作的語(yǔ)音下單機(jī)器人為例說(shuō)明:這就是典型的比較窄的任務(wù),用戶(hù)目的明確,所以用戶(hù)的期望比較可控。總之,在技術(shù)發(fā)展的階段中,企業(yè)不僅在自己做產(chǎn)品的時(shí)候需要實(shí)事求是,對(duì)于用戶(hù)也要誠(chéng)實(shí)。
值得一提的是,思必馳主要是為企業(yè)和開(kāi)發(fā)者提供自然語(yǔ)言交互解決方案,包括 DUI 開(kāi)放平臺(tái)、企業(yè)級(jí)智能服務(wù)、人機(jī)對(duì)話(huà)操作系統(tǒng)、人工智能芯片模組等。那么,對(duì)于思必馳而言,他們?nèi)绾位谧陨砑夹g(shù)實(shí)力為企業(yè)類(lèi)客戶(hù)帶來(lái)新體驗(yàn)?
俞凱稱(chēng),近幾年人工智能產(chǎn)業(yè)鏈發(fā)生了比較深刻的變革——專(zhuān)業(yè)化分工的加速。在這樣的背景下,人工智能企業(yè)分為三層,一是基礎(chǔ)技術(shù)支撐層。他們就像發(fā)電廠商;二是中間層。他們以提供技術(shù)賦能為核心的智能交互層,像是輸電的企業(yè);三是應(yīng)用層,集成各種各樣不同的從語(yǔ)音到圖像各種各樣不同的 AI 技術(shù),形成綜合的產(chǎn)品解決方案,就像做電器的企業(yè)。而智能交互層出現(xiàn)了一個(gè)主要矛盾,即:越來(lái)越強(qiáng)的通用技術(shù),與使用者高度靈活化,高度可配置的個(gè)性化需求之間的矛盾。
“面對(duì)這樣的矛盾,作為平臺(tái)型的驅(qū)動(dòng)企業(yè),思必馳希望打造可定制的對(duì)話(huà)式人工智能?!?俞凱說(shuō)道。
“定制化” 并不是新鮮詞,但是思必馳打造的可定制的對(duì)話(huà)式人工智能,兼具定制化和可規(guī)?;?。眾所周知,一般來(lái)說(shuō),定制化意味著很難規(guī)?;5釀P表示可定制的對(duì)話(huà)式人工智能就像是 “柔性制造” 技術(shù),可定制,可批量生產(chǎn),可實(shí)現(xiàn) “千人千面”。
關(guān)于具體實(shí)現(xiàn)可定制的對(duì)話(huà)式人工智能的關(guān)鍵點(diǎn),俞凱從三個(gè)方面分享:
一是工程支撐方面,首先是以全鏈路對(duì)話(huà)交互技術(shù)為核心,實(shí)現(xiàn) “高可用”,即讓更多的人可以定制,另外也要支持定制地規(guī)?;?/p>
二是需要相應(yīng)的資源支撐,比如識(shí)別領(lǐng)域,需要方言、多語(yǔ)種、多個(gè)精細(xì)化語(yǔ)義領(lǐng)域的支撐,才能夠形成完整的模型;
三是算法支撐(個(gè)性化智能自適應(yīng))。智能地自適應(yīng)要解決三個(gè)難點(diǎn):一是目標(biāo)發(fā)現(xiàn),即向誰(shuí)做自適應(yīng)學(xué)習(xí)。二是小數(shù)據(jù)的自適應(yīng),傳統(tǒng)的深度學(xué)習(xí)需要喂大數(shù)據(jù)來(lái)訓(xùn)練模型,而現(xiàn)在需要用很小的數(shù)據(jù)實(shí)現(xiàn)。三是在線的學(xué)習(xí)更新,即當(dāng)語(yǔ)義理解不精確,或者出現(xiàn)語(yǔ)音識(shí)別錯(cuò)誤時(shí),人和機(jī)器在真實(shí)場(chǎng)景當(dāng)中可繼續(xù)交互下去,就需要一個(gè)聰明的決策。機(jī)器系統(tǒng)怎樣通過(guò)問(wèn)話(huà),或者通過(guò)引導(dǎo)使對(duì)話(huà)更平滑地繼續(xù)下去,能夠更好地把意圖推理出來(lái)。
“未來(lái)我們看到的對(duì)話(huà)智能,并不是一種通用的技術(shù),而是可以在每一個(gè)產(chǎn)業(yè)里面有自己獨(dú)立個(gè)性的定制化對(duì)話(huà)式人工智能?!?俞凱說(shuō)道。
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注