智能語音助手的原理_預(yù)測(cè)智能語音助手的未來

2019-09-13 16:55:24

字體：大中小

供稿：網(wǎng)友

　　　語音助手能和人類進(jìn)行深度交談的背后，離不開自然語言處理（NLP）和自然語言生成（NLG）這兩種基礎(chǔ)技術(shù)。機(jī)器學(xué)習(xí)的這兩個(gè)分支使得語音助手能夠?qū)⑷祟愓Z言轉(zhuǎn)換為計(jì)算機(jī)命令，反之亦然。

　　什么是NLP？

　　NLP指在計(jì)算機(jī)讀取語言時(shí)將文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過程。簡(jiǎn)而言之，NLP是計(jì)算機(jī)的閱讀語言?？梢源致缘卣f，在NLP中，系統(tǒng)攝取人語，將其分解，分析，確定適當(dāng)?shù)牟僮鳎⒁匀祟惱斫獾恼Z言進(jìn)行響應(yīng)。NLP結(jié)合了計(jì)算機(jī)科學(xué)、人工智能和計(jì)算語言學(xué)，涵蓋了以人類理解的方式解釋和生成人類語言的所有機(jī)制：語言過濾、情感分析、主題分類、位置檢測(cè)等。

　　智能語音助手的原理_預(yù)測(cè)智能語音助手的未來

　　什么是NLG？

　　自然語言處理由自然語言理解（NLU）和自然語言生成（NLG）構(gòu)成。NLG是計(jì)算機(jī)的“編寫語言”，它將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本，以人類語言表達(dá)。即能夠根據(jù)一些關(guān)鍵信息及其在機(jī)器內(nèi)部的表達(dá)形式，經(jīng)過一個(gè)規(guī)劃過程，來自動(dòng)生成一段高質(zhì)量的自然語言文本。

　　智能語音助手的原理_預(yù)測(cè)智能語音助手的未來

　　對(duì)于“AI 語音識(shí)別”，每一個(gè)“語音識(shí)別”都是APP，這個(gè)APP里面內(nèi)置著我們常用字的“標(biāo)準(zhǔn)發(fā)音字庫“，同時(shí)，為了讓軟件能否識(shí)別我們“不標(biāo)準(zhǔn)的發(fā)音”，軟件還需要AI編程語言對(duì)我們不標(biāo)準(zhǔn)的發(fā)音做評(píng)分，然后做比對(duì)，最后選擇評(píng)分最高的那一個(gè)“標(biāo)準(zhǔn)發(fā)音”作為我們“不標(biāo)準(zhǔn)發(fā)音”的字庫！

　　1.語音識(shí)別的基本原理

　　語音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng)，包括特征提取、模式匹配、參考模式庫等三個(gè)基本單元，它的基本結(jié)構(gòu)如下圖所示：

　　　智能語音助手的原理_預(yù)測(cè)智能語音助手的未來

　　語音識(shí)別系統(tǒng)構(gòu)建過程整體上包括兩大部分：訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的，對(duì)預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進(jìn)行信號(hào)處理和知識(shí)挖掘，獲取語音識(shí)別系統(tǒng)所需要的“聲學(xué)模型”和“語言模型”;而識(shí)別過程通常是在線完成的，對(duì)用戶實(shí)時(shí)的語音進(jìn)行自動(dòng)識(shí)別。自動(dòng)語音識(shí)別技術(shù)有三個(gè)基本原理：首先語音信號(hào)中的語言信息是按照短時(shí)幅度譜的時(shí)間變化模式來編碼;其次語音是可以閱讀的，即它的聲學(xué)信號(hào)可以在不考慮說話人試圖傳達(dá)的信息內(nèi)容的情況下用數(shù)十個(gè)具有區(qū)別性的、離散的符號(hào)來表示;第三語音交互是一個(gè)認(rèn)知過程，因而不能與語言的語法、語義和語用結(jié)構(gòu)割裂開來。