FESTO技術熱點人工智能識別
“Siri,今天天氣怎么樣?”“好的,Google,把音樂調(diào)小點!”“Alexa,再幫我訂一雙那款藍色運動鞋!”這些聽從于語言的技術化身為語音助手,早已成為我們?nèi)粘I畹囊徊糠帧UZ音控制之所以能順暢工作,要得益于其背后運行著的復雜的軟件程序。若要正確解讀所發(fā)出的指令,眾多準備工作、高性能計算機、以及人工智能均*。
人腦可以不費吹灰之力地解讀一個簡單的要求、一條短句。也就是說,人腦可以建立起邏輯關聯(lián),并相應地作出反應。但這對機器而言要復雜百倍。若想通過語音去控制技術設備,必須經(jīng)歷若干步驟。
識別與解讀語音
“給我一支鉛筆!”這樣一句簡單的指令,背后的計算機處理流程卻十分復雜。首先,要將發(fā)出的語音指令轉(zhuǎn)換為文本。只有借助頻率模板,語言識別軟件才能確定指令中包含哪些詞語,并克服諸多挑戰(zhàn):譬如模糊的發(fā)音,同音異義詞,不同的音調(diào)或方言。浩瀚的數(shù)據(jù)庫中儲存了大量的雙關語及其頻率模板,通過與數(shù)據(jù)庫進行比對,軟件能夠判斷當前出現(xiàn)的是哪些詞。
下一步是推斷句義。為此,軟件要將文本發(fā)送至語言界面,界面會根據(jù)特定關鍵詞來審核文本。在準備階段,程序員必須確定并定義所有重要的概念與指令——即所謂的目的——以及它們的近義詞,以應對每一次不確定的任務。例如發(fā)出“給”這個指令時,對應的是將一個物體傳送至某個具體的位置。
“我”一詞則被理解為某個人、或某個行為的目的。
人工智能可以找到*解
當語言界面識別出句義時,將會出現(xiàn)一個所謂的環(huán)境對象:借助一個軟件代碼可以實現(xiàn)對設備的操控。為了給機器下達一個無歧義的命令,需要使用另一個軟件所配備的“人工智能”技術。人工智能可以分析語境對象的內(nèi)容,并同時通過不同的傳感器收集關于設備位置與環(huán)境的信息。軟件中包含許多針對不同解決途徑所設置的模塊,它們分別對應某種的行為。綜合所有信息,程序?qū)⒔⒁粋€指令,例如抓臂該如何運動以及往哪個方向運動,然后將指令發(fā)送給設備操控系統(tǒng)。傳感技術能夠識別鉛筆在書桌的哪個位置,以及機器要采取何種路線才能拿起它,并將之遞給某個人。此外,軟件還能逐漸學習哪條解決路徑對當前行為而言是*解,并在下一次處理這一行為時運用這個知識。
以上所有復雜的流程必須在轉(zhuǎn)瞬間進行,因為人希望機器能夠作出迅速且必須正確的反應。經(jīng)過三十余年的應用,語音識別在一定程度上能夠運行得當。但在我們能與機器像與鄰居一般自如流暢地交流之前,還需要對機器的語音控制展開眾多研究與發(fā)展。
至于費斯托公司如何在仿生學習網(wǎng)絡的一項全新設計中運用語音控制技術,這一謎底將在2018年的漢諾威博覽會上揭曉。敬請期待!
FESTO氣缸、 費斯托電磁閥、 FESTO減壓閥 、 FESTO傳感器