成果簡(jiǎn)介: 語(yǔ)音識(shí)別將聲音轉(zhuǎn)換成文本和命令,,從而達(dá)到語(yǔ)音輸入、語(yǔ)音控制的目的,。隨著各種電子產(chǎn)品,、移動(dòng)產(chǎn)品的大量涌現(xiàn),利用語(yǔ)音識(shí)別技術(shù)可以大大改善人機(jī)交互的方式,。嵌入式語(yǔ)音識(shí)別技術(shù),,可以應(yīng)用于多種基于Windows,、WinCE,、Linux等的應(yīng)用系統(tǒng)、移動(dòng)設(shè)備,,可以通過(guò)語(yǔ)音來(lái)達(dá)到控制,、查詢和有限輸入等“聲控”目的。 為順應(yīng)市場(chǎng)的潮流和推動(dòng)語(yǔ)音識(shí)別技術(shù)的產(chǎn)業(yè)化,,自動(dòng)化所專(zhuān)門(mén)針對(duì)各種電子產(chǎn)品和移動(dòng)電子產(chǎn)品,,開(kāi)發(fā)了一套基于連續(xù)語(yǔ)音識(shí)別技術(shù)的可變?cè)~匯、非特定人,、命令詞語(yǔ)音識(shí)別引擎 Pattek ASR/ESR, 這是一個(gè)具有良好接口的語(yǔ)音識(shí)別SDK引擎,,該引擎在各種噪聲環(huán)境、各種口音下,,識(shí)別率具有穩(wěn)定的識(shí)別率,,且支持漢語(yǔ)、英語(yǔ)以及混合語(yǔ)言,,支持Push-to-talk, Click-to-talk 和全聲控等多種工作模式的應(yīng)用,。 Pattek ASR3.0/ESR主要特性: 1、用戶無(wú)需實(shí)現(xiàn)訓(xùn)練,,為說(shuō)話人無(wú)關(guān)系統(tǒng),,具有很好的抗口音能力; 2,、識(shí)別準(zhǔn)確率高,,在常規(guī)語(yǔ)音撥號(hào)詞表下(500左右)首選識(shí)別率可以達(dá)到95%,; 3、卓越的抗噪性能:在大街上和汽車(chē)內(nèi)等嘈雜的環(huán)境下仍能保持實(shí)用化的準(zhǔn)確率,; 4,、占用系統(tǒng)資源少:系統(tǒng)程序空間98K,運(yùn)行空間100K,模型空間270K,總共約475K; 5,、能可以實(shí)現(xiàn)真正的Hand free操作,,人與麥克風(fēng)只要保持在30cm距離,系統(tǒng)都能正常工作,; 6,、系統(tǒng)在要求下處于監(jiān)控狀態(tài),能主動(dòng)抓住系統(tǒng)所需要辨識(shí)的關(guān)鍵詞和句型,,而有效地拒絕非關(guān)鍵詞和非定義句型,; 7、句型可以由用戶自行定義,; 8,、支持多個(gè)詞表之間的切換和增詞、減詞功能,; 9,、任意提供多個(gè)識(shí)別候選,提高二次交互的準(zhǔn)確率等,; 10,、具有良好的識(shí)別操作實(shí)時(shí)性,識(shí)別可以實(shí)時(shí)完成,; 11,、系統(tǒng)具有良好的實(shí)用性,可以在各種環(huán)境中使用,,識(shí)別效果良好,; 12、產(chǎn)品代碼極其優(yōu)化,,占有很少的存儲(chǔ)空間和運(yùn)行空間,。 Pattek ASR3.0/ESR主要性能指標(biāo): Pattek ASR3.0/ESR嵌入式系列識(shí)別引擎采用標(biāo)準(zhǔn)C語(yǔ)言編寫(xiě),支持移植到任何第三方操作系統(tǒng),,實(shí)現(xiàn)強(qiáng)大的語(yǔ)音人機(jī)交互功能,。已經(jīng)實(shí)施移植過(guò)的支持的操作系統(tǒng)包括微軟的WM5、PPC2002,、2003,,SmartPhone2002、2003等,;Symbian聯(lián)盟 的Symbians60,,嵌入式Linux如移軟Mphone系統(tǒng),、博動(dòng)OPNA系統(tǒng),類(lèi)Linux環(huán)境Nucles,,低端運(yùn)行環(huán)境REX,,基帶專(zhuān)用系統(tǒng)MTK等。 Pattek ASR3.0/ESR 引擎可以根據(jù)CPU的性能特點(diǎn)進(jìn)行裁減,,在超過(guò)20MIPS運(yùn)行能力的芯片上均可正常運(yùn)行,。如Intel的Xscale,PXA,, TI的OMAP和TMS-54x/55x DSPs AD,高通的基于ARM9的5500系列,,Philips Dragon Fly,展訊 的6600M系列,,MTK 62系列,, ARM7/ARM9,BroadCOM等,。下表為主要參數(shù): |