系統(tǒng)特點(diǎn):
1.同時支持windows&Linux;
2.識別率高:
語音識別率超97%<;
3.識別速度快:
較快的識別速度實(shí)時率可以達(dá)到0.2-0.3;
4.模型豐富:
數(shù)據(jù)、算法、模型積淀,聲學(xué)語音模型覆蓋各行各業(yè);
5.多語種支持:
支持英語等外語種、維藏蒙彝朝等少數(shù)民族語、粵語四川話閩南話等方言的識別;
模型可定制,可根據(jù)客戶應(yīng)用場景進(jìn)行模型的定制訓(xùn)練,迅速提高領(lǐng)域內(nèi)識別率;
6.支持實(shí)時/離線識別:
在離線語音質(zhì)檢轉(zhuǎn)寫場景中,能夠單通道錄音的語音識別進(jìn)行話者分離,情緒檢測,語速檢測;
7.支持模型訓(xùn)練:
針對特定的領(lǐng)域,可以針對性的訓(xùn)練專門的語言模型和聲學(xué)模型這樣對于集中在這個領(lǐng)域的說話內(nèi)容就會獲得更好的識別率。支持根據(jù)生產(chǎn)錄音,進(jìn)行進(jìn)一步訓(xùn)練優(yōu)化。包括語言模型訓(xùn)練和聲學(xué)模型訓(xùn)練,提升語音識別的準(zhǔn)確率。訓(xùn)練形式可支持本地化訓(xùn)練或簽訂保密協(xié)議遠(yuǎn)程訓(xùn)練;
8.支持多模型:
全智能能力平臺支持掛載多個模型支持根據(jù)不同的場景啟用相應(yīng)的模型;
9.高識別率:
高識別率:支持對大量的行業(yè)詞庫進(jìn)行專業(yè)模型訓(xùn)練,包括文本和語音文件訓(xùn)練;
高處理性能: 語音識別具有高識別速度,實(shí)時率0.2-0.3,并且能夠穩(wěn)定支持100路并發(fā);
系統(tǒng)擴(kuò)容:支持橫向擴(kuò)容,滿足甲方業(yè)務(wù)增長的需求;
10.支持多接口調(diào)用:
支持開放友好的接入方式支持HTTP、TCP、MRCP、webservice、socket等接口支持使用異步通信庫獲取結(jié);
支持自動加標(biāo)點(diǎn)語音識別引警可以自動對識別結(jié)果加上標(biāo)點(diǎn)符號,此過程主要利識別結(jié)果的語義進(jìn)行處理的,也利用了聲學(xué)上的一些特性,例如停頓長度等;
11.支持流式/非流式識別:
非流式識別: 輸入一整段語音,引擎進(jìn)行特征提取和解碼的識別工作,并返回這段語音的識別結(jié)果;
流式識別: 可以分段輸入語音,最后得到結(jié)果。引擎在獲得分段的輸入語音的同時,就可以同步地對這段數(shù)據(jù)進(jìn)行特征提取和解碼工作,而不用等到所有數(shù)據(jù)都獲得后再開始工作。因此這樣就可以在最后一段語音結(jié)束后,僅延遲很短的時間即可返回最終識別結(jié)果。這種流式輸入方式能縮短整體上獲得最終結(jié)果的時間,極大地提升用戶體驗(yàn);
12.支持實(shí)時/離線識別:
實(shí)時識別: 語音識別引擎在每次獲得分段輸入的語音后,如果已經(jīng)開始檢測到語音端點(diǎn)并加以識別,就會實(shí)時返回當(dāng)前已識別出來的結(jié)果,而不是等到檢測到語音結(jié)束端點(diǎn),再輸出本段語音的完整結(jié)果;
離線轉(zhuǎn)寫: 語音識別引擎支持提供離線轉(zhuǎn)寫服務(wù),可以將呼叫中心產(chǎn)生的錄音轉(zhuǎn)寫成文本;