搜索新聞

智慧語音交互系統(tǒng)在現(xiàn)代應急指揮中心的應用

來源:投影時代 更新日期:2021-10-13 作者:佚名

    語音識別是解決機器“聽懂”人類語言的一項技術。作為智能計算機研究的主導方向和人機語音通信的關鍵技術,語音識別技術一直受到各國科學界的廣泛關注。

    隨著現(xiàn)代科學的發(fā)展,人們在與機器的信息交流中,需要一種更加方便、自然的方式,而語言是人類最重要、最有效、最常用和最方便的通信形式。這就很容易讓人想到能否用自然語言代替?zhèn)鹘y(tǒng)的人機交流方式(如鍵盤、鼠標等)。人機自然語音對話就意味著機器應具有聽覺,能“聽懂”人類的口頭語言,這就是語音識別(Speech Recognition)的功能。語音識別是語音信號處理的重要研究方向之一,它是一門涉及面很廣的交叉學科,與計算機、通信、語音語言學、數理統(tǒng)計、信號處理、神經生理學、神經心理學、模式識別、聲學和人工智能等學科都有密切的聯(lián)系。它還涉及到生理學、心理學以及人的體態(tài)語言。

    2、語音識別系統(tǒng)

    語音識別本質上是一種模式識別的過程,未知語音的模式與已知語音的參考模式逐一進行比較,最佳匹配的參考模式被作為識別結果。圖1是基于模式匹配原理的自動語音識別系統(tǒng)原理框圖。

    (1)預處理模塊:對輸入的原始語音信號進行處理,濾除掉其中的不重要的信息以及背景噪聲,并進行語音信號的端點檢測、語音分幀以及預加重等處理。

    (2)特征提取模塊:負責計算語音的聲學參數,并進行特征的計算,以便提取出反映信號特征的關鍵特征參數用于后續(xù)處理。現(xiàn)在較常用的特征參數有線性預測(LPC)參數、線譜對(LSP)參數、LPCC、MFCC、ASCC、感覺加權的線性預測(PLP)參數、動態(tài)差分參數和高階信號譜類特征等[1]。其中,Mel頻率倒譜系數(MFCC)參數因其良好的抗噪性和魯棒性而應用廣泛。

    (3)訓練階段:用戶輸入若干次訓練語音,經過預處理和特征提取后得到特征矢量參數,建立或修改訓練語音的參考模式庫。

    (4)識別階段:將輸入的語音提取特征矢量參數后與參考模式庫中的模式進行相似性度量比較,并結合一定的判別規(guī)則和專家知識(如構詞規(guī)則,語法規(guī)則等)得出最終的識別結果。

    語音識別的應用

    語音識別技術發(fā)展到今天,特別是中小詞匯量非特定人語音識別系統(tǒng)識別精度已經大于98%,對特定人語音識別系統(tǒng)的識別精度就更高。這些技術已經能夠滿足通常應用的要求。由于大規(guī)模集成電路技術的發(fā)展,這些復雜的語音識別系統(tǒng)也已經完全可以制成專用芯片,大量生產。在經濟發(fā)達國家,大量的語音識別產品已經進入市場和服務領域。一些用戶交機、電話機、手機已經包含了語音識別撥號功能,還有語音記事本、語音智能玩具等產品也包括語音識別與語音合成功能。人們可以通過電話網絡用語音識別口語對話系統(tǒng)查詢有關的機票、旅游、銀行信息,并且取得很好的結果。調查統(tǒng)計表明多達85%以上的人對語音識別的信息查詢服務系統(tǒng)的性能表示滿意,近年來語音交互功能被應用到了應急指揮中心當中,通過語音調用大屏幕場景,語音調用監(jiān)控,語音調用信號源,語音調用預設內容等;

智能語音交互基于指揮中心的應用,領導只需按鍵,說出關鍵詞即可調用想要的監(jiān)控、PC、及相關信息,提高了整體指揮調度的水平。

    中天智領研發(fā)的智慧語音交互系統(tǒng):用戶按下遙控器上的語音鍵,下達清晰和直接的單向預設語音指令,傳輸到網絡中的語音識別引擎,達到對應的控制效果。獨有的語音壓縮算法,將語音壓縮以實現(xiàn)抗干擾及較遠距離的語音實時傳輸,30米范圍內精準遙控,360°無死角聲源定向。對話模型本地運行,數據本地存儲和處理,保障數據的私密性。

    中天智領研發(fā)的智慧語音交互系統(tǒng)擁有以下特點:

    應用范圍廣:通過一支智能語音激光遙控,可進行業(yè)務軟件及文檔控制,播放音視頻,調取監(jiān)控畫面等多項操作。

    識別精度高:系統(tǒng)通過無線藍牙傳輸數據和音頻,360度聲源定向,大大提高語音識別精度,系統(tǒng)支持方言模糊識別。

    反應時間短:語音識別結果響應時間≤100ms,從對語音交互設備下達指令到交互指令被執(zhí)行整個過程完成的時間≤1s。

    硬件配置優(yōu):專業(yè)防噴麥設計,聲音內容更加清晰;高保真采聲,使聲音采集更加清晰;語音鍵設置高度貼合人體工學。(臨場指揮 得心應手)

    中天智領可根據用戶需求及建設目標,搭建應急指揮中心,中天智領智慧應急指揮中心擁有多種系統(tǒng):智慧交互激光遙控系統(tǒng)、AI語音交互系統(tǒng)、智慧交互系統(tǒng)級觸控系統(tǒng)、智慧交互手勢識別系統(tǒng)、大屏KVM管控系統(tǒng)、云享控系統(tǒng)、智慧交互電子沙盤、分布式交互處理器、聯(lián)合標繪、實物交互等。系統(tǒng)實現(xiàn)通過網絡及通訊傳輸,將全需要監(jiān)控的前端視音頻及多媒體信息資源匯集到監(jiān)控指揮中心綜合管控平臺,實現(xiàn)信息的資源共享、統(tǒng)一處理。

最新監(jiān)控系統(tǒng)方案案例

天翼訊通超高清傳輸助力北京藝術中心

針對藝術中心這類復雜而精細的應用場景,我們的音視頻及控制信號的傳輸方案發(fā)揮了至關重要的作用。

華為與海城市共建加油站智慧監(jiān)管標桿

雙方攜手打造政務數智中樞稅務場景加油站智慧監(jiān)管標桿,推動海城數字社會融合創(chuàng)新,加快培育新質生

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網 版權所有 關于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網站地圖
返回首頁 網友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論