語音處理是目前資訊學領域的研究熱點和難點,其任務是研究如何利用信號處理技術研究語音信號,使未來的電腦“能聽會說”。語音信號的處理是對語音信號進行分析,只有通過分析得到的參數才能做進一步的研究。語音分析涉及大量複雜的數學運算,如果採用硬體方式實現,從價格和靈活性上都不可取。如果通過電腦軟硬體結合的方法採用主流的編程方式實現,則存在編程複雜,不易擴展和介面不友好等問題。
虛擬儀器是全新概念的最新一代測量儀器,自1987年誕生以來,以前所未有的速度迅猛發展。虛擬儀器與電腦軟硬體技術的發展同步,他利用電腦強大的計算能力和豐富的軟硬體資源來組織儀器系統,從而實現實驗儀器系統的部分乃至全部的功能,並最終實現從傳統儀器向電腦的過渡。虛擬儀器的測量功能可以由用戶根據需要自行設計軟體來定義或擴展,而非由廠家事先定義且固定不可變更。尤其是美國NI公司的圖形化虛擬儀器開發平臺LabVIEW,不僅編程簡單功能完備,而且有多種專用套裝軟體和豐富的各種板卡可供選擇,這就為開發一個符合要求且介面友好的語音分析平臺提供了便利。
1工作原理
語音信號一般被看作一種短時平穩的隨機信號,主要是對他進行時域、頻域和倒譜域上的信號分析。語音信號的時域分析是對信號從統計的意義上進行分析,得到短時平均能量、過零率、自相關函數以及幅差函數等信號參數。根據語音理論,氣流激勵聲道產生語音,語音信號是氣流與聲道的卷積,因此可以對信號進行同態分析,將信號轉換到倒譜域,從而把聲道和激勵氣流資訊分離,獲得信號的倒譜參數。
線性預測編碼分析是現代語音信號處理技術中最核心的技術之一,他基於全極點模型,其中心思想是利用若干過去的語音抽樣來逼近當前的語音抽樣,採用最小均方誤差逼近的方法來估計模型的參數。向量量化是一種最基本也是極其重要的信號壓縮演算法,充分利用向量中各分量間隱含的各種內在關係,比標量量化性能優越,在語音編碼、語音識別等方向的研究中扮演著重要角色。
語音識別通常是指利用電腦識別語音信號所表示的內容,其目的是準確地理解語音所蘊含的含義。語音識別的研究緊密跟蹤識別領域的最新研究成果並基本與之保持同步。
語音信號分析,首先需要將語音信號採集到電腦並做預先處理,然後通過選擇即時或延遲的方式,實現上述各種類型的參數分析,並將分析結果以圖形的方式輸出或保存,從而實現整個平臺的功能。
2系統構成
語音分析平臺由軟、硬體2部分組成,硬體部分的任務是通過麥克風和音效卡將語音信號轉換為電信號,經過A/D轉換,以數位信號的形式傳入電腦,同時具備能將語音波形檔通過音效卡外接耳機或音箱重播。系統框圖如圖1所示。
2.1硬體部分
硬體包括3個部分:拾音及信號調理電路,A/D轉換電路,PC機介面電路。由於音效卡已經成為電腦的標準配置(集成或插卡形式),故採用音效卡、話筒的組合實現這部分功能,不但使用簡便而且省去大量硬體設計工作。
2.2軟體部分
LabVIEW是美國NI公司推出的一種通用虛擬儀器開發軟體,他包含豐富的功能函數庫和完備的匯流排設備驅動程式。LabVIEW的一大特色是其基於圖形的編程方式是採用資料流程(dat astream)而非傳統的文本方式的編程方法。這種編程方式強調信號處理的實際過程,有利於簡化編程,縮短開發時間和降低開發難度。
LabVIEW的編程包括前面板設計和後臺設計。前面板對應一台儀器的面板,實現對儀錶的控制和信號的表達功能。LabVIEW提供了一套豐富的控制範本庫,用戶通過這些範本來設計面板的內容。後臺對應一台儀器的內部工作部分,用於實現儀錶對信號的採集處理等操作。對應的LabVIEW提供了一套功能範本庫,用來幫助用戶實現程式改造、儀器控制資料分析等功能。主要的功能模組如下:
採集與預處理完成語音信號的採集,然後對信號進行消噪處理。
時域處理主要包括短時分析與預處理、短時能量、短時平均幅度和短時平均過零率、語音端點檢測、短時自相關函數、短時平均幅度差函數和基音週期估計等。
頻域處理主要包括基於短時傅裏葉分析與重構、複倒譜和倒譜分析、聯合時頻分析。預測與量化主要包括語音信號預測編碼分析和向量量化。
語音識別主要包括特徵表示與提取、譜失真測度、範本匹配技術、隱馬爾可夫模型技術、孤立詞及連接詞識別、大辭彙量連續語音識別和說話人識別。
與Matlab軟體介面通過LabVIEW提供的Script Node子VI連接主流演算法仿真分析軟體Matlab,充分發揮後者強大的資料處理能力。儘管LabVIEW中提供了一些資訊處理功能函數,但是畢竟功能有限,仍無法滿足用戶各種各樣的數值計算和分析的需求。而Matlab特別擅長數值分析和處理,如果能夠在LabVIEW中調用他的話,不失為一種較好的解決方法。
軟體在實現過程中,充分利用LabVIEW軟體本身所提供的豐富的應用分析工具包如數字濾波器、頻域分析等工具模組,避免大量的軟硬體開發工作。
3結語
通過上述方法構建的語音分析平臺,介面豐富友好,操作使用方便,並且能不斷隨著虛擬儀器技術和電腦軟硬體技術的進步而升級。特別重要的是用戶可以在該平臺上開發驗證新的語音信號分析處理演算法。