久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 電源與新能源 > 設計應用 > 基于聲紋識別的通用語音控制系統設計

基于聲紋識別的通用語音控制系統設計

作者: 時間:2016-12-05 來源:網絡 收藏
Chapter 1.引言

1.1.背景

本文引用地址:http://cqxgywz.com/article/201612/326317.htm

隨著物聯網的發展,對家庭電器的控制將會有更多的發展,而語音作為一種自然簡單的方法將是一種有效便捷的控制方式。聲音不僅可以傳達指令,還能與聲紋識別的安全系統結合,如果可以把語音控制與安全控制結合起來,系統就變得更自然直接更人性化了。

在本設計就是希望通過設計出一個通用的系統為將來的這些應用實現基本的框架。

1.2.編寫目的

進入21世紀以來,隨著科學技術的突飛進展,語音識別與確認技術也逐漸的走向成熟,基于語音識別技術的對話控制系統受到了越來越多的關注。直接用聲音來發出控制指令,讓機器能“聽懂”你的話,執行相應的命令。本設計目的在于能夠實現一個比較通用的語音控制系統,為了能更好地示例,在本文的設計中選擇使用數字0-9(中文發音)十個控制語音來控制Linux系統下的ls等5個命令,通過說出命令對應的數字來選擇相應命令操作,從而達到執行命令程序的目的。語音識別識別系統可以使人機交互更為方便,更加智能。

1.3.定義

GVCS: General Voice Control System,即通用語音控制系統。

SI: Speaker-Independent,與說話者無關的語音識別技術;

SD: Speaker-Dependent, 與說話者有關的語音識別技術;

SV: Speaker Verification, 語音確認;

2.1.項目目標

符合SMART原則

Specific明確的陳述:整個通用語音管理系統的實現。

Measurable可以衡量的結果:通用語音控制系統對機器的控制結果。

Attainable可以達成的目標:對機器設備控制的智能化。

Relevant任務相關性:只完成語音控制所需要的實現

Time-based時限性:在規定的時間內成項目計劃

遵循質量控制管理

項目將嚴格進行質量管理控制,對每一個步驟都建立相對完善的文檔,嚴格按照流程進行,完成系統功能的同時提高系統性能,增強系統的可維護性。

2.2.產品目標與范圍

本項目主要是為了實現對機器設備控制的智能化,從而選擇使用Digilent Cerebot™ 32MX4開發板設計一套通用語音控制系統,該系統主要應用在家庭電器設備和工業控制等領域。

Chapter 3.可行性分析

3.1.實用可行性

本設計的主要目的是能建立一個通用的語音控制系統,只要對系統進行相關的配置和擴展之后就能夠應用到各種應用中。通過這一個系統可以實現對電器、軟件等的語音控制。

這一系統的應用可以使對機器的操作方便高效,,同時也可以完善用的操作體驗。

3.2.技術可行性

在這個系統中需要實現的有:控制語音的采集、控制語音的識別、將識別后的控制語音轉換成控制指令、將控制指令轉換成相應機器可以識別的指令,需要的硬件有:

控制語音的采集:直接用模數轉換器收集模擬的語音,用編程的方法把數字語音轉換成合適的格式。

控制語音的識別:用編程的方法將采集到的語音與控制語音庫的數據進行匹配,得到匹配結果。

將識別后的控制語音轉換成控制指令:把匹配的結果映射成相應的控制指令輸出。

將控制指令轉換成相應應用可以識別的控制指令:為了使系統有更好的通用性,需要根據實際的應用把輸出的控制指令轉換成相應應用可識別的控制指令,從而實現控制機器。這些實現可以直接用編程的方法實現

3.3.經濟可行性

本系統采用高度可定制的思想實現。系統可以根據需要,自行對各個功能實現進行選擇或替換,通過這種實現方案可以定制出能達到最好的經濟效益的組合。如替換更合適的語音采集方法、語音識別方法,定制語音與控制指令的映射關系等。

本系統的性能主要由硬件處理速度、控制語音庫的大小和語音匹配算法決定。在實際中可以根據需要選擇硬件和語音庫,同時也可以不斷改進算法。

Chapter 4.需求分析

4.1.系統應該實現以下功能:

把說出的控制語音轉換成相應的控制操作。

能夠配置語音與指令的對應關系。

可以根據需要替換相關功能實現。

在無法識別控制語音時不執行操作并給出提示。

4.2.通用語音控制系統模型

4.3.用中文數字聲音執行Linux命令

控制語音采集:

使用模數轉換芯片,將模擬的語音轉換成數字語音數據。

編碼轉換:

將采集到的語音加工成可以進行語音識別的格式,這種格式應該文件較小、利于語音識別。

控制語音識別:

通過搜索比較,得到識別結果,并把識別結果映射到定義的識別碼(用整數表示),識別碼包括無法識別項。

應用可識別的指令轉換:

把識別碼轉換成執行指令,在這里就是相應的Linux指令。

執行操作:

直接調用指令,執行選定指令。

4.4.硬件需求

1、Digilent Cerebot 32MX4開發板

2、PmodNIC——網絡接口控制器

3、PmodMIC——麥克風/數字接口

4.5.項目開發環境

軟件環境:

在Linux操作系統;MPLAB IDE

硬件環境:

PC機;Digilent Cerebot 32MX4開發板; PmodNIC——網絡接口控制器;PmodMIC——麥克風/數字接口



評論


技術專區

關閉