數(shù)字音頻處理是數(shù)字媒體技術(shù)專業(yè)的專業(yè)核心課程,音頻的編輯和處理是數(shù)字媒體中不可缺少的一環(huán),對(duì)于學(xué)習(xí)者后期的游戲制作、媒體編輯等有非常重要的作用。數(shù)字媒體技術(shù)專業(yè)蓬勃發(fā)展,但是相關(guān)的教材卻很少,不適合數(shù)字媒體技術(shù)專業(yè)理論與實(shí)踐結(jié)合的方向和培養(yǎng)原則,因此編寫了這一本教材。數(shù)字音頻處理主要講授的內(nèi)容是聲音的特性、音頻處理的過
這是第一本系統(tǒng)性地介紹聲紋識(shí)別、聲紋分割聚類及聲紋在語音識(shí)別、語音合成、人聲分離等領(lǐng)域中應(yīng)用的技術(shù)書。本書內(nèi)容全面且緊隨時(shí)代前沿,不僅涵蓋了早至20世紀(jì)60年代的經(jīng)典方法,而且以大量篇幅著重介紹了深度學(xué)習(xí)時(shí)代的最新技術(shù)。本書注重理論與實(shí)踐的結(jié)合,除了配備大量實(shí)踐案例與習(xí)題,還有專門章節(jié)介紹聲紋技術(shù)在實(shí)際工程部署方面的諸
聲音可以從兩個(gè)角度來定義。首先是從物理學(xué)的角度來定義,聲音是空氣質(zhì)點(diǎn)振動(dòng)狀態(tài)由近及遠(yuǎn)的傳播,聲音即聲波;其二是從心理學(xué)的角度來定義,聲音是聲波在聽覺上產(chǎn)生的主觀感覺。如果是從物理學(xué)的角度來了解聲音的基本性質(zhì),那么聲音就是聲波,可以用聲壓這一物理量來描述;如果要對(duì)揚(yáng)聲器重放的聲音進(jìn)行主觀音質(zhì)評(píng)價(jià),則聲音與人耳的聽覺特性密
本書分為三篇:基礎(chǔ)理論與實(shí)踐篇、操作應(yīng)用與技能篇和數(shù)字音響技術(shù)篇,書中主要介紹音響技術(shù)的基本原理、各種音響設(shè)備的基本功能及工作原理與基本操作方法,具體介紹了音響系統(tǒng)的連接調(diào)整方法與使用技巧,重點(diǎn)介紹了調(diào)音臺(tái)與周邊設(shè)備以及功放音箱的使用調(diào)整方法和故障的檢測(cè)判斷方法。同時(shí),本書對(duì)于數(shù)字聲頻技術(shù)、數(shù)字調(diào)音臺(tái)、數(shù)字音頻信號(hào)的網(wǎng)
我們的日常離不開說話,一個(gè)人的聲音不僅僅傳遞表達(dá)的情感,聲音也可以創(chuàng)造價(jià)值。本書分享了作者從會(huì)計(jì)工作轉(zhuǎn)行聲音領(lǐng)域創(chuàng)業(yè)的經(jīng)歷,從知識(shí)付費(fèi)入手拆解聲音付費(fèi)市場的剛需,解讀不同聲音形象的賣點(diǎn)與練聲技巧,從而可以自己制作聲音付費(fèi)產(chǎn)品,幫助讀者找到適合自己的聲音變現(xiàn)之路。本書以30個(gè)要點(diǎn)的形式解讀了打造聲音付費(fèi)產(chǎn)品的場景、過程、
Kaldi是目前語音識(shí)別領(lǐng)域,廣受歡迎并流行的開源工具包。Kaldi設(shè)計(jì)之初對(duì)通用性,可拓展性等一系列源代碼層次的考量,大大降低了Kaldi作為語音識(shí)別工具包的門檻,同時(shí)擁有非常完整的語音識(shí)別系統(tǒng)訓(xùn)練腳本。本書通過對(duì)Kaldi已有訓(xùn)練腳本的梳理和引導(dǎo),幫助讀者快速搭建可用的語音識(shí)別系統(tǒng)。
本書以國際大型體育賽事為背景,系統(tǒng)介紹了賽事轉(zhuǎn)播組織架構(gòu)和具體技術(shù)實(shí)施方案。在第一章和第二章中主要介紹了國際信號(hào)的定義、團(tuán)隊(duì)工作流程和信號(hào)采集方法;第三章和第四章介紹了國際信號(hào)中重要的評(píng)論聲制作方式和轉(zhuǎn)播團(tuán)隊(duì)使用的內(nèi)部通訊系統(tǒng);第五章、第六章和第七章詳細(xì)介紹了各種體育比賽轉(zhuǎn)播的音頻制作方法。本書具有理論指導(dǎo)實(shí)踐的特點(diǎn),
聽覺信息處理技術(shù)的創(chuàng)新能夠推動(dòng)實(shí)現(xiàn)高度智能化機(jī)器感知系統(tǒng)的發(fā)展,本分冊(cè)主要介紹了國內(nèi)外聽覺信息處理方面的研究現(xiàn)狀和階段性成果,通過對(duì)人類言語產(chǎn)生與聽覺機(jī)理,聽覺機(jī)理的計(jì)算理論與方法,語音信號(hào)處理,語音識(shí)別聲學(xué)建模,特殊場景語音識(shí)別,聲紋與語種識(shí)別,韻律、情緒及音樂分析,統(tǒng)計(jì)語音合成,口語對(duì)話系統(tǒng)等技術(shù)研究成果的闡述與分
《語音信號(hào)識(shí)別技術(shù)與實(shí)踐》內(nèi)容分為8章。第1章為語音識(shí)別技術(shù)概述,介紹了語音識(shí)別技術(shù)的原理和發(fā)展與應(yīng)用。第2章為語音信號(hào)處理基本技術(shù),包括數(shù)字化預(yù)處理、短時(shí)時(shí)域處理和頻域處理的內(nèi)容。第3章是語音信號(hào)的端點(diǎn)檢測(cè)和分割,介紹了端點(diǎn)檢測(cè)的原理和常規(guī)檢測(cè)方法,提出了基于復(fù)雜背景條件下的端點(diǎn)檢測(cè)算法,包括算法流程和實(shí)驗(yàn)方法。第4
語音情感識(shí)別(SpeechEmotionRecognition,SER)是情感計(jì)算、模式識(shí)別、信號(hào)處理和人機(jī)交互領(lǐng)域的熱門研究話題,SER的研究涉及特征提取、特征優(yōu)選、分類器改進(jìn)、特征融合等多種技術(shù)。語音情感識(shí)別是在同一數(shù)據(jù)庫中進(jìn)行的識(shí)別研究,主要應(yīng)用于自然的人機(jī)交互領(lǐng)域,目前大部分的人機(jī)交互方式都依賴于觸覺,如觸屏、