420 likes | 726 Views
第 8 章 語音傳遞系統之設計. 語言之類型. 基本單位是音素 (phoneme) 。 一種語言內功能類似的單音或一群同一類的發音,即語言中最短的分節。 音素可組成音節 (syllables) ,再形成字或詞 (words) ,又構成句。. 語音的描述. 語言之強度. 母音比子音大 男性比女性語音強度高約 3~5dB 輕聲交談約 45dB. 語言之頻率組成. 語音評鑑之效標. 主要是能解度 其次是語音品質. 語言之能解度. 係指語音訊息可以被正確辨別與認識的程度。 句子能解度最高,孤立字次之,無意義音節最差。 能解度非常仰賴語脈與預期。. 語音品質.
E N D
語言之類型 • 基本單位是音素(phoneme) 。一種語言內功能類似的單音或一群同一類的發音,即語言中最短的分節。 • 音素可組成音節(syllables) ,再形成字或詞(words) ,又構成句。
語言之強度 • 母音比子音大 • 男性比女性語音強度高約3~5dB • 輕聲交談約45dB
語音評鑑之效標 • 主要是能解度 • 其次是語音品質
語言之能解度 • 係指語音訊息可以被正確辨別與認識的程度。 • 句子能解度最高,孤立字次之,無意義音節最差。 • 能解度非常仰賴語脈與預期。
語音品質 • 語音品質可藉偏好來界定,通常將語音樣本呈現在受測系統上,要求受測者評定其品質,指出何者為佳。這方法也常用以評鑑合成語音之優劣。
語音傳遞系統之組件 • 語音傳遞系統由發話者、訊息、傳送系統、噪音環境、受話者所構成。
發話者 • 優秀的說話者的發音(英語)具有如下特色 • 音節持續時間長 • 語音強度大 • 用於說話的總時間較長,較少停頓。 • 較以基本聲音頻率之不同來變化其語音
訊息 • 音素混淆:某些語音之間比較容易相互混淆。 DVPBGCET; FXSH; KJA; MN • 字詞特性:長字詞較短字詞能解度大。
訊息設計原則 • 字彙盡可能維持小範圍內 • 使用標準結的語句 • 避免使用單字或單詞,應使用疊字或複詞 • 使收訊者熟悉所使用的字詞和語句結構 • 避免使用易造成混淆的字詞 • 以完整的語句型式呈現
傳送系統 • 過濾對語音的影響
噪音環境 • 發音清晰指數(AI) • 優選八度音階波帶語音干擾標準(PSIL) • 優選噪音規準曲線(PNC) • 混響(reverberation)
受話者 • 具備正常聽力 • 熟悉所接收的訊息的類型 • 經得起作業環境的壓力 • 具有在相互衝突的數項刺激中集中注意於其中之一的能力
合成語音 • 是否已適合人們使用 • 影響人員績效與偏好的語音合成系統的向度是什麼 • 如何改進這些系統
語音合成系統之類型 • 分析合成法 • 使用電子模型模擬人類的發音機制產生語音 • 發出語音彆扭不自然 • 規則合成法 • 系統儲存基本語音片段與規則套組 • 品質無法達到分析合成系統的水準
合成語音的使用績效 • 合成語音的能解度 • Waterworth(1984) 最好的能解度與自然語音一樣好 • Simpson(1985) 優良系統能解度可有99~100% • 曝露於某系統聲音一段時間,理解率便會有顯著增加
合成語音的使用績效 • 合成語音的記憶性 • 研究發現,人們對合成與語音表達的訊息比自然語音表達者更難以記憶 • 在字串呈現時將字串間距從1秒增至5秒,回憶量幾乎加倍
對合成語音之偏好 人們是否真正需要無生命之物體跟他說話?
對同一系統的偏好度和品質評分,也非常主觀而因人而異。對同一系統的偏好度和品質評分,也非常主觀而因人而異。 • 許多飛行員並不喜歡聽起來頗為自然的合成語音。
合成語音的應用準則 • 語音警報的呈現所使用的聲音,必須在定性上與在該情境所將聽到的其它聲音不同。 • 若合成語音只限於傳遞警告之用,則在發出語音通報之前不宜有提請注意的信號音。 • 若合成語音在警報之外用以呈現其他資訊時,則必須有某種提請注意該語音警報的設計。 • 盡量設法增加訊息的能解度。 • 如為一般目的使用時,應使何成語音儘可能接近自然語音,以提高使用者的接受度。
宜有重播裝置以供需要時使用。 • 如果提供有選用拼音裝置,其品質必須優於該系統所使用的內部拼音裝置。 • 要有切斷裝置,尤其對壹位熟練者而言相當重要,不必每次使用該系統都需聽完整段訊息。 • 提供使用者一段導入性或訓練性之訊息,使其熟悉系統聲音。 • 不要染上高科技熱,應謹慎使用合成語音,僅在使用者覺得安適並能接受的場合才應用。
` • 語音傳遞於未來仍將是資訊顯示的主要型式。 • 人因工程專家必須瞭解語音知覺和傳遞系統各向度對語音能解度之效應的基本知識。