Download
slide1 n.
Skip this Video
Loading SlideShow in 5 Seconds..
自然語言處理與應用 期中報告 PowerPoint Presentation
Download Presentation
自然語言處理與應用 期中報告

自然語言處理與應用 期中報告

288 Views Download Presentation
Download Presentation

自然語言處理與應用 期中報告

- - - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

  1. 自然語言處理與應用期中報告 授課老師:顏國郎 教授 學生:陳雅琪 MA0G0219 鄭冠瑀 MA0G0225

  2. Entropy的公式 ㄧ般計算公式: 子音+母音的計算公式:

  3. 簡介 • 計算注音的Entropy。 • 假設注音是子音接母音的型式。 • 子音接母音的型式為408種。

  4. 計算注音符號 • 注音符號 : 總共有37個 ◎子音:ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒ ㄓㄔㄕㄖㄗㄘㄙ (有21個) ◎母音:ㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄥㄦ一ㄨ ㄩ (有16個) ◎雙母音:一ㄢ、一ㄥ、ㄨㄚ、ㄨㄛ、ㄨㄥ ㄚㄛㄜ……(有38個)

  5. 計算注音符號Entropy(1/2) • 計算機率 1.個別出現次數/總出現次數=個別機率 2.機率P=1/37 • Entropy計算結果

  6. 計算注音符號Entropy(2/2)

  7. 計算已知注音是子音接母音型式的Entropy(1/4) • 二個音的所構成的注音符號Entropy 1.假設每個音出現機率為古典機率 2.不考慮雙母音(子音+母音) 3.使用 ㄦㄢㄞㄚㄗㄓㄧㄣㄛㄘㄔㄨㄤ ㄠㄜㄙㄕㄩㄡ 共19個為母音 4.2479bits

  8. 計算已知注音是子音接母音型式的Entropy(2/4)

  9. 計算已知注音是子音接母音型式的Entropy(3/4) • 二個音的所構成的注音符號Entropy 1.假設每個音出現機率為古典機率 2.考慮雙母音 = =7.4963

  10. 計算已知注音是子音接母音型式的Entropy(4/4)

  11. 計算注音是子音接母音型式只有408種的Entropy(1/3)計算注音是子音接母音型式只有408種的Entropy(1/3) • 子音接母音的組合數有x=408個 • 和Phone.txt比對的機率=P(x) 7.694bits

  12. 計算注音是子音接母音型式只有408種的Entropy(2/3)計算注音是子音接母音型式只有408種的Entropy(2/3) 子音

  13. 計算注音是子音接母音型式只有408種的Entropy(3/3)計算注音是子音接母音型式只有408種的Entropy(3/3)