raspoznavanje govornika u zvu nom zapisu
Download
Skip this Video
Download Presentation
Raspoznavanje govornika u zvučnom zapisu

Loading in 2 Seconds...

play fullscreen
1 / 19

Raspoznavanje govornika u zvučnom zapisu - PowerPoint PPT Presentation


  • 206 Views
  • Uploaded on

Raspoznavanje govornika u zvučnom zapisu. Matija Hajduk Vedran Jerbić Stjepan Stjepčević Mara Živčić. Zagreb, Lipanj 2006. Uvod. Cilj projekta: Identifikacija govornika na temelju usporedbe sa postojećom bazom podataka. Zagreb, Lipanj 2006. Opis problema.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Raspoznavanje govornika u zvučnom zapisu' - eydie


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
raspoznavanje govornika u zvu nom zapisu

Raspoznavanje govornika u zvučnom zapisu

Matija Hajduk

Vedran Jerbić

Stjepan Stjepčević

Mara Živčić

Zagreb, Lipanj 2006.

slide2
Uvod
  • Cilj projekta:
    • Identifikacija govornika na temelju usporedbe sa postojećom bazom podataka

Zagreb, Lipanj 2006

opis problema
Opis problema
  • Projektirati sustav koji će na temelju snimljenog govora i usporedbom sa postojećom bazom podataka identificirati osobu ili utvrditi da njene govorne karakteristike nisu pohranjene u bazi podataka

Zagreb, Lipanj 2006

opis rje enja problema
Opis rješenja problema
  • Metoda rješavanja problema:
    • Kepstralna analiza
    • Vektorska kvantizacija
    • Izrada baze podataka
    • Identifikacija pomoću baze podataka

Zagreb, Lipanj 2006

kepstralna analiza
Kepstralna analiza

Što je to KEPSTAR?!?!?

Rebus od

SPEKTAR

Zagreb, Lipanj 2006

kepstralna analiza1
Kepstralna analiza
  • Inverzna Fourierova transformacija provede se nad logaritmom apsolutne vrijednosti Fourierove transformacije odsječka

Zagreb, Lipanj 2006

kepstralna analiza2
Kepstralna analiza
  • Podijeliti signal na uzorke od 25 ms
  • Za svaki uzorak napraviti kepstar i kreirati vektor od prvih 12 članova
  • Dobije se niz kepstralnih vektora koji predstavlja govorne karakteristike osobe

Zagreb, Lipanj 2006

vektorska kvantizacija
Vektorska kvantizacija
  • Za niz takvih vektora treba naći N tipičnih, koji najbolje reprezentiraju cijeli skup vektora
  • Koristi se generalizirani Lloyd-Maxov kvantizator

Zagreb, Lipanj 2006

postupak kvantizacije
Postupak kvantizacije
  • Način rada skalarnog (1-D) kvantizatora
  • Naći algoritam koji određuje razine kvantizacije takve da minimiziraju srednju kvadratnu pogrešku

Zagreb, Lipanj 2006

postupak kvantizacije1
Postupak kvantizacije
  • Odabere se proizvoljan skup N razina a1 < a2 < ... < aN
  • Za 1 ≤ j ≤ N odrede se bj= 0.5(aj+1 + aj)
  • Za 1 ≤ j ≤ N odrede se ajkao uvjetne srednje vrijednosti U, pri čemu je U (bj-1, bj] (uz b0 = -∞, a bN = ∞)
  • Koraci se ponavljaju dok srednja kvadratna pogreška ne postane zanemarivo malena

Zagreb, Lipanj 2006

postupak kvantizacije2
Postupak kvantizacije
  • Pokazalo se da se nakon određenog broja ponavljanja pogreška se gotovo više ne smanjuje

Zagreb, Lipanj 2006

postupak kvantizacije3
Postupak kvantizacije
  • Ovaj postupak treba generalizirati na 12 dimenzija
  • Kod skalarnog kvantizatora kao mjera distorzije koristi se kvadratna udaljenost
  • Analogno tome kod 12-dimenzionalnog kvantizatora koristimo euklidsku udaljenost

Zagreb, Lipanj 2006

izrada baze podataka
Izrada baze podataka
  • Za svaku osobu dobivenih N karakterističnih vektora pohranimo u bazu podataka
  • Tako dobivenu bazu koristimo u postupku identifikacije osoba

Zagreb, Lipanj 2006

postupak identifikacije
Postupak identifikacije
  • Nađemo niz kepstralnih vektora nepoznatog govornika
  • Taj niz vektora pokušamo kvantizirati sa svakim od projektiranih kvantizatora
  • Može se očekivati da onaj koji daje najmanju prosječnu kvadratnu pogrešku kvantizacije odgovara nepoznatom govorniku

Zagreb, Lipanj 2006

eksperimentalni rezultati
Eksperimentalni rezultati
  • Kao granična srednja kvadratna pogreška uspješne identifikacije govornika ispitivanjem je dobiveno MSEgr = 0.1

Zagreb, Lipanj 2006

zaklju ak
Zaključak
  • Za postizanje dovoljno malene srednje kvadratne pogreške kvantizacije bilo je dovoljno 100 reprezentativnih vektora dobivenih Lloyd-Maxovim algoritmom u 40-ak iteracija
  • Za bolji rad cijelog sustava potrebna je što veća duljina zvučnog zapisa kako bi dobivenih 100 tipičnih vektora što bolje predstavljalo govorne karakteristike nekog govornika

Zagreb, Lipanj 2006

literatura
Literatura
  • Linde, J., Buzo, A., Gray, R. M.: An Algorithm for Vector Quantizer Design, IEEE Transactions on Communications, Vol. Com-28, No. 1, January 1980
  • Campbell, J. P. Jr.: Speaker Recognition: A Tutorial, Proceedings of the IEEE, Vol. 85, No. 9, September 1997
  • MIT, Fall 2002: Introduction to Digital Communication, Lecture 6: Quantization
  • Damir Seršić: Predavanje 14 SPUS: Skalarna kvantizacija signala

Zagreb, Lipanj 2006

slide18
Pitanja ????

Zagreb, Lipanj 2006

slide19
Hvala na pažnji!!!!

Zagreb, Lipanj 2006

ad