1 / 19

Frekvencijska svojstva ljudskog uha

Frekvencijska svojstva ljudskog uha. Nina Marević & Branimir Dropulj ić. Kako čujemo?.

Download Presentation

Frekvencijska svojstva ljudskog uha

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Frekvencijska svojstva ljudskog uha Nina Marević & Branimir Dropuljić

  2. Kako čujemo? • Nakon što su podražene osjetne slušne stanice dolazi do pretvaranja mehaničke energije zvuka u električni impuls koji se provodi putem slušnog živca i slušnog puta do moždane kore gdje nastaje svjesna percepcija zvuka.

  3. Kako napraviti aproksimaciju ljudskog sluha na računalu? • Zvuk kojeg ljudsko uho čuje se kreće od 20-tak Hz do 20kHz. • Frekvencije ispod 20 ili iznad 20 kHz ne primjećujemo u prirodi i nije ih potrebno propuštati u programskom modelu. • Karakteristično je za ljudsko uho da ne čuje sve frekvencije jednako. • Selektivnost na najnižim je frekvencijama oko 100 Hz, ali na onim višim iznosi i više od 4 kHz

  4. Kako napraviti aproksimaciju ljudskog sluha na računalu? • IDEJA: raspon frekvencija koje čovjek čuje razdijeliti u 30-ak pojaseva preko 30-ak filtara • Samo tu frekvencijsku skalu nećemo podijeliti linearno - nego prema mel-skali, jer ona više odgovara prirodnim karakteristikama ljudskog uha. • Veza mel skale s frekvencijskomse definira kao: Mel= 1127.01048 loge(1+f/700)

  5. Kako smo osmislili sklop? Algoritam: • projektiranje filtara • logatiram anvelope energija svakog kanala • primjena brzog kepstra na svaki uzorak zasebno • decimiranje signala

  6. Kako smo pisali kod? • prvi korak je projektiranje filtara • u mel skali svi su filtri jednaki • u frekvencijskoj skali vidimo da suselektivinijiza niže frekvencije, a manje selektivni za više • baš takva je i karakteristika ljudskog uha

  7. Filtri • Svaki pojedini filtar konvoluiramo s istim Blackmannovim otvorom - da bi dobili glađi impulsni odziv jednake duljine za svaki filtar • Također ćemo y-os prikazati i u logaritamskom mjerilu

  8. Filtri • U idealnom slučaju kad zbrojimo sve filtre po y-osi bi trebali dobiti svepropusni filtar iznosa jednakog koeficijentu preklapanja filtara. • Ali prvi i zadnji filtar imaju centre na samim rubovima, oni i nekoliko njima najbližih trokutastih filtara s kojima se preklapaju, nemaju potpun obllik trokuta, nego su “prekinuti” • Zato se javljaju propadi napočetku i na kraju prikaza odstupanja.

  9. Impulsni odzivi • Svi impulsni odzivi flitara zbrojeni bi trebali davati jedinični impulsni odziv, odnosno dirach u nuli. • Desna slika prikazuje koliko smo pogriješili, tj. razliku Diracha i onoga što smo mi dobili.

  10. Impulsni odzivi • Prvi filtar ima najširi i najniži impulsni odziv, te kao takav propušta niže frekvencije. • Zadnji filtar ima najuži i najviši impulsni odziv, te kao takav propušta više frekvencije.

  11. Signal kojeg smo obrađivali • izgovor 6 samoglasnika "a", "e", "i", "o", "u", "з“ • Frekvencija otipkavanja je 44 kHz

  12. Izlaz pojedinih filtara

  13. Izlaz sklopa • kada pozbrojimo izlaze svih kanala - dobijemo opet izgovor gotovoidentičan ulaznom signalu • ulazni signal zamislitikao onošto nam neko kaže,a sumu, tj.izlazni signal -kao ono što naše uho čuje • preslušavajući sumu izlaza kanala primjećujemo da je razumljivost zadovoljavajuća

  14. Izlaz sklopa • Za prikaz najpogodnija anvelopa od logaritma energije. • Signal se prvo kvadrira ikroz filtar (impulsni odzivveličine 1000 uzoraka, gladak) • Nakon konvolucije, signal se logaritmira,i množi s 10 • Cilj je dodatno naglasiti niže frekvencijske komponente

  15. Prikaz rezultata • Spektrogram - prikaz promjene frekvencijskih karakteristika signala u vremenu. • Visina (boja) je treća dimenzija spektrograma-koja prikazuje kolko je jako izražena pojedina frekvencija za pojedini uzorak. • smetnja gradske mreže • niže frekvencije bolje pokrivene

  16. Dotjerivanje rezultata • promatramo jedan uzorak kakvim ga vide svaki od 31-og kanala • krivulja je izlomljena • to nam ne odgovara – uzrokuje grube prelaze u spektrogramu u smjeru y- osi. • glađenje primjenom kepstara

  17. razlika log-en-spektara prije i nakon zaglađivanja – možemo uočiti da tamo gdje su bile najveće promjene, skokovi, na razlici slika su maksimumi • to znači da je zaglađivanje bilo uspješno

  18. Nulti kepstar predstavlja DC-komponentu spektra, odnosno srednju vrijednost (energiju uzorka signala) • energije u trenutcima izgovora su znatno veće od energija u trenutcima tišine, stoga nam nulti kepstar može dobro poslužiti za detekciju govora • vrši se decimacija izlaznih signala po vremenu, (faktor decimacije takav da na kraju nemamo više od 10000 uzoraka)

  19. Hvala na pažnji !!!

More Related