prelucrarea audio digitala l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
PRELUCRAREA AUDIO DIGITALA PowerPoint Presentation
Download Presentation
PRELUCRAREA AUDIO DIGITALA

Loading in 2 Seconds...

play fullscreen
1 / 53

PRELUCRAREA AUDIO DIGITALA - PowerPoint PPT Presentation


  • 377 Views
  • Uploaded on

PRELUCRAREA AUDIO DIGITALA. Cuprins MIDI Standardul MIDI Crearea, editarea si interpretarea fisierelor MIDI Acustica muzicala si notatii Caracteristici ale secventiatoarelor si claviaturilor MIDI Tipuri si formate de mesaje MIDI  Transmisia mesajelor MIDI Sintetizarea sunetelor

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PRELUCRAREA AUDIO DIGITALA


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide2

Cuprins

MIDI

Standardul MIDI

Crearea, editarea si interpretarea fisierelor MIDI

Acustica muzicala si notatii

Caracteristici ale secventiatoarelor si claviaturilor MIDI

Tipuri si formate de mesaje MIDI 

Transmisia mesajelor MIDI

Sintetizarea sunetelor

PRELUCRAREA AUDIO DIGITALA

Medii de lucru audio digitale

Software pentru prelucrare audio

Tipuri de fisiere audio

Prelucrare dinamica

Restaurare audio

slide3

MIDI

Un fisier audio poate fi reprezentat:

-colectie de esantioane (cum s-a considerat pana in acest moment);

-MIDI („Musical Instrument Digital Interface”): memoreaza „evenimente de sunet” sau „realizari umane de sunet”. Se utilizeaza un limbaj scripting pentru specificarea de mesaje prin care se indica note, instrumente si durate. Fiecare mesaj descrie un „eveniment” (adica, schimbarea notei, a cheii, a tempo-ului, etc) ~ interpretareaunei piese muzicale.

Mesajele MIDI  genereaza sunetul corespunzator prin intermediul unui sintetizator (cauta fiecare sunet intr-o memorie de sunete sau creaza sunetul pe baza unui calcul matematic - in acest caz procesul se numeste sinteza FM) => fisierele MIDI < fisiere de esantioane!

Dezavantaj: sunetul poate sa fie artificial, mecanic (in timp ce un fisier de esantioane poate sa memoreze toate subtilitatile interpretului).

Avantaj: se poate utiliza un echipament cu clape MIDI conectat la calculator pentru interpretarea si inregistrarea unei piese muzicale, iar ulterior fisierul poate fi editat (modificarea instrumentului care interpreteaza, a notelor, a cheii). De asemenea, deoarece MIDI este un standard se pot transfera fisierele MIDI intre echipamente MIDI sau intre calculatoare.

slide4

Standardul MIDI

Primul protocol MIDI (1.0): stabilit in 1983 - colaborarea mai multor firme (Roland Corporation, Sequential Circuits, Oberheim Electronics, Yamaha, Korg, Kawai) => creata si o asociatie (MMA – MIDI Manufacturers Association).

O componenta importanta = GM-1 (General MIDI) standardizeaza asignarea instrumentelor muzicale la numerele de bucata („patch numbers”) pe masura ce sunt apelate.

1999: GM-2, revizuit in 2003s-a marit numarul de sunete.

In tabelul urmator se prezinta maparea instrumentelor la numerele de bucata (GM-2):

slide7

Crearea, editarea si interpretarea fisierelor MIDI

Dispozitivele hardware care genereaza mesaje MIDI se numesc controllere MIDI (keyboard pian electronic, saxofon, guitara).

Dispozitivele care interpreteaza mesajele MIDI generand sunete se numesc sintetizatoare MIDI. Unele dispozitive pot realiza ambele operatii (exemplu anumite keyboard-uri). De asemenea unele placi audio din calculatoare pot sintetiza fisiere MIDI.

Conectarea unui echipament MIDI la calculator:

-la calculatoarele mai vechi: conector special MIDI de 15 pini;

-actual prin USB => o conexiune MIDI standard = rata 31.25 kb/s.

Un secventiator MIDI= dispozitiv hardware (independent de calculator) sau aplicatie software care permite receptia, memorarea si editarea datelor MIDI. Exemple de secventiator MIDI software: Cakewalk Music Creator sau Cubase. Secventiatorul permite vizualizarea unui fisier MIDI in diferite forme:

-“staff view” afisand notatiile muzicale;

-„piano roll view” indicand apasarile clapelor pianului;

-lista de evenimente.

In figurile urmatoare sunt prezentate aceste vizualizari din aplicatia Cakewalk Music Creator:

slide9

Asemanatoare secvetiatoarelor, programele de notatie muzicala pot fi utilizate pentru crearea de muzica prin:

-introducerea de note una cate una;

-click cu mouse-ul pe clapele unui pian;

-folosind un editor de evenimente.

Programele de prelucrare audio de esantioane pot citi si fisiere MIDI si le pot converti intr-un format de esantioane (WAV sau PCM)  simplu !

Mult mai greu: transformarea unui fisier de esantioane in fisier MIDI !

slide10

Acustica muzicala si notatii

In notatia muzicala vestica sunetele muzicale se numesc tonuri sau tonalitati („tones”), caracterizate prin inaltime („pitch), timbru si tarie („loudness”). Prin adaugarea atac („onset”) si durata, un sunet muzical se numeste nota.

Pentru doua note caracterizate de frecventele g si h, aflate la n octave distanta exista relatia dintre frecventele corespunzatoare:

h = 2n g

Frecventa de 440 Hz este un punct de referinta si corespunde notei A. Octava dintre A si A –ul mai inalt este divizata in 12 note: A, A sharp, B, C, C sharp, D, D sharp, E, F, F sharp, G, si G sharp. Termenul octava provine de la faptul ca exista opt note intregi in acel domeniu. A sharp este echivalenta cu B flat, etc... Aranjarea notelor pe clapele unui pian:

slide11

Pentru a calcula diferenta de frecventa pentru doua note succesive, se considera f1 nota de baza si f2=2f1 nota aflata cu o octava mai sus, intre acestea gasindu-se 12 note succesive, la distanta de un multiplicator x:

2f1 = ((((((((((((f1x) x) x) x) x) x) x) x) x) x) x) x)=f1x12

2=x12

=> x = 1.05946309436

Astfel daca A are frecventa de 440 Hz, A# are frecventa de 440 × 1.05946309436 = 466.16 Hz, etc.

Notatia muzicala se scrie pe o partitura („musical staff”), care are la inceputul piesei o cheie („key signature”), indicand care note se interpreteaza „sharp” si care „flat”.

Timbrul unui sunet muzical desemneaza „culoarea tonului”, fiecare instrument interpretand diferit o anumita nota muzicala. Un instrument pe langa nota de baza (numita prima armonica) genereaza sunete cu frecventele multiplii notei de baza, numite armonici (armonica intai, armonica a doua, etc), care se combina cu nota de baza.

Perceptia sunetului este influentata de rezonanta, care amplifica anumite armonici si diminueaza altele, avand un efect asupra timbrului instrumentului.

slide12

La emiterea unei note muzicale se disting etapele formand anvelopa de amplitudine:

-atac („attack”) din momentul in care incepe emiterea sa pana cand atinge amplitudinea maxima;

-decadere („decay”) usoara scadere in amplitudine dupa atac;

-sustinere („sustain”) cat continua vibratia sunetului la o amplitudine mare;

-eliberare („release”)oprirea sunetului inainte de stingerea sa naturala.

slide13

Caracteristici ale secventiatoarelor si claviaturilor MIDI

In functie de cat sunt de sofisticate, controloarele si secventiatoarele MIDI dispun de o serie de caracteristici suplimentare:

-numarul de bucata („patch number”) specifica instrumentul care trebuie activat, in cadrul mesajelor MIDI fiind referit ca numar de program (uneori la selectarea unui instrument pe o claviatura MIDI acesta este referit ca voce);

-banca este o baza de date de numere de bucate;

-claviatura polifonica poate interpreta mai multe note simultan (maxim 32 de note);

-dispozitivul de iesire MIDI multitimbral poate interpreta simultan mai multe instrumente;

-claviatura sensibila la atingere („touch sensitive”) poate detecta viteza cu care este apasata o tasta, codifica aceasta intr-un mesaj MIDI si controleaza volumul sunetului;

-claviatura sensibila la forta cu care este tinuta apasata o tasta („aftertouch”), permitand efecte pentru trompeta si alamuri, cu variantele monofonic (aceeasi valoare pentru toate notele) sau polifonic (efect numai asupra unei note, celelalte ramanand neschimbate);

-pedala de sustinere poate intarzia eliberarea unei note;

slide14

-rotita de modificare a inaltimii notei („pitch bend wheel”) modifica inaltimea notei in timp ce este cantata, revenind la pozitia initiala dupa eliberare;

-metronom dispozitiv audio pentru temporizare (ticaie in timpul redarii piesei);

-software pentru transpozitie (schimbarea cheii), cuantizare temporala (mutarea notelor la intervale mai regulate), schimbarea de tempo si efecte DSP („flange”, „reverb”, „delay”, „echo”).

De facut distinctie intre doi termeni MIDI:

-canal („channel”) MIDI: o cale de comunicare de date intre doua dispozitive MIDI;

-pista („track”) MIDI: o zona de memorie in care se pastreaza datele MIDI, corespunzand unui interval de timp al secventiatorului unde pot fi vazute notele MIDI.

slide15

Tipuri si formate de mesaje MIDI

Un mesaj MIDI este un pachet de date care codifica un eveniment. Evenimentele MIDI descriu modul cum se interpreteaza o melodie. Clasificarea mesajelor:

1) Mesaje de canal: contin informatii relevante pentru canale, fiind de doua tipuri:

-mesaje de voce canal : indica momentul cand o nota incepe si cand se termina, cat de tare este apasata, cat de tare este tinuta apasata („aftertouch”), care instrument este activat, etc;

--mesaje de mod canal : indica dispozitivului MIDI care canal trebuie activat pentru preluarea datelor si cum se interpreteaza acestea.

2) Mesaje de sistem: contin informatii care nu sunt specifice vreunui canal particular (temporizare, sincronizare, setup).

slide17

Mesajele MIDI sunt transmise serial pe cuvinte de 10 biti, incep cu un bit 0 de start si se incheie cu un bit 1 de stop, informatia utila fiind pe 8 biti.

Fiecare mesaj contine un octet de stare si zero sau mai multi octeti de date. Octetul de stare are bitul MSB 1 si indica tipul de mesaj, octetul de date avand bitul MSB 0. Specificarile complete pentru mesajele MIDI sunt date pe site-ul MMA. In tabela urmatoare cateva exemple de mesaje:

slide18

Exemplu: mesaj pe 3 octeti: x91 x3C x64 semnifica activare nota pe canalul 1, nota 60 (x3C) cu o viteza de apasare 100 (x64).

slide19

Transmisia mesajelor MIDI

Transmisia mesajelor MIDI se face pe cuvinte de 10 biti la rata de 31.25 kb/s, ordinea bitilor in cadrul unui cuvant fiind LSB primul.

Este posibil ca pentru note simultane si diferite efecte (rotita de modificare a notei) sa fie generate multe mesaje, ceea ce conduce la intarzieri. In acest caz se poate utiliza „running status”, o tehnica pentru reducerea cantitatii de date MIDI, eliminand redundantele. O data ce s-a comunicat un octet de stare, acesta nu mai trebuie repetat cat timp se aplica la octetii de date. Exemplu: un acord de trei note pe un canal, se transmite mesajul „Note On” o singura data, urmat de note si de viteza (de lovire a clapei). Comparatie intre stream-urile in cele doua cazuri: fara „running status” si cu „running status”:

slide21

Sintetizarea sunetelor

Un dispozitiv care reda fisiere MIDI (de exemplu o placa de sunet sau o claviatura MIDI) poate sa utilizeze pentru sintetizarea sunetelor doua solutii:

-sintetizarea cu modulatie de frecventa (FM);

-sintetizarea cu tabela de unde („wavetable synthesis”).

Sintetizarea FM este realizata prin operatii matematice pe sunete, ca simple frecvente sinusoidale. Operatiile incep cu o frecventa purtatoare care este apoi modificata cu o frecventa de modulare. Exemplu: se aplica unei functii sinus o alta functie sinus. Ulterior se adauga alte functii pentru modularea sunetului in timp. Tehnica FM poate capta foarte bine timbrul instrumentelor reale si poate crea sunete noi care nu sunt proprii niciunui instrument. Metoda este utilizata in special de placile de sunet.

slide22

Sintetizarea cu tabela de unde se bazeaza pe stocarea esantioanelor de sunet ale instrumetelor reale, utilizand un dispozitiv de esantionare:

-tehnica mai costisitoare decat precedenta;

-poate stoca mult mai bine timbrul instrumentelor reale (mai buna fidelitate).

Micsorarea numarului de esantioane pentru fiecare instrument:se poate memora o nota produsa de un instrument, iar pentru obtinerea notelor urmatoare, nota poate fi deplasata (shiftata), dar nu cu prea mult, caci fiecare instrument pentru fiecare nota genereaza si o serie de tonuri suplimentare („overtones”) specifice, care nu se pot obtine prin calcule (se produce „aliasing”) => gama de note este impartita in regiuni („key splits”), fiind preluata o singura nota pentru fiecare regiune, iar celelalte note din regiune se obtin prin deplasare.

O alta solutie de reducere a cerintelor de memorie = reducerea dimensiunii esantionului, prin stocarea unui interval foarte scurt de timp, iar la redare esantionul este reluat in bucla pentru a obtine durata necesara. Se pot aplica suplimentar filtrari, de asemenea esantioanele pot fi comprimate => sintetizarea cu tabela de unde este larg adoptata.

slide23

PRELUCRAREA AUDIO DIGITALA

Medii de lucru audio digitale

Exista doua medii importante de lucru cu datele audio digitale:

-interpretare in direct la teatru, concert („live”);

-studio de inregistrari.

Echipamentul analogic utilizat anterior:

slide25

Elementul central: mixerul sau consola de mixare (primeste semnale de la microfoane si instrumente, ajusteaza amplitudinle acestora, egalizeaza componentele de frecventa si trimite iesirile la difuzoare). Fiecare intrare la mixer este un canal, existand chiar si 24 de canale sau mai multe.

O alta solutie este utilizarea unui mixer digital. Acesta contine convertor analog-digital (ADC), permitand ca prelucrarile ulterioare sa fie facute digital.

slide27

In continuare se presupune ca elementul central de prelucrare audio (DAW – „digital audio workstation”) este calculatorul personal, avand o placa de sunet cu urmatoarele functii:

-conectori de intrare pentru microfoane si surse audio externe;

-converteste sunetul din analogic in digital cu un ADC, in timp ce este inregistrat;

-conectori de iesire pentru difuzoare si casti;

-converteste sunetul din digital in analogic cu DAC, in timp ce este redat;

-sintetizeaza esantioane de sunet MIDI utilizand sinteza FM sau cu tabela de unde.

slide28

Exista doua tipuri de microfoane:

-microfon dinamic: utilizeaza o bobina de inductie atasata la o diafragma, plasata intr-un camp magnetic, astfel incat bobina se deplaseaza la variatiile de presiune. Aceste microfoane sunt robuste, ieftine, pentru inregistrari acasa. Nu necesita sursa externa de alimentare. Frecventa limita este de 16 kHz.

-microfon capacitiv: are o diafragma si o placuta de baza, care impreuna formeaza o capacitate. La schimbarea distantei dintre placile condensatorului datorita vibratiilor, capacitatea se modifica, la fel si tensiunea reprezentand sunetul. Microfonul este mult mai sensibil si mai usor. Necesita sursa externa de alimentare. Frecventa limita este de 20 kHz.

slide30

-conectori pentru comunicatii de date: Firewire (pentru conectarea audio, video si discuri) cu viteza de 400 Mb/s, fara solicitarea procesorului, in doua variante cu 4 pini si 6 pini si USB2 cu 480 Mb/s, dar cu solicitarea procesorului;

-conector S/PDIF (Sony Phillips Digital Interface) pentru conectarea unui recorder audio digital sau interfata externa de sunet, care transfera date audio digitizate;

-conector (stereo 1/8”) pentru microfon (analogic) la care pe placa de sunet exista un ADC;

-conectori TRS sau TR de 1/4” pentru echipamente profesionale (amplificatoare de microfon, casti, ghitara, difuzoare);

-conectori XLR pentru conectarea unui microfon de buna calitate la interfete de sunet externe (prin cablu XLR), oferind un semnal de inalta calitate, balansat si impedanta scazuta;

-conectori RCA pentru echipament audio si video, existand trei conectori, galben pentru semnal video compus, alb pentru canal stanga sau audio mono si rosu pentru canal audio dreapta.

slide31

Conectorii se caracterizeaza prin:

-impedanta (Z), masurata in Ohms ( Ώ ). De exemplu, microfoanele pot fi de joasa impedanta (pana la 600 Ώ), de medie impedanta (intre 600 Ώ si 10 k Ώ) si de inalta impedanta (peste 10 k Ώ). Un microfon de impedanta mare poate furniza un semnal de amplitudine mai mare decat un microfon de impedanta scazuta.

-lungimea cablului influenteaza semnalul, un cablu lung distorsioneaza frecventele inalte (prin reactanta cablului).

-semnal balansat:semnalele balansate dispun de doi conductori de semnal si un ecran. Semnalele sunt defazate cu 180° (adunand doua sinusoide defazate cu 180° suma este zero). Zgomotul care se adauga liniei va fi aproximativ uniform in cele doua canale, iar prin adunarea lor se obtine zgomotul x2, ceea ce permite estimarea acestuia si eliminarea din semnal

=> canalele balansate sunt mai putin afectate de zgomot.

Semnalele nebalansate utilizeaza un conductor central invelit intr-un ecran. Chiar si asa semnalul este afectat de zgomot.

Concluzie: cea mai buna solutie pentru inregistrare audio este oferita de microfoanele cu impedanta scazuta (cele cu conexiune XLR).

slide32

Software pentru prelucrare audio

Printre cele mai utilizate programe de prelucrare audio sunt: Digidesign Pro Tools (Mac sau Windows), Adobe Audition (Windows), Apple Logic (Mac), Sony Sound Forge (Windows) si Nuendo (Mac sau Windows). Cakewalk Music Creator si Cakewalk Sonar sunt pachete software combinate pentru prelucrare audio / MIDI. Propellerhead Reason (Mac sau Windows) este un pachet sofisticat audio / MIDI furnizand un secventiator, masina de tobe si o varietate larga de sintetizatoare. Acid Pro este un instrument pentru creatia de muzica. Max/MSP (Mac sau Windows) este un mediu de dezvoltare pentru muzica interactiva si prelucrare audio.

Exista de asemenea o serie de freeware, shareware si instrumente comerciale pentru Linux: DAP, MixViews, ReZound, Slab, JoKosher, KWave, Brahms, Jazz++, TiMidity++, Playmidi, BladeEnc, si aRts.

Audacity este un program open source pentru Mac, Windows si Linux.

slide33

Caracteristicile principale ale unui software de prelucrare audio includ:

-import si salvare fisiere audio intr-o varietate de formate;

-interfata pentru inregistrarea si redarea de sunete;

-vizualizarea formei de unda, permitand editarea pana la nivelul de esantion;

-editoare multitrack;

-instrumente de restaurare audio pentru inlaturarea suieraturilor, clickurilor, pocniturilor si a zgomotului de fond;

-abilitatea de preluare de intrari sau furnizare de iesiri de la canale multiple;

-efecte speciale „reverb”, „panning”, „flange”;

-controale pentru egalizarea si ajustarea volumului si intervalului dinamic;

-filtre de frecventa;

-gestionarea formatului MIDI alaturi de date audio digitale si integrarea intr-un singur fisier audio;

-inregistrarea de esantioane si adaugarea la banca de pachete MIDI;

-codecuri de compresie.

slide34

In „Waveform view”: reprezentare grafica a undelor sonore (se pot afisa si edita la nivelul esantioanelor). Se mai numeste si editor de esantioane. Pe orizontala se afiseaza timpul, iar pe verticala amplitudinea. Standardul pentru timp este SMPTE (Society of Motion Picture and Television Engineers), divizat in ore, minute, secunde si cadre („frames”). De exemplu, un standard (imprumutat din video) poate sa fie de 30 cadre / sec.

In „Multitrack view” se permite inregistrarea de diferite sunete, instrumente si voce pe piste separate, care pot fi prelucrate independent. O pista este o secventa de esantioane audio care poate fi redata si editata ca o unitate separata. De obicei piste separate sunt asociate cu instrumente sau voci separate.

Canalul difera de pista, canalul corespunzand unui stream de date audio. Astfel inregistrare pe un canal inseamna mono, iar pe doua canale inseamna stereo. Pe masura dezvoltarii industriei multimedia au aparut inregistrari multicanal: multicanal 5.1 are 5 canale fata-centru, fata-dreapta, fata-stanga, spate-dreapta si spate-stanga, plus un canal LFE („low frequency extension channel”), numit „subwoofer” cu frecvente intre 10-120 Hz, iar multicanal 6.1 are un canal spate-centru suplimentar.

slide35

Tipuri de fisiere audio

Formatele de fisiere audio difera printr-o serie de caracteristici:

-codificarea esantioanelor:

-cuantizare liniara;

-cuantizare logaritmica;

-valori de esantioane cu semn sau fara semn;

-formatul datelor:

-existenta unui header;

-memorarea octetilor in ordinea litle-endian sau big-endian; -intreteserea canalelor;

-tipul de informatii memorate in fisiere:

-constrangeri legate de rata de esantionare si/sau adancimea de biti;

-constrangeri legate de numarul de canale;

-informatii suplimentare, ca „timestamps”, „loop points”;

-fisierul poate fi comprimat:

-utilizand o procedura cu pierderi;

-utilizand o procedura fara pierderi;

-format „open” sau proprietar.

Principalele formate audio sunt prezentate in tabelul urmator:

slide38

Prelucrare dinamica

Prelucrarea dinamica este procesul de ajustare a scarii dinamice a unei selectiuni audio fie pentru a reduce, fie pentru a creste diferenta dintre pasajele cele mai puternice (tari) si cele mai reduse (silentioase). In productia de muzica, vocile si instrumentele sunt inregistrate separat, fiecare pe pista sa, iar fiecare pista se poate ajusta dinamic in timp real sau dupa inregistrare.

slide39

Modificarea scarii dinamice se poate realiza prin patru metode:

-compresie in jos („downward compression”): micsoreaza amplitudinile semnalului care sunt peste o anumita valoare de prag, fara sa schimbe amplitudinile sub aceasta valoare, reducand astfel scara dinamica;

-compresie in sus („upward compression”): ridica amplitudinile semnalului care sunt sub o anumita valoare, fara modificarea amplitudinilor peste aceasta valoare, reducand scara dinamica;

-expansiune in sus („upward expansion”): ridica amplitudinile semnalului care sunt peste o valoare de prag, fara sa schimbe amplitudinile sub aceasta valoare, crescand scara dinamica;

-expansiunea in jos („downward expansion”): micsoreaza amplitudinile semnalului sub o valoare de prag, fara modificarea amplitudinilor peste aceasta valoare, crescand scara dinamica.

slide41

Limitarea audio limiteaza amplitudinea unui semnal audio la un nivel desemnat. Se poate realiza hardware, la inregistrare sau software, executandu-se taierea amplitudinilor mari („clipping”). Rezulta anumite distorsiuni ale formei de unda.

Normalizarea este un proces care creste amplitudinea unui semnal audio si deci si volumul perceput. Deoarece opereaza pe un intreg semnal audio trebuie aplicat dupa inregistrare.

slide42

Algoritmul de normalizare:

1) gaseste amplitudinea cea mai mare din selectia audio;

2) gaseste amplificarea necesara pentru a creste amplitudinea cea mai mare la valoarea maxima dorita (implicit 0 dBFS sau o anumita valoare setata de utilizator);

3) mareste toate amplitudinile din selectie cu aceasta amplificare.

Varianta acestui algoritm normalizeaza amplitudinea RMS la o valoare de decibel specificata de utilizator, caci RMS furnizeaza o masura mai buna pentru volumul perceput al sunetului. In unele programe se furnizeaza o setare predefinita impreuna cu o explicatie intuitiva (exemplu: “Normalize RMS to −10dB (speech)”).

slide43

Compresia si expansiunea se pot reprezenta matematic printr-o functie de transfer sau grafic. O functie de transfer corespunzatoare primei bisectoare (linie la 45°) nu modifica semnalul audio, insa o functie liniara de transfer deasupra primei bisectoare creste amplitdinea, iar sub prima bisectoare scade amplitudinea.

Functii liniare de transfer pentru crestere cu 5 dB si micsorare cu 5 dB (fara compresie sau expansiune).

slide44

Compresia in jos necesita un prag (amplitudinile peste aceasta valoare sunt micsorate). Exemplu de functie de transfer:

Amplitudinile mai mari decat -40 dB sunt micsorate cu un raport 2:1.

slide45

Compresia in sus creste amplitudinea semnalului mai mic decat o valoare de prag. Exemplu de functie de transfer:

Amplitudinile mai mici de -30 dB sunt amplificate cu un raport 2:1.

slide46

Unele programe permit combinarea celor doua operatii intr-una singura In acest caz functia de transfer poate arata astfel:

Se executa compresie in jos pentru amplitudinile mai mari decat -20 dB, fara compresie intre -20 si -60 dB si compresie in sus sub -60 dB. Scara dinamica a fost redusa prin compresie in jos si compresie in sus.

slide47

Exemplu de semnal care a fost prelucrat dinamic prin compresie in jos si compresie in sus, iar apoi normalizat:

Semnalul audio initial. Dupa compresie

slide49

Restaurare audio

In timpul inregistrarilor audio apar zgomote de fond (aparatul de aer conditionat, motorasul unui harddisk, vantul, etc). Pentru eliminarea acestor zgomote se pot utiliza trei tipuri de restaurare audio: blocarea zgomotului („noise gating”), reducerea zgomotului („noise reduction”) si inlaturarea click si pop („click and pop removal”).

Poarta de zgomot („noise gate”) blocheaza semnalele cu amplitudine sub un anumit prag. Cand esantioanele sunt sub valoarea de prag, poarta se inchide si esantioanele nu sunt lasate sa treaca. Cand esantioanele cresc deasupra valorii de prag poarta se deschide si lasa sa treaca aceste esantioane. O poarta permite specificarea unor parametri:

-nivel de reducere („reduction level”): amplitudinea sub care sunt reduse esantioanele;

-timp de atac („attack time”): timpul de deschidere a portii cand semnalul depaseste valoarea de prag (timp scurt poate sa prinda de exemplu un sunet de tobe);

slide50

-timpul de eliberare („release time”): timpul de inchidere a portii din momentul in care semnalul scade sub prag (o bucata muzicala care scade incet in volum trebuie sa aibe un timp de eliberare mare pentru a prinde efectul);

-control de detinere („hold control”): timpul minim cat poarta trebuie sa stea deschisa;

-control de histerezis („hysteresis control”): este util in cazul cand semnalul fluctueaza in jurul valorii de prag, ceea ce ar insemna inchiderea si deschiderea continua a portii (fenomen numit „chatter”), astfel se poate indica diferenta dintre valoarea care deschide poarta si valoarea care o inchide.

slide52

Interfetele pentru reducerea zgomotului afiseaza de obicei graficul analizei de frecventa: pe axa orizontala se reprezinta frecventele, iar pe axa verticala amplitudinile. Utilizand culori diferite se reprezinta semnalul original, cantitatea de reducere a zgomotului si zgomotul. Setarea principala se refera la reducerea zgomotului.

Profilul zgomotului se obtine din analiza Fourier (se determina frecventele la care apar zgomotele si amplitudinile corespunzatoare acestor frecvente). Dupa determinarea profilului zgomotului se compara spectrul de frecvente al intregului semnal cu profilul, iar sectiunile care coincid sunt eliminate.

O astfel de interfata permite setarea unor parametrii de netezire:

-netezire de timp: timpii de atac si eliberare pentru reducerea zgomotului;

-netezire de frecventa: gradul la care zgomotul identificat intr-o banda de frecventa afecteaza schimbarile de amplitudine in benzile de frecvente invecinate;

-netezire de tranzitie: seteaza o gama intre amplitudini care sunt considerate zgomote si cele care nu sunt considerate zgomote.

slide53

Software-ul pentru reducerea zgomotului poate fi setat pentru a cauta un anumit tip de zgomot:

-zgomot alb („white noise”): apare la amplitudini egale (sau aproape egale) pentru toate frecventele, echivalent cu energii egale in benzi de frecventa de aceleasi dimensiuni (graficul frecventa-amplitudine aprox orizontal, deci ariile de sub grafic sunt egale pentru benzi egale);

-zgomot roz („pink noise”): energii egale in benzi de octave (pentru o nota trecerea de la o octava la octava urmatoare inseamna dublarea frecventei).

Eliminatorul de click si pop detecteaza intr-o portiune selectata a fisierului audio o schimbare brusca de amplitudine si elimina aceasta schimbare prin interpolarea undei de sunet intre punctele de start si sfarsit a click-ului sau pop-ului