1 / 44

Compressão de Áudio Digital

Compressão de Áudio Digital. Joaquim Macedo Departamento de Informática da Universidade do Minho. Sumário. Princípios de Compressão Áudio Redundância Estatística Redundância Temporal Codificação perceptual áudio Normas de compressão áudio Norma de Compressão Áudio MPEG-1

lionel
Download Presentation

Compressão de Áudio Digital

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Compressão de Áudio Digital Joaquim Macedo Departamento de Informática da Universidade do Minho

  2. Sumário • Princípios de Compressão Áudio • Redundância Estatística • Redundância Temporal • Codificação perceptual áudio • Normas de compressão áudio • Norma de Compressão Áudio MPEG-1 • Norma de Compressão Áudio MPEG-2 • Normas de Compressão Áudio AC • Comparação de Algoritmos de Compressão • Formatos Áudio

  3. Exemplo 7.1 • Queremos transmitir áudio estéreo em tempo real num canal de 56Kbps. Considere os seguintes cenários • Usamos uma frequência de amostragem de 44.1KHz. Quantos bits podemos usar para cada amostra áudio? • Usamos 16 bits/amostra/canal. Qual a máxima frequência de amostragem? O que podemos fazer para evitar o aliasing • Queremos usar uma frequência de amostragem de 44.1 Khz e 16 bits/amostra/canal. Qual a razão mínima de compressão para transmitir o sinal áudio?

  4. Princípios de Compressão Áudio • Redundância Estatística • Mais bits para valores de amostra mais comuns • Redundância Temporal • Correlação entre valores de amostras vizinhas • Redundância inter-amostra • Redundância do Conhecimento • Explorar conhecimento partilhado entre codificador e descodificador • Ficheiros MIDI • Propriedades do Sistema Humano de Audição • Aumentar a qualidade subjectiva do sinal áudio

  5. Função Taxa de Distorção • Teorema de Shannon para codificação da fonte sem erros • Limite na compressão sem erros • Fontes áudio naturais • Compressão sem perdas máxima 2:1 • Compressão com perdas usada na prática • Obtenção de maior razão de compressão.

  6. Função Taxa de Distorção Codificador simples Débito D(dm) Codificador complexo Limite da teoria da informação distorção dm

  7. Redundância Estatística • Compressão de Texto • Métodos de compressão eficientes baseados na entropia • Pode-se usar a mesma abordagem na compressão de áudio

  8. Exemplo 7.2 • Considere um sistema de aquisição áudio que tem 10000 amostras de áudio mono com resolução de 3 bits com níveis entre 0 e 7. O número de ocorrências para os oito níveis foram [700,900,1500,3000,1700,1100,800,300] • Calcule e desenhe a função densidade de probabilidade para cada símbolo • Calcule a entropia da fonte

  9. Solução p[0] = 700/10000 = 0.07 p[1] = 900/10000 = 0.09 p[2] = 1500/10000 = 0.15 p[3] = 3000/10000 = 0.30 p[4] = 1700/10000 = 0.17 p[5] = 1100/10000 = 0.11 p[6] = 800/10000 = 0.08 p[7] = 300/10000 = 0.03

  10. Sinal chord.wav Fig. 7.3,pag.149 Fig. 4.14(a)

  11. Redundância Estatística • O método de codificação baseado na entropia • Não consegue altos níveis de compressão para a maioria dos sinais áudio • Mas disponibiliza bom desempenho quando aplicado a coeficientes de transformada • Norma MPEG-1 utiliza codificação baseada na entropia

  12. Codificação MU-LAW g h h* g* Quantificador Uniforme

  13. Codificação MU-LAW Caratcterísticas de E/S com

  14. Exemplo 7.3 • Considere o sinal áudio chord. Quantifique o sinal uniformemente com 8 bits, utilizando a compressão com mu=255. Expanda o sinal e calcule a relação sinal-ruído (SNR). Compare a SNR com a obtida com o exemplo 4.6

  15. Redundância Temporal

  16. DPCMDifferential Pulse Code Modulation • No DPCM • Uma amostra áudio é prevista com base nas amostras anteriores • O valor previsto é aproximado mas diferente do valor da amostra • Fórmula usada pela técnica LPC(Linear Preditive Coding)

  17. Codificador DPCMEsquema simplificado Áudio original Codificador Quantificador Áudio Compactado Previsor

  18. Descodificador DPCMEsquema simplificado Áudio Reconstruído Descodificador Áudio Compactado Previsor

  19. DPCM

  20. Exemplo 7.4 • Considere o sinal áudio chord. Determine o conjunto óptimo de coeficientes de previsão de 1ª,2ª e 3ª ordem.

  21. Erros de previsão

  22. DPCM • Depois de obtida o erro da sequência en • É codificado para reconstruir o sinal perfeitamente • Na codificação com perdas uma qualidade de reconstrução razoável é aceitável • A quantificação é a única operação na codificação DPCM que introduz ruído

  23. Exemplo 7.5 • As 4 primeiras amostras duma sequência digital áudio são [70,75,80,82,...]. São necessários no mínimo 7 bits para codificar cada uma das amostras. As amostras áudio são codificadas usando o DPCM usando o previsor de primeira ordem. Os coeficientes de erro de predição são quantificados por 2 e arredondados para o próximo inteiro e armazenados sem perdas. Determine o número aproximado de bits necessários para representar cada amostra e o erro reconstruído em cada instância de amostra.

  24. Codificação DPCMvários passos para a sequência [70,75,80,82,...]

  25. Codificação do Áudio Perceptível

  26. Codificação do Áudio Perceptível

  27. Normas de Compressão Áudio • Codificadores áudio de baixo débito • Para telefone • ITU-G.711 • Defeito para ISDN • 8000 amostras/seg, 8 bits/amostra • Usam u-law e A-law companding • ITU-G.722 • Áudio de maior fidelidade • Codifica 7KHz em 64Kbit/seg • ITU-G.729 • Voz a 8 KHz • Usa uma estrutura conjugada • Algebraic-Code-excited, Linear Prediction Agorithm

  28. Normas de Compressão ÁudioCodificadores áudio genéricos MPEG-1 • Adoptada em 1992 • Para áudio digital de alta fidelidade • Norma de compressão genérica • Pode compactar sinais áudio provenientes duma larga diversidade de fontes • MPEG-2 • Baseada na MPEG-1 com alguns melhoramentos • MPEG-4 • Compacta tanto som natural (música, voz) como sintetizado • O som sintetizado pode ser representado por texto ou pela descripção de intrumentos musicais com diferentes efeitos

  29. Normas de Compressão ÁudioCodificadores áudio genéricos • AC-2 e AC-3 • Desenvolvidos pela Dolby Digital Laboratories • Para codificação de áudio de alata fidelidade multi-canal

  30. Norma MPEG-1 Áudio • Explora as propriedades psico-acústicas do ouvido humano • Taxa de amostragem áudio:32, 44.1 ou 48 KHz • pode compactar: mono ou estéreo (2 canais) • 3 camadas independentes de compressão • Compromisso entre complexidade, relação de compressão, qualidade • Camada 1 : mais simples, débitos acima de 128kbps/canal • Camada 2: complexidade moderada, débito à volta de 128 bits/canal • Camada 3 (mp3): maior complexidade, débitos à volta de 64 kbps/canal e oferece a melhor qualidade áudio • Adequada para transmissão áudio em ISDN

  31. Codificador Áudio MPEG-1 Modelo Psico-Acústico Dados auxiliares (opcional) Alocação, Quantificação e Codificação de bits Banco de Filtros de Análise Formatação da sequência de bits Entrada Áudio Sequência de bits codificada

  32. Descodificador Áudio MPEG-1 Reconstrução da frequência de amostragem Desempacotamento da sequência de bits Sequência de bits codificada Dados auxiliares Banco de Filtros de Síntese Áudio Reconstruído

  33. Áudio MPEG-1Banco de Filtros • Para conseguir melhor desempenho • As larguras de banda dos filtros no banco de filtros devem unificar com as sub-bandas críticas • Mais pequenas na gama inferior de frequências • Maiores na gama superior • Para simplificar o desenho do codificador • Existem 32 sub-bandas de igual largura • Os filtros são relativamente simples • Boa resolução no tempo e uma resolução razoável na frequência • O banco de filtros não é reversível • Mesmo que os coeficientes de sub-banda não sejam quantificados, o sinal de áudio reconstruído não é igual ao original

  34. MPEG camada 1,2 e 3Codificação de camada 12 Amostras 12 Amostras 12 Amostras Filtro sub-banda 1 12 Amostras 12 Amostras 12 Amostras Filtro sub-banda 2 12 Amostras 12 Amostras 12 Amostras Amostras Agrupadas Filtro sub-banda 3 ... Amostras Áudio 12 Amostras 12 Amostras 12 Amostras Filtro sub-banda 32 Quadro da camada 1 Quadro da camada 2 e 3

  35. Codificação do MPEG-1 camada 3 1 MDCT Banco de Filtros da Camada 1 e da Camada 2 Janela MDCT Redução do Aliasing, Quantificação e codificação MDCT Janela MDCT ... ... Entrada Áudio PCM Áudio Compactado 32 MDCT Janela MDCT

  36. Norma MPEG-2 • Define duas normas • MPEG-2 BC • BC (Backward Compatible) • Extensão da norma MPEG-1 • Inclui codificação multi-canal e multilingue • É permitida codificação a frequências abaixo de 32 KHz • MPEG-2 AAC • ACC (Advanced Audio Coding) • Codificador áudio altamente avançado com um desempenho de compressão superior

  37. MPEG-2 AAC • 3 Perfis ou Modos • Modo Low Complexity (LC) • Aplicações em que o gargalo é a velocidade de processamento e a memória • Modo Main • Quando há capacidade de computação e memória disponíveis • Mode SSR (Scalable Sample Rate) • Quando as aplicações precisam de descodificação escaláveis.

  38. Codificador MPEG-2 AACEsquema simplificado Entrada do Sinal Áudio Banco de Filtros Multiplexador da Sequência de bits Modelo Perceptual Calibragem do ruído temporal Previsão Sequência codificada de bits áudio Processo de Controlo da Taxa de Distorção Factores de Escala Quantizador Codificação sem ruído

  39. Normas de Compressão Áudio ACÁudio Digital Áudio O codificador AC-3 é largamente utilizado para transportar Áudio multi-canal em aplicações como Vídeo DVD TV Digital TV de alta definição (HDTV) Aplicações de éstudio O codificador AC-3 foi precedido por AC-1e AC-2. AC-1: Utiliza modulação delta adaptativa combinada com companding analógica. Não é um codificador perceptual. AC-2: Um codificador perceptual que usa uma transformada de baixa Complexidade TDAC (Time domain alias cancellation) transform. Usa MDCT, MDST.Àudio de alta qualidade a um débito de 256 kbps por canal. AC-3: Superior ao AC-2. Alta qualidade a 384 kbps/seis-canais

  40. Codificador AC-3Esquema simplificado Qunatificador da mantissa, Mantissas Quantificadas Mantissas Alocação de bits Amostras Áudio Áudio Codificado Transformação TDAC Vírgula flutuante em bloco Empacotador do sequência de bits Expoentes Coeficientes de transformada

  41. Codificação de Expoente • Os expoentes são valores de 5 bits que indicam o número de zeros da frente • Os valores dos expoentes variam de 0 a 24 • São codificados de forma diferencial • Os diferentes expoentes são combinados em grupos no bloco áudio • A Estratégia do expoente define como os diferentes expoentes são codificados

  42. Descodificador AC-3Esquema simplificado Sequência de bits codificada Desempacotador da mantissa, Normalização Desempacotador do expoente Alocação de bits Ponto flutuante para fixo Transformação inversa TDAC Canais 5.1 de saída

  43. Comparação de algoritmos

  44. Formatos Áudiotípicos para armazenamento de som Formatos usados para cadeias de áudio na Internet

More Related