1 / 84

Conceitos Básicos em Codificação com Perdas

Conceitos Básicos em Codificação com Perdas. Em codificação sem perdas :  Limite da taxa de compressão atingível (em bits/símbolo) é dado pela entropia da fonte. de acordo com a Teoria da Informação de Shannon. Em codificação com perdas :

jamal
Download Presentation

Conceitos Básicos em Codificação com Perdas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Conceitos Básicos em Codificação com Perdas

  2. Em codificação sem perdas:  Limite da taxa de compressão atingível (em bits/símbolo) é dado pela entropia da fonte de acordo com a Teoria da Informação de Shannon. Em codificação com perdas:  Há um compromisso entre a taxa de compressão e a qualidade do sinal reconstruído. TE073 – Processamento Digital de Sinais II

  3. Codificação com perdas:  Maior distorção possível: Perda total do sinal Taxa de compressão máxima! Isto é, não necessita enviar dado nenhum.  Menor distorção possível: Codificação sem perdas Taxa de compressão dada pela entropia da fonte. Teoria da Distorção pela Taxa (Rate Distortion Theory) TE073 – Processamento Digital de Sinais II

  4. Otimizar um codificador:  Obter a menor distorção possível para uma dada taxa de compressão. (imposição do meio de armazenamento ou canal de comunicação) Como medir a distorção?? TE073 – Processamento Digital de Sinais II

  5. 7.3. Critérios de Distorção O que é a distorção?? É uma medida de quanto o sinal reconstruído se diferencia do sinal original. A fidelidade da reconstrução depende do usuário final. Medidas subjetivas: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político. TE073 – Processamento Digital de Sinais II

  6. Medidas subjetivas da distorção: O usuário final define, subjetivamente, a qualidade da reconstrução. Geralmente feito através de uma pesquisa de opinião com um grande número de pessoas para não recair em particularismos. Ex.: Avaliação de uma pintura e avaliação de um rascunho de uma casa. Avaliação de um trecho de música clássica e de um discurso político. Baseado em escores: Excelente, ótimo, bom, aceitável, ruim, péssimo, inaceitável, horroroso, pior que isso não poderia ser, etc. TE073 – Processamento Digital de Sinais II

  7. Problemas com este tipo de medida: Difícil de se computar, pois depende muito de pessoa para pessoa. Para se obter uma medida independente de “gostos”, deve-se trabalhar com um número muito grande de pessoas. O que torna a medida muito complicada e trabalhosa de ser realizada. Logo: definição de medidas objetivas da distorção facilita muito o projeto dos codificadores. TE073 – Processamento Digital de Sinais II

  8. Medidas objetivas da distorção: Geralmente baseadas em erros entre o sinal original e o reconstruído: Onde: É a distorção de ordem p entre o sinal original x e o sinal reconstruído y. N é o número de componentes (dimensões) dos sinais. TE073 – Processamento Digital de Sinais II

  9. Medidas mais comuns: Média das diferenças absolutas Erro médio quadrático (EMQ) Mean Squared Error (MSE) Distância Euclidiana ao quadrado .... Erro máximo. Usado em casos onde o erro só é percebido Acima de um determinado limiar (threshold) TE073 – Processamento Digital de Sinais II

  10. Considerando que a distorção imposta ao sinal original como sendo um ruído de codificação: Podemos ter medidas baseadas na relação Sinal-Ruído Energia do Sinal Energia do Ruído (d2,EMQ,MSE) Medida em dB Relação sinal ruído de pico Muito usado em imagem: x2max=2552 TE073 – Processamento Digital de Sinais II

  11. Vimos 2 formas de medidas da fidelidade da reconstrução: Medidas Subjetivas: Medidas precisas da fidelidade baseada nos aspectos e limitações humanas. São matematicamente difíceis de se manusear e usar no projeto de codificadores. Medidas Objetivas: Matematicamente tratáveis. Não incorpora os aspectos da fidelidade perceptível do ponto de vista humano. TE073 – Processamento Digital de Sinais II

  12. Medida ótima? Aquela que modela matematicamente as limitações humanas. Porém essas limitações (de ordem biológica) são difíceis de se determinar matematicamente, logo usa-se aproximações e modelos. Ex.: Sistema Visual: modelo do olho e percepção de imagens e vídeo Sistema passa baixas com persistência temporal. Razão de Weber: Sistema Auditivo: modelo do ouvido e percepção de sons. Limitação 20Hz a 20KHz com resolução de 1000:1 1kHz a 20dB percepção semelhante a 50Hz a 50dB Mascaramento de nível sonoro e mascaramento espectral TE073 – Processamento Digital de Sinais II

  13. 7.5. Teoria da Distorção pela Taxa Ex.: 2 se cruzando (MPEG1 e MPEG2) TE073 – Processamento Digital de Sinais II

  14. Problema: Como calcular a função Distorção(Taxa) R(D) ? - Resultado depende do modelo usado Ex.: Fonte Gaussiana e distorção medida pelo erro médio quadrático: TE073 – Processamento Digital de Sinais II

  15. A função R(D) da distribuição Gaussiana possui a propriedade de ser a maior função R(D) para qualquer outra distribuição que possua a mesma variância (2). Logo pode ser vista como um limite superior. Shannon demonstrou em seu artigo de 1948 que o limite inferior da função R(D) para uma variável aleatória contínua medida pelo erro médio quadrático, é dada por: Onde h(X) é a entropia diferencial da variável X TE073 – Processamento Digital de Sinais II

  16. Problema: Para sinais reais é difícil definir sua função distribuição de probabilidade e assim calcular h(X). Para distribuição Gaussiana: Prova-se que h(X) da distribuição gaussiana é maior que qualquer outra h(X) para a mesma variância (2). TE073 – Processamento Digital de Sinais II

  17. 7.6. Modelos 7.6.1. Modelos Probabilísticos Distribuição Uniforme: modelo da ignorância Distribuição Gaussiana: Mais usada Mais centrada em zero, Ex.: voz, dif. imagem Distribuição Laplaciana: Mais centrada ainda em zero, menos tratável Distribuição Gamma: TE073 – Processamento Digital de Sinais II

  18. TE073 – Processamento Digital de Sinais II

  19. 7.6.2. Modelos baseados em Sistemas Lineares Uma grande classes de processos podem ser modelados pela Equação de Diferenças: Onde xn são as amostras do processo que desejamos modelar e n é uma sequência de ruído branco. Em DSP nada mais é que um filtro digital com N pólos e M zeros. Em estatística é chamado um modelo média móvel autoregressivo (ARMA – Autoregressive Moving Average) ARMA(N,M) TE073 – Processamento Digital de Sinais II

  20. Se todos os bj forem zero. Fica apenas a componente autoregressiva. Que é um filtro IIR com apenas pólos (all-pole) e também chamado modelo autoregressivo de ordem N, AR(N), muito usado em compressão de voz. Como a amostra atual depende apenas das N amostras anteriores: Isto significa que um AR(N) é um processo de Markov de ordem N. Ver exemplos no livro. TE073 – Processamento Digital de Sinais II

  21. 7.6.3. Modelos Físicos Modelos baseados na física da fonte do sinal. Geralmente complicados e não bem tratáveis matematicamente. Uma exceção é a geração de voz que será vista em detalhes oportunamente. TE073 – Processamento Digital de Sinais II

  22. Quantização Escalar

  23. Quantização Escalar • Definição: Representar uma infinidade de valores em um conjunto limitado de códigos; ou seja, poucos códigos de saída para muitos valores de entrada; • Mais simples métodos de compressão com perdas; Ex: Valores de amostras entre -10 e 10: TE073 – Processamento Digital de Sinais II

  24. Quantização Escalar • Esquema do quantizador: Representar o valor de cada entrada em uma saída com o valor do numero inteiro mais próximo: -2,47  -2,0 3,14159...  3,0 4,5  4,0 ou 5,0 (aleatoriamente). TE073 – Processamento Digital de Sinais II

  25. Quantização Escalar • Para os infinitos valores entre -10 a 10, o alfabeto de saída se reduz a apenas 21 valores: {-10,.....,0,.....,10} Quando um valor de saída é “3”, qual foi a sua entrada? 2.95 ? 3.1415 ? 2,51 ? TE073 – Processamento Digital de Sinais II

  26. O Problema da Quantização • O compressor divide a faixa de entradas em intervalos, {-10,.....,0,.....,10}; • Intervalo = palavra de código; • Como vários valores de entrada podem cair em um mesmo intervalo, • o código somente informa que a amostra pertence aquele intervalo. 8,01  código x1  8 8,20  código x2  8 7,51  código x3  8 TE073 – Processamento Digital de Sinais II

  27. O Problema da Quantização • Esta perda de informação é irrecuperável; • Também chamado de “Ruído de Quantização”. • Como o código representa um intervalo, então o decodificador gera um valor que melhor represente os valores do intervalo. TE073 – Processamento Digital de Sinais II

  28. Quantização Escalar Quando as entradas são analógicas, o processo é também conhecido como “conversão analógico-digital” A/D. A reconstituição do código em valor analógico se chama “conversão digital-analógico” D/A. Aplicação mais conhecida: Digitalização de áudio, PCM30 (telefonia) TE073 – Processamento Digital de Sinais II

  29. Quantização Escalar Códigos Saída 000 -3,5 001 -2,5 010 -1,5 011 -0,5 100 0,5 101 1,5 110 2,5 111 3,5 Definição dos intervalos de entrada e os respectivos códigos. Valores de saída para os códigos (níveis de reconstrução). TE073 – Processamento Digital de Sinais II

  30. Quantização Escalar Ex: f(t) = 4.cos(2t), com amostras a cada 0,05 s TE073 – Processamento Digital de Sinais II

  31. Ruído de Quantização Definição: q2 = msqe: é a média quadrada da diferença entre a entrada [x] e a saída [y = Q(x)] do quantizador. onde: fX(x) = função probabilidade da entrada M = número de intervalos msqe = mean squared quantization error. TE073 – Processamento Digital de Sinais II

  32. Taxa do Quantizador Para palavras código fixas, o próprio comprimento do código especifica a taxa do quantizador. Se o número de saídas do quantizador é M então a taxa é dada por: R = log2M Em códigos de tamanhos variáveis, a taxa é função da probabilidade de ocorrência de cada código, e do seu respectivo comprimento[ li]: TE073 – Processamento Digital de Sinais II

  33. Quantizador Uniforme • Intervalos igualmente espaçados (entrada e saída) • Idem para os limites de decisão e valores de reconstrução. • Espaço =  • Quantizador Midrise • Não possui o nível “0” • Número de saídas pares • Quantizador Midtread • Possui o nível “0” • Número de saídas impares TE073 – Processamento Digital de Sinais II

  34. Quantizador Uniforme e Fonte Uniforme • Fonte uniformemente distribuída pelo intervalo. • Intervalo [ -Xmax , Xmax] dividido em M partes iguais () • Ruído de quantização para fonte uniforme: q = x - Q(x) TE073 – Processamento Digital de Sinais II

  35. Quantizador Uniforme e Fonte Uniforme O ruído de quantização se torna: Assumindo que a variância dos valores de entrada no intervalo [ -Xmax , Xmax]é: TE073 – Processamento Digital de Sinais II

  36. Quantizador Uniforme e Fonte Uniforme SNR: Signal Noise Ratio ou Razão Sinal Ruído: • SNR = 6,02.n [dB] • A cada bit adicionado (n) no quantizador, ocorre um aumento de 6,02 dB na razão sinal ruído. • A cada bit retirado do esquema do quantizador, o ruído inserido é 4 vezes maior que o esquema anterior. TE073 – Processamento Digital de Sinais II

  37. Compressão de Imagens • Modelo de probabilidade para imagens: quase impossível • Aproximação  Pixels distribuídos entre: 0 e 2b-1, onde b é o número de bits por pixel. Assume-se que os valores dos pixels variam de 0 a 255. • 1 bit/pixel  dividir [0, 255] em [0, 127] e [128, 255]; com • limites de decisão [0, 128, 255] e valores de reconstrução • {64, 196}. • 2 bit/pixel  limites de decisão [0, 64, 128, 196, 155] e valores • de reconstrução {32, 96, 160, 224}. TE073 – Processamento Digital de Sinais II

  38. Imagem Original 1 bit/pixel 3 bits/pixel 2 bits/pixel TE073 – Processamento Digital de Sinais II

  39. Nota-se que para distribuições não uniformes, a divisão das entradas e saídas em partes igualmente separadas não é satisfatória. TE073 – Processamento Digital de Sinais II

  40. { Modelos de distribuição  ideal Parâmetros da distribuição Erros de Combinação • Diferenças entre os modelos escolhidos e os modelos reais. • 1º caso: Variância assumida  Variância real. • 2º caso: Modelo de distribuição  Tipo do quantizador. TE073 – Processamento Digital de Sinais II

  41. Erros de Combinação Variância assumida  Variância real. Quantizador uniforme com distribuição Gaussiana TE073 – Processamento Digital de Sinais II

  42. Erros de Combinação Modelo do quantizador não casa com o modelo da distribuição TE073 – Processamento Digital de Sinais II

  43. Quantização Adaptativa • Eliminar problemas de erros de combinação • Adaptar o quantizador () em relação à estatística da fonte. • Método I: Forward Adaptive Quantization • Método II: Backward Adaptive Quantization TE073 – Processamento Digital de Sinais II

  44. Forward Adaptive Quantization • Passos: • Fonte dividida em blocos de dados, • Parâmetros analisados e ajustados antes da quantização, • Dados + ajustes enviados. • Desvantagens: • Atraso por processamento dos blocos, • Envio de informação lateral. • Ponto ótimo entre: • Blocos pequenos  Muita informação lateral • Blocos extensos  Demora no processamento TE073 – Processamento Digital de Sinais II

  45. Exemplo 8.5.1: Palavra “test”, digitalizada com 8000 amostras/s e 16 bits/amostra. • Comprimida com quantização de 6 níveis (3 bits). Quantização uniforme. Perda de resolução na amplitude. TE073 – Processamento Digital de Sinais II

  46. Blocos de 128 amostras • Obtenção do desvio padrão dos blocos e quantizado com 8 bits. • Amostras normalizadas com o desvio padrão. TE073 – Processamento Digital de Sinais II

  47. Exemplo 8.5.2: Blocos de 8 x 8 pixels, • 3 bit Forward Adaptive Uniform Quantization, • Informação lateral: Valores máximos e mínimos dos bloco (8x8) = 8 bits. 3 bits/pixel TE073 – Processamento Digital de Sinais II

  48. Backward Adaptive Quantization • Análise de amostras quantizadas antigas. • Como obter informação de erro somente com a saída do • quantizador, e sem conhecer o valor da amostra original? • A noção do erro na distribuição das saídas se dá por uma • extensa análise da própria saída do quantizador. TE073 – Processamento Digital de Sinais II

  49. Backward Adaptive Quantization • Quando a distribuição de entrada combina com o quantizador, • tem-se o  ideal. Caso contrário, varia-se o tamanho de . • Se  < ideal, a maioria das amostras incidirão nos níveis mais • elevados do quantizador,   . • Se  > ideal, a maioria das amostras incidirão nos níveis mais • baixos do quantizador,   . • Outros: Ex.: Quantizador de Jayant TE073 – Processamento Digital de Sinais II

  50. Quantização Não Uniforme • Distribuição concentrada próximo à origem • Vantagem: • Reduz a distorção onde a distribuição é mais densa • (mais informação). • Desvantagem: • Erros maiores na região de baixa probabilidade de amostras. TE073 – Processamento Digital de Sinais II

More Related