Bandwidth expansion of narrow band speech using linear prediction
Sponsored Links
This presentation is the property of its rightful owner.
1 / 40

Bandwidth Expansion of Narrow band Speech using Linear Prediction PowerPoint PPT Presentation


  • 83 Views
  • Uploaded on
  • Presentation posted in: General

Bandwidth Expansion of Narrow band Speech using Linear Prediction. Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann. Group 742 Institute of Electronic Systems Department of Communications Technology

Download Presentation

Bandwidth Expansion of Narrow band Speech using Linear Prediction

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Bandwidth Expansion of Narrow band Speech using Linear Prediction

Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund

Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann

Group 742

Institute of Electronic Systems

Department of Communications Technology

Aalborg University, 2004


Præsentation fra Semcon conference

Poster præsentation

Abstract

Arbejdsmetodik og arbejdsblade

Envelope

Excitation

Artikel

Agenda


Todays Narrow band telephone systems

  • Bandwidth of speech is more than 8 kHz

  • Limited bandwidth of todays system

  • Too expensive to expand current telephone systems.

  • Expansion at the receiving end of the telephoneline


Envelope Estimation

System overview

LSF

transform

Codebook

mapping

Inv. LSF

Transform

  • Transforms the LPC coefficients into LSF (Line Spectrum Frequency)

  • Codebook used for prediction of upper frequencies


Excitation Estimation

  • Modulation moves the frequency

  • Pitch detection estimates the fundamental frequency


The result

At the user

Public telephone system

Telephone

switch

Telephone

switch

Bandwidth

Expansion


Poster præsentation

Frederik


Bygget op omkring IMRaD-modellen

Centralt placerede figurer

Selvforklarende figurer

Kortfattet tekst

Tekst underbygges af figurer

Kommunikative virkemidler


Abstract

Peter


Titel

IMRaD

Introduktion

Metoder

Resultater

Diskussion

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Beskrive rapporten så præcist som muligt

Skal ikke være for lang

Skal præsentere ”key words”.

Bandwidth Expansion of Narrowband Speech using Linear Prediction

Abstract Oversigt Titel Introduktion Metoder Resultater Diskussion


Beskrivelse af problemstillingen

Uddybelse af problem, så læseren ikke er i tvivl om hvad projektet handler om

Kan bruges som en ”appetitvækker”

”...,thus making the speech sound more realistic and pleasant”

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Forklaring af brugte metoder

Forklaring af løsningsforslag

Inddrag ikke resultater i Metoder

Signal split into two parts....

LP coefficient → LSFcoefficient

LSF codebook

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Forklaring af testmetode

Præsentation af relevante resultater, evt. Ikke alle resultater fra projektet.

”Spectrograms of the reconstructed wideband signal verified.....”

”Convergence measurements ranging.....”

Listening test

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Opsummerer de mest relevante resultater

Diskuterer resultaterne

Diskuterer fremtidigt arbejde

”The algorithm for wideband expansion proved to work...”

”However, unwanted artefacts developed in the reconstruction af the wideband signal”

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Arbejdsmetodik og arbejdsblade

Ole


Projektet blev delt op i flere mindre dele

Hver del blev undersøgt og behandlet af 1-3 personer

Dele og grupper blev løbende revideret

Alle undersøgelser og behandlinger blev beskrevet i arbejdsblade

Arbejdsmetoder


Codebook

LP

Envelope

analysis

extension

LP

synthesis

LP

Excitation

estimation

extension

Arbejdsblade

  • Excitation extension

  • Cepstral signal analysis for pitch detection

  • Pitch detection

  • Vector Quantization

  • Codebook training

  • Generating the codebook for speech enhancement

  • The K-means Clustering Algorithm

  • Overview of the human speech system

  • Framing and deframing

  • LPC modeling of vocal tract

  • Envelope and excitation evaluation

  • Listening test

  • Reflection Coefficients

  • Telephone filter

  • Line Spectrum Pairs


Envelope

Brian


Vocal tract model

Line Spectrum Frequency

Codebook

Spectral distortion

Envelope


Vocal tract model


Line Spectrum Frequency


Codebook


Spectral distortion

Mål : Spectral distortion < 1dB


Excitation

Jakob


Excitation Extension

  • Ønsket funktionalitet

  • Filtrering og opsampling

  • Rekonstruktion af residualsignal


Ønsket funktionalitet

  • Rekonstrueret residualsignal lig originalt

  • Genskabe amplitudespektrum

  • Karakteristika

  • Filtreringsproblem


Filtrering og opsampling

  • Telefilter

  • -HP-filter:fp = 300 Hzfs = 250 Hz

  • -LP-filter: fp = 3400 Hzfs = 3450 Hz

  • Residualfilter

  • -HP-filter:fp = 350 Hzfs = 300 Hz

  • -LP-filter: fp = 3350 Hzfs = 3400 Hz


Rekonstruktion

  • Modulation

  • Addition af hvid støj


Rekonstruktion

  • Addering af pitchfrekvens

  • Tilpasning af fase

  • Problem ved segmentoverlap

  • Forbedringer

  • Midling af pitch

  • Kalman-filter

  • Pitchdetektion af svage signaler


Gennemgang af artikel

Bjarke


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Gennemgang

  • IMRaD

  • Indhold og opbygning af afsnit

  • Videnskabelig fremgangsmetode(r)

  • Særlig fokus på resultater / konklusion


Problemstilling

Valg af løsnings-metode

Videnskabelig gen-nemgang af metoder

Vurdering af resultater

Undersøgelse af løsnings-metoder

Anvendelse af nye / kombination af eksisterende metoder

Test metoder og resultater af tests

Konklusion

Gennemgang af artikel

Artiklens opbygning


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Indhold

  • Kort beskrivelse af problemstilling

  • Anvendte metoder i løsning

  • Resultat


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Problemstilling

  • Telefonsystem båndbrede begrænset (300-3400 Hz)

  • Mål: Båndbrede på 80-8000 Hz

  • Løsning

  • Undersøgt eksisterende løsninger / ideer

  • - Problemstilling ikke løst

  • Arbejde videre med eksisterende idé

  • Mål: Finde / forbedre metoder til implementering af idé


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Eksisterende metoder

  • Anvendelse af metoder

  • Kombination af metoder

  • Nye ideer

  • LPC  LSF koefficienter

  • Anvendelse af kodebog

  • Modulation af residual signal


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Test metoder

  • Matematisk - Talstørrelse for godhed

  • Visuelt - Identificering af mangler

  • Lyttetest - Overordnet resultat

  • Mål med test

  • Sammenligne resultater

  • Identificering af problemer i metoder

  • Brugeres vurdering af metoder


Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Vurdering af resultater

  • Matematiske resultater

  • Visuelle resultater

  • Lyttetest resultater

  • Konklusion

  • Båndbredeudvidelse opnået

  • Metoder mangler videre udvikling

  • Spectral Distortion

  • - 5,3 < μ < 7,0 dB

  • - 2,4 < σ2 < 7,4 dB2

  • - Ingen spectral transparency (1,0 dB)

  • Forklaringer

  • - Kodebog er mangelfuld

  • - Sammenhæng mellem bånd utilstrækkelig

  • Spectrogrammer

  • - Tilføjet komponenter til øvre bånd

  • - Unvoiced lyd gengives ultilstrækkeligt i øvre bånd

  • - Sinus element tilføjet upræcist i nedre bånd

  • Forklaringer

  • - Envelope extension virker utilstrækkelig i øvre bånd

  • - Excitation extension virker utilstrækkelig i nedre bånd

  • A/B test

  • - Original telefon signal fortrukket

  • Forklaringer

  • - Artefakter introduceret i signal

  • - Utiltrækkelig gengivelse af unvoiced lyd


  • Login