Bandwidth expansion of narrow band speech using linear prediction
This presentation is the property of its rightful owner.
Sponsored Links
1 / 40

Bandwidth Expansion of Narrow band Speech using Linear Prediction PowerPoint PPT Presentation


  • 73 Views
  • Uploaded on
  • Presentation posted in: General

Bandwidth Expansion of Narrow band Speech using Linear Prediction. Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann. Group 742 Institute of Electronic Systems Department of Communications Technology

Download Presentation

Bandwidth Expansion of Narrow band Speech using Linear Prediction

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Bandwidth expansion of narrow band speech using linear prediction

Bandwidth Expansion of Narrow band Speech using Linear Prediction

Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund

Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann

Group 742

Institute of Electronic Systems

Department of Communications Technology

Aalborg University, 2004


Agenda

Præsentation fra Semcon conference

Poster præsentation

Abstract

Arbejdsmetodik og arbejdsblade

Envelope

Excitation

Artikel

Agenda


Bandwidth expansion of narrow band speech using linear prediction

Todays Narrow band telephone systems

  • Bandwidth of speech is more than 8 kHz

  • Limited bandwidth of todays system

  • Too expensive to expand current telephone systems.

  • Expansion at the receiving end of the telephoneline


Bandwidth expansion of narrow band speech using linear prediction

Envelope Estimation

System overview

LSF

transform

Codebook

mapping

Inv. LSF

Transform

  • Transforms the LPC coefficients into LSF (Line Spectrum Frequency)

  • Codebook used for prediction of upper frequencies


Bandwidth expansion of narrow band speech using linear prediction

Excitation Estimation

  • Modulation moves the frequency

  • Pitch detection estimates the fundamental frequency


The result

The result

At the user

Public telephone system

Telephone

switch

Telephone

switch

Bandwidth

Expansion


Poster pr sentation

Poster præsentation

Frederik


Kommunikative virkemidler

Bygget op omkring IMRaD-modellen

Centralt placerede figurer

Selvforklarende figurer

Kortfattet tekst

Tekst underbygges af figurer

Kommunikative virkemidler


Abstract

Abstract

Peter


Abstract oversigt titel introduktion metoder resultater diskussion

Titel

IMRaD

Introduktion

Metoder

Resultater

Diskussion

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion1

Beskrive rapporten så præcist som muligt

Skal ikke være for lang

Skal præsentere ”key words”.

Bandwidth Expansion of Narrowband Speech using Linear Prediction

Abstract Oversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion2

Beskrivelse af problemstillingen

Uddybelse af problem, så læseren ikke er i tvivl om hvad projektet handler om

Kan bruges som en ”appetitvækker”

”...,thus making the speech sound more realistic and pleasant”

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion3

Forklaring af brugte metoder

Forklaring af løsningsforslag

Inddrag ikke resultater i Metoder

Signal split into two parts....

LP coefficient → LSFcoefficient

LSF codebook

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion4

Forklaring af testmetode

Præsentation af relevante resultater, evt. Ikke alle resultater fra projektet.

”Spectrograms of the reconstructed wideband signal verified.....”

”Convergence measurements ranging.....”

Listening test

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion5

Opsummerer de mest relevante resultater

Diskuterer resultaterne

Diskuterer fremtidigt arbejde

”The algorithm for wideband expansion proved to work...”

”However, unwanted artefacts developed in the reconstruction af the wideband signal”

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Arbejdsmetodik og arbejdsblade

Arbejdsmetodik og arbejdsblade

Ole


Arbejdsmetoder

Projektet blev delt op i flere mindre dele

Hver del blev undersøgt og behandlet af 1-3 personer

Dele og grupper blev løbende revideret

Alle undersøgelser og behandlinger blev beskrevet i arbejdsblade

Arbejdsmetoder


Bandwidth expansion of narrow band speech using linear prediction

Codebook

LP

Envelope

analysis

extension

LP

synthesis

LP

Excitation

estimation

extension

Arbejdsblade

  • Excitation extension

  • Cepstral signal analysis for pitch detection

  • Pitch detection

  • Vector Quantization

  • Codebook training

  • Generating the codebook for speech enhancement

  • The K-means Clustering Algorithm

  • Overview of the human speech system

  • Framing and deframing

  • LPC modeling of vocal tract

  • Envelope and excitation evaluation

  • Listening test

  • Reflection Coefficients

  • Telephone filter

  • Line Spectrum Pairs


Envelope

Envelope

Brian


Envelope1

Vocal tract model

Line Spectrum Frequency

Codebook

Spectral distortion

Envelope


Vocal tract model

Vocal tract model


Line spectrum frequency

Line Spectrum Frequency


Codebook

Codebook


Spectral distortion

Spectral distortion

Mål : Spectral distortion < 1dB


Excitation

Excitation

Jakob


Bandwidth expansion of narrow band speech using linear prediction

Excitation Extension

  • Ønsket funktionalitet

  • Filtrering og opsampling

  • Rekonstruktion af residualsignal


Bandwidth expansion of narrow band speech using linear prediction

Ønsket funktionalitet

  • Rekonstrueret residualsignal lig originalt

  • Genskabe amplitudespektrum

  • Karakteristika

  • Filtreringsproblem


Bandwidth expansion of narrow band speech using linear prediction

Filtrering og opsampling

  • Telefilter

  • -HP-filter:fp = 300 Hzfs = 250 Hz

  • -LP-filter: fp = 3400 Hzfs = 3450 Hz

  • Residualfilter

  • -HP-filter:fp = 350 Hzfs = 300 Hz

  • -LP-filter: fp = 3350 Hzfs = 3400 Hz


Bandwidth expansion of narrow band speech using linear prediction

Rekonstruktion

  • Modulation

  • Addition af hvid støj


Bandwidth expansion of narrow band speech using linear prediction

Rekonstruktion

  • Addering af pitchfrekvens

  • Tilpasning af fase

  • Problem ved segmentoverlap

  • Forbedringer

  • Midling af pitch

  • Kalman-filter

  • Pitchdetektion af svage signaler


Gennemgang af artikel

Gennemgang af artikel

Bjarke


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Gennemgang

  • IMRaD

  • Indhold og opbygning af afsnit

  • Videnskabelig fremgangsmetode(r)

  • Særlig fokus på resultater / konklusion


Bandwidth expansion of narrow band speech using linear prediction

Problemstilling

Valg af løsnings-metode

Videnskabelig gen-nemgang af metoder

Vurdering af resultater

Undersøgelse af løsnings-metoder

Anvendelse af nye / kombination af eksisterende metoder

Test metoder og resultater af tests

Konklusion

Gennemgang af artikel

Artiklens opbygning


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Indhold

  • Kort beskrivelse af problemstilling

  • Anvendte metoder i løsning

  • Resultat


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Problemstilling

  • Telefonsystem båndbrede begrænset (300-3400 Hz)

  • Mål: Båndbrede på 80-8000 Hz

  • Løsning

  • Undersøgt eksisterende løsninger / ideer

  • - Problemstilling ikke løst

  • Arbejde videre med eksisterende idé

  • Mål: Finde / forbedre metoder til implementering af idé


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Eksisterende metoder

  • Anvendelse af metoder

  • Kombination af metoder

  • Nye ideer

  • LPC  LSF koefficienter

  • Anvendelse af kodebog

  • Modulation af residual signal


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Test metoder

  • Matematisk - Talstørrelse for godhed

  • Visuelt - Identificering af mangler

  • Lyttetest - Overordnet resultat

  • Mål med test

  • Sammenligne resultater

  • Identificering af problemer i metoder

  • Brugeres vurdering af metoder


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

  • Vurdering af resultater

  • Matematiske resultater

  • Visuelle resultater

  • Lyttetest resultater

  • Konklusion

  • Båndbredeudvidelse opnået

  • Metoder mangler videre udvikling

  • Spectral Distortion

  • - 5,3 < μ < 7,0 dB

  • - 2,4 < σ2 < 7,4 dB2

  • - Ingen spectral transparency (1,0 dB)

  • Forklaringer

  • - Kodebog er mangelfuld

  • - Sammenhæng mellem bånd utilstrækkelig

  • Spectrogrammer

  • - Tilføjet komponenter til øvre bånd

  • - Unvoiced lyd gengives ultilstrækkeligt i øvre bånd

  • - Sinus element tilføjet upræcist i nedre bånd

  • Forklaringer

  • - Envelope extension virker utilstrækkelig i øvre bånd

  • - Excitation extension virker utilstrækkelig i nedre bånd

  • A/B test

  • - Original telefon signal fortrukket

  • Forklaringer

  • - Artefakter introduceret i signal

  • - Utiltrækkelig gengivelse af unvoiced lyd


  • Login