Bandwidth expansion of narrow band speech using linear prediction
Download
1 / 40

Bandwidth Expansion of Narrow band Speech using Linear Prediction - PowerPoint PPT Presentation


 • 123 Views
 • Uploaded on

Bandwidth Expansion of Narrow band Speech using Linear Prediction. Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann. Group 742 Institute of Electronic Systems Department of Communications Technology

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Bandwidth Expansion of Narrow band Speech using Linear Prediction' - noble-parker


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Bandwidth expansion of narrow band speech using linear prediction

Bandwidth Expansion of Narrow band Speech using Linear Prediction

Bjarke Andersen, Jakob Dyreby, Brian Jensen, Frederik Holmelund

Kjærskov, Ole Lodahl Mikkelsen, Peter Drustrup Nielsen, Henrik Zimmermann

Group 742

Institute of Electronic Systems

Department of Communications Technology

Aalborg University, 2004


Agenda

Præsentation fra Semcon conference Prediction

Poster præsentation

Abstract

Arbejdsmetodik og arbejdsblade

Envelope

Excitation

Artikel

Agenda


Bandwidth expansion of narrow band speech using linear prediction

Todays Narrow band telephone systems Prediction

 • Bandwidth of speech is more than 8 kHz

 • Limited bandwidth of todays system

 • Too expensive to expand current telephone systems.

 • Expansion at the receiving end of the telephoneline


Bandwidth expansion of narrow band speech using linear prediction

Envelope Estimation Prediction

System overview

LSF

transform

Codebook

mapping

Inv. LSF

Transform

 • Transforms the LPC coefficients into LSF (Line Spectrum Frequency)

 • Codebook used for prediction of upper frequencies


Bandwidth expansion of narrow band speech using linear prediction

Excitation Estimation Prediction

 • Modulation moves the frequency

 • Pitch detection estimates the fundamental frequency


The result
The result Prediction

At the user

Public telephone system

Telephone

switch

Telephone

switch

Bandwidth

Expansion


Poster pr sentation

Poster præsentation Prediction

Frederik


Kommunikative virkemidler

Bygget op omkring IMRaD-modellen Prediction

Centralt placerede figurer

Selvforklarende figurer

Kortfattet tekst

Tekst underbygges af figurer

Kommunikative virkemidler


Abstract

Abstract Prediction

Peter


Abstract oversigt titel introduktion metoder resultater diskussion

Titel Prediction

IMRaD

Introduktion

Metoder

Resultater

Diskussion

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion1

Beskrive rapporten så præcist som muligt Prediction

Skal ikke være for lang

Skal præsentere ”key words”.

Bandwidth Expansion of Narrowband Speech using Linear Prediction

Abstract Oversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion2

Beskrivelse af problemstillingen Prediction

Uddybelse af problem, så læseren ikke er i tvivl om hvad projektet handler om

Kan bruges som en ”appetitvækker”

”...,thus making the speech sound more realistic and pleasant”

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion3

Forklaring af brugte metoder Prediction

Forklaring af løsningsforslag

Inddrag ikke resultater i Metoder

Signal split into two parts....

LP coefficient → LSFcoefficient

LSF codebook

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion4

Forklaring af testmetode Prediction

Præsentation af relevante resultater, evt. Ikke alle resultater fra projektet.

”Spectrograms of the reconstructed wideband signal verified.....”

”Convergence measurements ranging.....”

Listening test

AbstractOversigt Titel Introduktion Metoder Resultater Diskussion


Abstract oversigt titel introduktion metoder resultater diskussion5

Opsummerer de mest relevante resultater Prediction

Diskuterer resultaterne

Diskuterer fremtidigt arbejde

”The algorithm for wideband expansion proved to work...”

”However, unwanted artefacts developed in the reconstruction af the wideband signal”

AbstractOversigt Titel Introduktion Metoder Resultater DiskussionArbejdsmetoder

Projektet blev delt op i flere mindre dele Prediction

Hver del blev undersøgt og behandlet af 1-3 personer

Dele og grupper blev løbende revideret

Alle undersøgelser og behandlinger blev beskrevet i arbejdsblade

Arbejdsmetoder


Bandwidth expansion of narrow band speech using linear prediction

Codebook Prediction

LP

Envelope

analysis

extension

LP

synthesis

LP

Excitation

estimation

extension

Arbejdsblade

 • Excitation extension

 • Cepstral signal analysis for pitch detection

 • Pitch detection

 • Vector Quantization

 • Codebook training

 • Generating the codebook for speech enhancement

 • The K-means Clustering Algorithm

 • Overview of the human speech system

 • Framing and deframing

 • LPC modeling of vocal tract

 • Envelope and excitation evaluation

 • Listening test

 • Reflection Coefficients

 • Telephone filter

 • Line Spectrum Pairs


Envelope

Envelope Prediction

Brian


Envelope1

Vocal tract model Prediction

Line Spectrum Frequency

Codebook

Spectral distortion

Envelope


Vocal tract model
Vocal tract model PredictionCodebook
Codebook Prediction


Spectral distortion
Spectral distortion Prediction

Mål : Spectral distortion < 1dB


Excitation

Excitation Prediction

Jakob


Bandwidth expansion of narrow band speech using linear prediction

Excitation Extension Prediction

 • Ønsket funktionalitet

 • Filtrering og opsampling

 • Rekonstruktion af residualsignal


Bandwidth expansion of narrow band speech using linear prediction

Ønsket funktionalitet Prediction

 • Rekonstrueret residualsignal lig originalt

 • Genskabe amplitudespektrum

 • Karakteristika

 • Filtreringsproblem


Bandwidth expansion of narrow band speech using linear prediction

Filtrering og opsampling Prediction

 • Telefilter

 • -HP-filter: fp = 300 Hz fs = 250 Hz

 • -LP-filter: fp = 3400 Hz fs = 3450 Hz

 • Residualfilter

 • -HP-filter: fp = 350 Hz fs = 300 Hz

 • -LP-filter: fp = 3350 Hz fs = 3400 Hz


Bandwidth expansion of narrow band speech using linear prediction

Rekonstruktion Prediction

 • Modulation

 • Addition af hvid støj


Bandwidth expansion of narrow band speech using linear prediction

Rekonstruktion Prediction

 • Addering af pitchfrekvens

 • Tilpasning af fase

 • Problem ved segmentoverlap

 • Forbedringer

 • Midling af pitch

 • Kalman-filter

 • Pitchdetektion af svage signaler


Gennemgang af artikel

Gennemgang af artikel Prediction

Bjarke


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Gennemgang

 • IMRaD

 • Indhold og opbygning af afsnit

 • Videnskabelig fremgangsmetode(r)

 • Særlig fokus på resultater / konklusion


Bandwidth expansion of narrow band speech using linear prediction

Problemstilling Prediction

Valg af løsnings-metode

Videnskabelig gen-nemgang af metoder

Vurdering af resultater

Undersøgelse af løsnings-metoder

Anvendelse af nye / kombination af eksisterende metoder

Test metoder og resultater af tests

Konklusion

Gennemgang af artikel

Artiklens opbygning


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Indhold

 • Kort beskrivelse af problemstilling

 • Anvendte metoder i løsning

 • Resultat


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Problemstilling

 • Telefonsystem båndbrede begrænset (300-3400 Hz)

 • Mål: Båndbrede på 80-8000 Hz

 • Løsning

 • Undersøgt eksisterende løsninger / ideer

 • - Problemstilling ikke løst

 • Arbejde videre med eksisterende idé

 • Mål: Finde / forbedre metoder til implementering af idé


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Eksisterende metoder

 • Anvendelse af metoder

 • Kombination af metoder

 • Nye ideer

 • LPC  LSF koefficienter

 • Anvendelse af kodebog

 • Modulation af residual signal


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Test metoder

 • Matematisk - Talstørrelse for godhed

 • Visuelt - Identificering af mangler

 • Lyttetest - Overordnet resultat

 • Mål med test

 • Sammenligne resultater

 • Identificering af problemer i metoder

 • Brugeres vurdering af metoder


Bandwidth expansion of narrow band speech using linear prediction

Gennemgang af artikel Prediction

Abstract

Introduktion

Metoder

Resultater

Diskussion / konklusion

 • Vurdering af resultater

 • Matematiske resultater

 • Visuelle resultater

 • Lyttetest resultater

 • Konklusion

 • Båndbredeudvidelse opnået

 • Metoder mangler videre udvikling

 • Spectral Distortion

 • - 5,3 < μ < 7,0 dB

 • - 2,4 < σ2 < 7,4 dB2

 • - Ingen spectral transparency (1,0 dB)

 • Forklaringer

 • - Kodebog er mangelfuld

 • - Sammenhæng mellem bånd utilstrækkelig

 • Spectrogrammer

 • - Tilføjet komponenter til øvre bånd

 • - Unvoiced lyd gengives ultilstrækkeligt i øvre bånd

 • - Sinus element tilføjet upræcist i nedre bånd

 • Forklaringer

 • - Envelope extension virker utilstrækkelig i øvre bånd

 • - Excitation extension virker utilstrækkelig i nedre bånd

 • A/B test

 • - Original telefon signal fortrukket

 • Forklaringer

 • - Artefakter introduceret i signal

 • - Utiltrækkelig gengivelse af unvoiced lyd