slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut PowerPoint Presentation
Download Presentation
Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut

Loading in 2 Seconds...

play fullscreen
1 / 4

Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut - PowerPoint PPT Presentation


  • 112 Views
  • Uploaded on

Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut UNIVERSITÄT AUGSBURG. LeaP Korpus. erstellt 2001 bis 2003; Universität Bielefeld; Learning Prosody Projekt Lernerkorpus: L2 Englisch und L2 Deutsch (plus einige Muttersprachler)

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut' - selah


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

Das LeaP Korpus und

Pacx -

eine Plattform für annotierte Korpora in XML

Ulrike Gut

UNIVERSITÄT AUGSBURG

leap korpus
LeaP Korpus
  • erstellt 2001 bis 2003; Universität Bielefeld; Learning Prosody Projekt
  • Lernerkorpus: L2 Englisch und L2 Deutsch (plus einige Muttersprachler)
  • Gesamtgröße: 12 h; 131 Sprecher mit 32 unterschiedlichen L1s; vier Sprechstile
  • vielfältige Annotationen und Metadaten (IMDI Format); Text-Ton-aligniert
  • Datenformat XML-basiert (TASX)

http://www.philhist.uni-augsburg.de/lehrstuehle/anglistik/applied/Research/leap/

annotationen im leap korpus
Annotationen im LeaP Korpus
  • 8 tiers
  • Intonationsphrasen und nicht-sprachliche Ereignisse
  • orthographische Transkription von Wörtern
  • phonemische Transkription in SAMPA von Silben
  • Segmente (Konsonanten und Vokale)
  • Intonation (ToBI), Tonumfang
  • Lemmata, POS
  • Reliabilität der manuellen Annotationen überprüft (Gut & Bayerl 2004)
pacx platform for annotated corpora in xml
Pacx – Platform for annotated corpora in XML
  • Integrierte Plattform zur Korpusannotation (in XML), -suche und -distribution
  • Eclipse, Vex, Versionskontrolle (Subversion)
  • Spezifikation von Annotationsschema
  • Annotation mit XML-Editor Vex
  • Build-Corpus-Skript: führt Anfragen und Tests durch, erzeugt Korpus und Webpage mit Links zu Rohdaten und Transkriptionen
  • Integration von ELAN geplant (Annotation von gesprochener Sprache)

http://pacx.sourceforge.net/