1 / 32

Entwicklung eines Systems zur Diskurstranskription auf dem Computer

Entwicklung eines Systems zur Diskurstranskription auf dem Computer. Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg. Grafik (umg. Partitur). syncWriter. syncWriter-Daten (binär). Segmentliste. Datentypen: Transkript.

hadar
Download Presentation

Entwicklung eines Systems zur Diskurstranskription auf dem Computer

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg

  2. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste

  3. Datentypen: Transkript MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------

  4. Datentypen: Transkript  Äußerungsdatenbank MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------ ?

  5. Darstellungstypen: vertikale Darstellung MAX:[gestikuliert] Du fällst mir immer <ins Wort>1. TOM:[grinst] <Stimmt ja>1 wohl gar nicht. MAX:[schlägt die Hände vors Gesicht] ((1 sec)) Siehst Du, Du hast es schon <wieder getan>2. MIA: <Er hat schon>2 recht, Tom.

  6. Darstellungstypen: vertikale Darstellung  Spaltendarstellung MAX:[gestikuliert] Du fällst mir immer <ins Wort>1. TOM:[grinst] <Stimmt ja>1 wohl gar nicht. MAX:[schlägt die Hände vors Gesicht] ((1 sec)) Siehst Du, Du hast es schon <wieder getan>2. MIA: <Er hat schon>2 recht, Tom. ?

  7. Darstellungstypen: Spaltendarstellung  Partiturdarstellung MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------ ?

  8. Darstellungsformate: HTML

  9. Darstellungsformate: HTML --> RTF ?

  10. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste

  11. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge

  12. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge andere Datenformate

  13. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge andere Datenformate andere Betriebssysteme

  14. Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste ? andere Werkzeuge andere Datenformate andere Betriebssysteme

  15. „Single Source, Multiple Targets“ vertikale Darstellung: RTF vertikale Eingabe (XML)- Datenformat Spalten-Darstellung: HTML Spalten-Eingabe Partitur-Darstellung: PDF Partitur-Eingabe ... ... Datenbank andere Transkriptionsformate andere Werkzeuge

  16. Bird / Liberman: ANNOTATION GRAPHS MAX / v / „Du fällst mir immer“ MAX / v / „ins Wort“ t1 t2 t3 t0 TOM / v / „Stimmt ja“ TOM / v / „wohl gar nicht.“ TOM / nv / „grinst.“ MAX / nv / „gestikuliert“

  17. Struktur einer Diskurstranskription: Zeitachse und Ereignisse t0 < t1 < t2 < t3 < t4 < t5 < t6

  18. MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------

  19. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ • sprachspezifische lateinische Zeichen: • deutsch: Ä Ö Ü ß • französisch: ç è é ê ë • schwedisch: å æ ø [...] • nicht-lateinische Alphabete • kyrillisch: Љ Ћ ю • griechisch: α β γ θ • IPA [...] • CJK-Schriftsysteme • ...

  20. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“  UNICODE

  21. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“  UNICODE • Problem: „Softwareabhängigkeit“

  22. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“  UNICODE • Problem: „Softwareabhängigkeit“ XML

  23. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“  UNICODE • Problem: „Softwareabhängigkeit“ XML • Problem: „Plattformabhängigkeit“

  24. Technologien zur Implementierung • Problem: „Sprachabhängigkeit“  UNICODE • Problem: „Softwareabhängigkeit“ XML • Problem: „Plattformabhängigkeit“ JAVA

  25. XML-Datenformat

  26. Eingabe- Schnittstelle XML-Datenformat

  27. Eingabe- Schnittstelle XML-Datenformat HTML RTF

  28. Eingabe- Schnittstelle XML-Datenformat HTML RTF

  29. Eingabe- Schnittstelle andere Anwendungen XML-Datenformat HTML RTF

  30. Eingabe- Schnittstelle andere Anwendungen XML-Datenformat HTML RTF (Partitur-) Transkriptionseditor

More Related