1 / 19

Parameter und Prinzipien bei der Erstellung computergestützter Corpora

Parameter und Prinzipien bei der Erstellung computergestützter Corpora. Projekt Zb Leitung: Jochen Rehbein Mitarbeit: Kai Wörner Thomas Schmidt. syncWriter. HIAT-DOS. LAPSUS. Import-Filter. Eingabe- Schnittstelle. Datenbank. XML-Datenformat. HTML. RTF. Transkriptionseditor.

roana
Download Presentation

Parameter und Prinzipien bei der Erstellung computergestützter Corpora

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Parameter und Prinzipien bei der Erstellung computergestützter Corpora Projekt Zb Leitung: Jochen Rehbein Mitarbeit: Kai Wörner Thomas Schmidt

  2. syncWriter HIAT-DOS LAPSUS Import-Filter Eingabe- Schnittstelle Datenbank XML-Datenformat HTML RTF Transkriptionseditor

  3. Zusätzliche Annotation EXMARaLDA - Segmentierte Transkription SyncWriter EXMARaLDA- Basis- Transkription Datenbank HIAT-DOS EXMARaLDA- Listen- Transkription Verbmobil ACCESS / dBase

  4. X-Waves ESF syncWriter SHOEBOX TASX EUDICO Verbmobil CHILDES Animal Communication TALKBANK MATE Classroom Discourse DIDA EXMARaLDA syncWriter HIAT-DOS dBASE Verbmobil

  5. X-Waves ESF syncWriter SHOEBOX TASX- Annotator ELAN Verbmobil CHILDES Animal Communication TableTrans MATE Classroom Discourse PRAAT DIDA Partitur- Editor CLAN syncWriter HIAT-DOS dBASE Verbmobil

  6. 1. Vorhandene Datenbestände 5. Meta-Daten 4. Darstellung 3. Transkriptions- konventionen 2. Eingabe Parameter

  7. Vorhandene Datenbestände: HIAT-DOS 2. Eingabe: Praat / EXMARaLDA Partitur-Editor 4. Ausgabe: Partitur K5 - Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien 3. Transkriptionskonvention: HIAT‘

  8. E3 - Prosodische Beschränkungen zur phonologischen und morphologischen Entwicklung im bilingualen Erstspracherwerb • Vorhandene Datenbestände: 4th Dimension 2. Eingabe: Praat / EXMARaLDA Partitur-Editor + IPA-Tastatur 4. Ausgabe: Spaltendarstellung (?) 3. Transkriptionskonvention: IPA+

  9. [CV.CV] Konsonant/ Vokal [ma.ma] [BC.BC] Artikula- tionsort [NV.NV] Artikula- tionsart

  10. Vorhandene Datenbestände: syncWriter 2. Eingabe: EXMARaLDA Partitur-Editor 4. Ausgabe: Partitur E5 / K1 / K2 3. Transkriptionskonvention: HIAT‘

  11. 2. Eingabe: CLAN Editor 4. Ausgabe: CHAT-Zeilennotation CHILDES-Parameter 3. Transkriptionskonvention: Min-CHAT

  12. CHAT XCHAT EXMARaLDA XML

  13. Korpus enthält Subkorpora oder Korpusdaten XML-Container für Metadaten Korpusdaten

  14. Prinzipien Bird/Simons (2003): Seven Dimensions of Portability for Language Documentation and Description • Content: Coverage, Accountability, Terminology • Format: Openness, Encoding, Markup, Rendering • Discovery: Existence, Relevance • Access: Scope of access, Process for access, Ease of access • Citation: Bibliography, Persistence, Immutability, Granularity • Preservation: Longevity, Safety, Media • Rights: Terms of use, Benefit, Sensitivity, Balance

  15. Prinzipien Edwards (1992): Four principles for the use of archived data MacWhinney/Snow (1992): Four confusions regarding CHILDES • Maximum Readability / Minimum Bias • Consistent Encoding for Exhaustive Retrieval • Systematic Contrastiveness • Data Comparability

  16. Prinzipien Computergestützte Transkription • Transkription als Verschrift(lich)ung • “Transcription as theory” (Ochs 1979) • “Entity-Relationship Modelling” (Chen 1976) • “Texttechnologische Informationsmodellierung” (Lobin 2000) Computergestützte Transkription als Modellierung und Visualisierung gesprochener Sprache

  17. Prinzipien „Single Source, Multiple Target“ • Kein Allzweck-Werkzeug  Mehrere Werkzeuge für spezielle Zwecke, Datenaustausch zwischen Werkzeugen • Keine Allzweck-Darstellung  Mehrere Darstellungen für spezielle Zwecke, Berechnen von Darstellungen

  18. Fin.

More Related