Das korpus romanischer zeitungssprachen
This presentation is the property of its rightful owner.
Sponsored Links
1 / 34

Das Korpus romanischer Zeitungssprachen PowerPoint PPT Presentation


  • 76 Views
  • Uploaded on
  • Presentation posted in: General

Das Korpus romanischer Zeitungssprachen. Elisabeth Burr WiSe 2006/07. Das Korpus. geschaffen als Forschungsgrundlage heterogen Ausgaben wurden so aufgenommen, wie sie erschienen Texte als ganze fremdsprachliche, dialektale und diachronische Elemente wurden nicht aussortiert

Download Presentation

Das Korpus romanischer Zeitungssprachen

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Das korpus romanischer zeitungssprachen

Das Korpus romanischer Zeitungssprachen

Elisabeth Burr

WiSe 2006/07


Das korpus

Das Korpus

  • geschaffen als Forschungsgrundlage

  • heterogen

  • Ausgaben wurden so aufgenommen, wie sie erschienen

  • Texte als ganze

  • fremdsprachliche, dialektale und diachronische Elemente wurden nicht aussortiert

  • Porträt der tatsächlichen Kombination von stilistischen und sozio-kulturellen Varietäten

  • repräsentieren das vom Publikum erwartete komplexe sprachliche Wissen


Korpuserstellung

Korpuserstellung

  • http://www.uni-leipzig.de/~burr/CorpusLing/htm/Korpuserstellung/Vortrag.htm


Korpora subkorpora

Korpora & Subkorpora

  • Italienische Zeitungen - Deutsche Einigung 1989

  • Corriere della Sera(Zeitung)19., 20., 21.10.1989

  • Il Mattino(Zeitung)20., 21.10.1989

  • La Repubblica(Zeitung)20., 21.10.1989

  • La Stampa(Zeitung)20., 21.10.1989

  • Französische, italienische und spanische Zeitungen - Europawahlen 1994

  • Le Monde(CD-ROM)12./13., 14., 15.06.1994

  • Corriere della Sera(CD-ROM)13., 14., 15.06.1994

  • La Vanguardia (Magnetband)13., 14., 15.06.1994


Gr e der subkorpora

Größe der Subkorpora

  • Corriere della Sera258.287 Wortformen

  • Il Mattino171.501 Wortformen

  • La Repubblica174.958 Wortformen

  • La Stampa119.771 Wortformen

  • LeMonde236.236 Wortformen

  • Corriere della Sera303.641 Wortformen

  • La Vanguardia261.133 Wortformen


Das markup

Das Markup

  • COCOA

    • <S Politica> ist so lange gültig bis z. B. <S Interno> erscheint

    • <T Occhiello> ist so lange gültig bis z. B. <T Titolo> erscheint


Bibliographische informationen

Bibliographische Informationen

  • ReferenceVariableBeispiel

  • Zeitung<Z><Z La Vanguardia>

  • Ausgabe<E><E 130694>

  • Ausgeweisenheit<A>

  • signiert<A firmato>

  • anonym<A non firmato>

  • Autor/Autorin<N><N Tapia Juan>

  • Seite<C><C 01>

  • Sprache<L><L Inglese>


Sparten s

Sparten <S>

  • Sparte<S><S Politica>


Textart t

Textart <T>

  • Vorzeile<T Occhiello>

  • Schlagzeile<T Titolo>

  • Untertitel<T Sottotitolo>

  • Zusammenfassung<T Sommario>

  • Zwischenüberschrift<T Catenaccio>

  • Ankündigung<T Civetta>

  • Artikel<T Articolo>

  • 'Aufmacher'<T Spalla>

  • Fernseh-, Kinoprogramm<T Programma>

  • Filminhalt<T Film>

  • Glosse<T Corsivo>


Textart t cont

Textart <T> cont.

  • Interview<T Intervista>

  • Kolumne<T Rubrica>

  • Kritik<T Critica>

  • Kurzmeldung<T Flash>

  • Kurznachricht<T Breve>

  • Leitartikel<T Fondo>

  • Leserbrief<T Lettera>

  • Liste<T Elenco>

  • Nachricht<T Notizia>

  • Wetterbericht<T Tempo>

  • Buch-, Film-, Liedtitel, etc.<T Nome>

  • Bildunterschrift<T Foto>


Art des sprechens p

Art des Sprechens <P>

  • fortlaufender Text<P Prosa>

  • Zitat von schriftlichen Quellen<P Citazione>

  • mündliches Sprechen<P Discorso>

  • Frage im Interview<P Domanda>

  • Antwort im Interview<P Risposta>


Wiederholte rede r

Wiederholte Rede <r>

  • Redewendung, Sprichwort, etc.<r id>

  • restlicher Text<r nonid>


Italienisches korpus 1989

Italienisches Korpus 1989


Kodierung finiter verbformen

Kodierung finiter Verbformen

  • alle finiten Verbformen wurden kodiert

    $

  • Zahlencode statt COCOA

  • direkt und ohne blank vor dem das Paradigma bildenden Verb eingefügt

    je $I110a003chante

  • periphrastische Formen als Einheit gezählt (#)

    j’ai#$I111a001chanté


Zahlencode modi ebene

Zahlencode – Modi & Ebene

  • entsprechend Kategorien des romanischen Verbalsystems aufge­baut

    • setzt sich aus verschiedenen Ebenen zusammen

    • zusätzlich noch die Diathese (Aktiv / Passiv) berücksichtigt

    • differenziert sich zunächst in:

      C Konjunktiv <______ I Indikativ ______> B Imperativ

    • innerhalb der Modi Unterscheidung zwischen aktueller und inaktueller Ebene:

      aktuelle Ebene:1

      inaktuelle Ebene:2


Prim re perspektive

Primäre Perspektive

  • durch primäre Perspektive auf jeder Ebene abgegrenzte Zeiträume werden durch 1, 2 und 3 vertreten:

    Gegenwart bzw. parallele Perspektive1

    Vergangenheit bzw. retrospektive Perspektive2

    Zukunft bzw. prospektive Perspektive3


Sekund re perspektive

Sekundäre Perspektive

  • durch sekundäre Perspektive innerhalb der drei durch die primäre Perspektive abgegrenzten Zeiträume bestimmte Zeitpunkte werden durch die Zahlen 0, 1 und 2 repräsentiert

  • Kodierung drückt somit zugleich funktionelle Relationen aus, die zwischen den einfachen und den periphrastischen Tempora innerhalb ihres gemeinsamen Zeitraums und auf der gleichen Ebene bestehen:

    • Relation zwischen Präsens und passé composé

    • Relation zwischen Imperfekt und Plusquamperfekt


Sekund re perspektive1

Sekundäre Perspektive

  • parallel0

  • retrospektiv1

  • prospektiv2


Indikativ

Indikativ


Indikativ1

Indikativ

aktuelle Ebeneinaktuelle Ebene

einfache Tempora

je chanteI110je chantaisI210

je chantaiI120

je chanteraiI130je chanteraisI230

periphrastische Tempora

j’ai chantéI111j’avais chantéI211

je vais chanterI112j’allais chanterI212

j’eus chantéI121

j’aurai chantéI131j’aurais chantéI231


Konjunktiv

Konjunktiv


Das korpus romanischer zeitungssprachen

retrospektiv

parallel

prospektiv

chante

aie

chante

chanté

aktuelle Ebene

retrospektiv

parallel

prospektiv

chantasse

eusse

chantasse

chanté

inaktuelle Ebene


Konjunktiv1

Konjunktiv

aktuelle Ebeneinaktuelle Ebene

einfache Tempora

je chanteC110je chantasseC210

periphrastische Tempora

j’aie chantéC111j’eusse chantéC211


Imperativ

Imperativ

aktuelle Ebeneinaktuelle Ebene

einfache Tempora

chante B110


Aktiv passiv 4 stelle

Aktiv – Passiv – 4. Stelle

  • Aktiva

  • Passivp


Verbalperiphrasen

Verbalperiphrasen

  • 00temporalen Formen

  • 01être en train de (Winkelschau)

  • 02je viens faisant (retrospektive Schau)

  • 03je vais (en) faisant (prospektive bzw. komitative Schau / progressive Phase)

  • 04je continue à faire (kontinuative Schau / Phase)

  • 05être sur le point de (imminentielle / ingressive Phase)

  • 06se mettre à (inzeptive Phase)

  • 07je finis de faire (regressive Phase)

  • 08je viens de (egressive Phase)


Person

Person

  • keine Unterscheidung zwischen Singular und Plural

    • 1. Person1

    • 2. Person2

    • 3. Person3


Beispiele

Beispiele

je$I110a001chante

je suis en train de $I110a011chanter

j’ai$I111a001chanté

Auszug aus dem Korpus

beim Kodieren periphrastische Formen nicht durch # zu Einheit verbinden

Zahlenkode vor Paradigma-bildendes Verb

j‘ai $I111a001chanté et $I111a001mangé


Header

Header


Texte f r die bearbeitung

Texte für die Bearbeitung

  • http://www.uni-leipzig.de/~burr/Verb/French/2006_2007/Korpus.htm


Vorgehen

Vorgehen

  • Teilkorpus wählen

    • Le Monde 13.06.1994

    • zumindest 2 Sparten

    • als Textdatei (!) auf Festplatte speichern (eigenen Ordner „Korpus“ einrichten)

  • WordPad verwenden

    • WordPad aktivieren

    • Datei – öffnen – Dateityp Textdokumente – MS-DOS-Format (*.txt)

    • Sparte anklicken

    • geöffnete Sparte speichern unter

      • an bisherigen Namen z.B. _PC für Passato composé anhängen: M130694_Sport_PC)

      • aufpassen, dass Dateityp Textdokumente – MS-DOS-Format (*.txt)

      • Datei immer in WordPad öffnen

      • jedes Mal darauf achten, dass Dateityp Textdokumente – MS-DOS-Format (*.txt)

  • vorhandenes Markup nicht verändern

  • Zahlencode direkt vor die Formen der zu untersuchenden Verbalkategorie anfügen


Im moment

im Moment

  • nur ausprobieren

  • werde ein Teilkorpus ganz auseinander nehmen


Hilfreiches zum ausdrucken

Hilfreiches zum Ausdrucken

  • ausführlichere Beschreibung des Markup des Korpus von 1994


  • Login