1 / 16

Morphosaurus

Morphosaurus. Statusreport Mai 2005. Grundidee. Semantische Indexierung von medizinischern Dokumenten Verbesserung des Dokumentenretrievals Unterstützung sprachübergreifender Dokumentenrecherche Geeignetes Granularitätsniveau: “Subwörter”. kombin krank krohn lymph modal molekul multi

hashim
Download Presentation

Morphosaurus

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Morphosaurus Statusreport Mai 2005

  2. Grundidee • Semantische Indexierung von medizinischern Dokumenten • Verbesserung des Dokumentenretrievals • Unterstützung sprachübergreifender Dokumentenrecherche • Geeignetes Granularitätsniveau:“Subwörter”

  3. kombin krank krohn lymph modal molekul multi non operation ordn osis pankreas pankreat periton polyp projekt prophylakt punkt resekt schwerpunkt stell suppress thema therap ueber ulzer versus zeit ziel zyt zytokin abdomin adenom akut analys antibiot ausmass basis biolog blut chirurg chroni darm daten diagnost eingriff empfindlich entzuend epidemiolog express famili fap fein heredit hinsichtlich hnpcc immun indik iort itis karzin klin kolitis kolon Indexierungdurch Subwörter

  4. zzyqkk yzxqkz yzzqyz yyzqkq zkqkyz zkqzzk yzqkqq qxxkzy qqxkzx qqkxxq zkqzqz yyyzyk ykzyqk xzqqqz qkqkqz zxqkyy xkqqqy yyyzxk zxqkkq qkzzqq kzkzqk yqkqzz zqqzzy yqqkzq kqyzqq qqzzkk kyzykq qkkkyq xyzqkq qkqkqy qxxqky yxyqwx yyxqkx zzkqyz yyzqkq kkqkky qkqzzk yzxqkq qxqxkz qkqxkz kqxqqk kzzkqz yzqyyz yzkkzy xqkzqq yqqqkq xxzxqk zxkqqq qyyyzx kzxqkk kqkzzq kqqzkz yzqkqz zzqqzz yyyyyq kkqyzq qqkqzz kqkyzy yqqkkk kxyzqk zxqkyz kkzqxy qqkqkz Indexierungdurch Subwort – Synonymklassen-IDs {entzuend; itis} {pankreas; pankreat; bauchspeicheldrues} {periton; bauchfell}

  5. high tsh values suggest the diagnosis of primary hypo-thyroidism ... High TSH values suggest the diagnosis of primary hypo-thyroidism ... Orthografische Normalisierung Erhöhte TSH-Werte erlauben die Diagnose einer primären Hypothyreose ... erhoehte tsh-werte erlauben die diagnose einer primaeren hypothyreose ... Orthografische Regeln Original Zerlegungsalgorithmus Subwort-Lexikon Interlingua #up tsh #value #suggest #diagnost #primar #small #thyre Semantische Normalisierung hightsh value s suggest the diagnos is of primar y hypothyroid ism #up tsh #value #permit #diagnost #primar #small #thyre Subwort- Thesaurus er hoeh te tsh wert e erlaub en die diagnos e einer primaer en hypo thyre ose Sprachübergreifende Indexierung

  6. Morphosaurus - Komponenten Kernsystem • Subwort – Lexikon • Präprozessor • Segmentierer / Indexer • Suchmaschine Werkzeuge • Lexikon-Editor (Morphoedit) • Validierungstools

  7. Morphosaurus - Komponenten Experimentelle Komponenten: • Akronym-Lerner • Disambiguierer • Morphoogle • Dynamisches Dictionary • Tools zur automatischen Lexikonaquisition … basierend auf Ko-Okkurenzinformation aus großen mehrsprachigen Medizinkorpora

  8. Stand des Lexikons • Ca. 65 000 Einträge und 25 000 Äquivalenzklassen • Sprachen:DeutschEnglischPortugiesischSpanischSchwedischFranzösisch

  9. Partner • Medizinische Informatik Freiburg:Projektleitung, SW-Entwicklung und Pflege, Lexikonentwicklung • Computerlinguistik JenaHosting, wissenschaftliche Beratung • PUCPR Curitiba / BrasilienLexikonentwicklung, Entwicklung von Lexikonwerkzeugen • SemanticMining-PartnerLexikonentwicklung

  10. Aufgabenverteilung • Projektleitung: Stefan Schulz, Kornel Marko • Lexikon: Philipp Daumke, Susanne Hanser, Roosewelt Andrade + 4 Hiwis (D) + 3 Hiwis (Brasilien) + 1-2 (Schweden) • SW-Entwicklung: Kornel Marko, Philipp Daumke, Edson Pacheco, Jan Pätzold + Hiwis • Wissenschaft: Stefan Schulz, Kornel Marko, Philipp Daumke, Udo Hahn, Edson Pacheco • Externe Partner / Kunden:Kornel Marko, (Martin Romacker)

  11. Finanzierung • EU: NoE SemanticMining (bis 12/06) • DFG: KoMoDoRe (bis 03/06) • BMBF: Brasilien-Austausch (bis 12 / 06)

  12. Externe Partner Machbarkeitsstudien (im Gange): • ZbMED, Köln: Indexierung der Literaturdatenbank CCMed • Rhön-Kliniken (+ Siemens): “EPA-Google” • IS-GBE (Stat. Bundesamt / RKI) : Retrievalinterface für Materialien zur Gesundheitsberichterstattung (geplant) • HCPA (Porto Alegre, Brasilien): Recherche und Wissensextraktion aus elektronischer Patientenakte

  13. Potentielle Partner Termine mit: • TEMIS group (Text Mining) • Novartis (Martin Romacker in Text / Knowledge Management – Gruppe) • DIMDI

  14. SWOT - Analyse • Strengths • Weaknesses • Opportunities • Threats

More Related