1 / 7

FetchProt

FetchProt. Kristofer Franzén Swedish Institute of Computer Science Centrum för Genomik och Bioinformatik Metamatrix development & consulting AB. Problem. Kunskap om proteiners funktion kan vara opålitlig Få funktioner är experimentellt verifierade

Download Presentation

FetchProt

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FetchProt Kristofer Franzén Swedish Institute of Computer Science Centrum för Genomik och Bioinformatik Metamatrix development & consulting AB

  2. Problem • Kunskap om proteiners funktion kan vara opålitlig • Få funktioner är experimentellt verifierade • Baseras i stället ofta på strukturellt lika proteiners funktion • I flera led där det kan bli oklart vad som är verifierat • Kunskapen om experimentellt verifierad funktion finns oftast inte i databaser, men i text • Textmängderna är oöverblickbara

  3. Lösning • Att bygga infrastruktur för hantering och insamling av kunskap om proteiners funktioner direkt från text. • Genom att utveckla och applicera språk-teknologiska metoder för informationsextraktion ur vetenskaplig text från det molekylärbiologiska och biokemiska området. • Och att strukturera denna kunskap och göra den allmänt tillgänglig.

  4. Centrum för Genomik och Bioinformatik vid Karolinska Institutet (CGB) (Björn Ursing, Kwabena J. Sarfo) Databasen ExProt Expertkunskap (molekylärbiologi, bioinformatik) Swedish Institute of Computer Science (SICS) (Kristofer Franzén, Jussi Karlgren) Erfarenheterna från ”Proteinhalt i text” Proteinnamnsigenkännaren Yapex Expertkunskap (språkteknologi, informationsextraktion) Metamatrix (Patrik Hassel, Pär Lannerö) Expertkunskap (infrastruktur, agentprogrammering, databaser) Medverkande och deras roller

  5. ExProt CGB - KI Medline Hämta fulltext-artiklar Hämta aminosyra-sekvenser Fyll på med nya proteiner Sök i bibliografiska data Hitta och extrahera rätt data Utför lingvistisk analys SwissProt Veten- skapliga artiklar Där ute SICS Informations- extraktion Morfo- syntatisk analys

  6. Relation till annan forskning.

More Related