1 / 31

Sisällöistä konteksteihin

Sisällöistä konteksteihin. – Kirjasampo ja semanttinen web. Eloseminaari sisällönkuvailusta 25.8.2010 Kaisa Hypén Kirjasampo-projekti Turun kaupunginkirjasto ja Kirjastot.fi kaisa.hypen@turku.fi. Vaasan kaupunginkirjasto. Esityksen aiheet:. Kirjasampo-hankkeen taustaa

kenna
Download Presentation

Sisällöistä konteksteihin

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sisällöistä konteksteihin – Kirjasampo ja semanttinen web Eloseminaari sisällönkuvailusta 25.8.2010 Kaisa Hypén Kirjasampo-projekti Turun kaupunginkirjasto ja Kirjastot.fi kaisa.hypen@turku.fi Vaasan kaupunginkirjasto

  2. Esityksen aiheet: • Kirjasampo-hankkeen taustaa • Kaunokki-ontologia ja Kirjasampo-SAHA - uudet sisällönkuvailun ja tiedontallennuksen välineet • Semanttinen verkko

  3. Kirjasampo-hankkeen taustaa Kuva: Ville Kettunen

  4. Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä • ”missä romaanissa on kuvaus Suurinkvisiittorista” • ”Daniil Harmsin tyyppistä satiiria” • ”runo yksinaruisesta keinusta” • ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’” • ”romaaneja, joissa veisataan virsiä” • ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä” • ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A-kirjaimella” • ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos” • …

  5. Ihmiskunnan muisti? Kuva: Päivi Autere

  6. Kirjasampo – • kaunokirjallisuuteen keskittyvä, semanttisia tekniikoita hyödyntävä palvelu, joka on • tiedonhaun apu • yhteisöllinen foorumi • uudenlainen käyttöliittymä kirjaston kokoelmiin Kirjasampo on osa opetusministeriön Arjen tietoyhteiskunta -ohjelmaa

  7. Perustiedot: HelMet • - Semanttinen • RDF-tietokanta • Kaunokirjallisuuden • metadataskeema • - FRBR-sovellus • Suomen- ja ruotsin- • kielinen aikuisten • kaunokirjallisuus Kirjasampo- SAHA Uutuus- seuranta: BTJ • Aineiston kuvailu: • - kuvailutietojen • rikastaminen • suosittelut • hiljainen tieto • long tail • Kirjastolaisten • yhteisö • Kirjasampo • ”kirjallisuuden kotisivu” • Lukijoiden yhteisö • monipuoliset haut • blogit • kirjallisuuskeskustelu • lukupiirit • … • Kulttuurisampo • ”äly & moottorit & mylly” • semanttiset tekniikat, • suosittelut • -yhteydet digitaalisiin • aineistoihin ja • verkkopalveluihin • - tägit • arviot • esittelyt • omat hyllyt • suosittelut

  8. Toteutusaikataulu • Esiselvitys 2007 – 2008 • Sisällöt, toiminnot, toimintaedellytykset • Tekniset ratkaisut • Ideointiryhmä, yhteistyöverkosto • Toteutusvaihe 2008 – 2011 • Teosrekisteri • Haku- ja käyttöliittymä • Sisällönkuvailijoiden verkosto • Osaksi yleisten kirjastojen tietoteknistä infrastruktuuria & kirjallisuusinstituutiota • Beta-versio keväällä 2011 www.kirjasampo.fi • Ylläpito ja kehittäminen 2011 – • Integrointi osaksi kirjastot.fi -palveluita • Palvelulla täysipäiväinen päätoimittaja • Tekninen tuki ja palvelinympäristö: www.kirjastot.fi

  9. Kaunokki-ontologia ja Kirjasampo-SAHA uudet sisällönkuvailun ja tiedontallennuksen välineet

  10. Ontologian määrittelyä • ontologiafil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja) • käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä • tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka • kuvaa järjestelmän käsitteet • järjestää käsitteiden väliset suhteet • on verrattavissa tesauruksiin ja indeksointiin (muk. Eija Airio)

  11. Asiasanasto / ontologia Asiasanastojen avulla tuotettu tieto edellyttää aina ihmisen tulkintaa. Asiasanasto > ontologia: • Asiasanaston termien analyysi, merkitysten ja keskinäisten • suhteiden määrittely. • Ontologian käsitteet yksilöidään urien avulla • koneluettavuus • linkitettävyys Asiasanastot ja tesaurukset kortistoajan sisällönkuvailuväline, ontologiat verkkomaailman

  12. Ontologiainfrastruktuuri • Suomessa kehitetty FinnONTO -hankkeessa 2003- 2010 http://www.seco.tkk.fi/ • Ontologiat käytettävissä ONKI-palvelimella http://www.yso.fi/onki2/?l=fi • Tällä hetkellä palvelimella on 83 ontologiaa tai asiasanastoa • Ontologiat integroitavissa sisällönkuvailu- ja hakuliittymiin • Kirjasammossa käytössä olevat ontologiat: • Kaunokki • KOKO • Lingvoj (kieli) • Paikkaontologiat (12 milj. paikkaa) > karttasovellukset • Aikaontologia > aikajanat • Kansallisuusontologia • Ontologiat yhdistetty tiedontallennusalustan kuvailukenttiin

  13. Mikä Kaunokki? • Fiktiivisen aineiston asiasanasto, n. 5 200 termiä • Kaikki kirjallisuudenlajit & elokuvat, aikuiset & lapset • Noudatettu YSAn periaatteita ja rakennetta – YSAa käytetty Kaunokin ohella kaunokirjallisuuden sisällönkuvailuun • Fasetit: genre, teema, aika, paikka, toimija • Ruotsinkielinen versio Bella • Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa • Taustalla Jarmo Saartin väitös Kaunokirjallisuuden sisällönkuvailun aspektit (Oulun yliopisto 1999) • Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot > monitulkintaisuus • Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille! • Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness” • Mitä saa kertoa, kuinka paljon paljastaa – tiedonhaun tarpeet

  14. Kokeilupainos v. 1996 1. vars. painos v. 2000 Verkko-Kaunokki v. 2007 Kaunokki-ontologia v. 2009

  15. Kaunokki-ontologia • Ontologisointi osana Kirjasampo–projektia, Katri Seppälän (TKK) ohjaus • Käsiteanalyysi, käsitteiden määritelmät ja niiden väliset suhteet ja hierarkiat, ripustus YSO:an. • Kaunokki-ontologia = yhdistelmäontologia, jossa mukana Kaunokin ja YSA:n termit ontologisoituna. • Integroitu annotointiohjelmaan > helppo poimia • Termin kontekstitiedot esiin > nähdään määritelmä, lähikäsitteet • Kieliriippumattomuus > sisällönkuvailu tehdään vain kerran suomeksi tai ruotsiksi, voidaan esittää jommallakummalla kielellä • Sisällöllisesti asiasanastot ja ontologia pyritään pitämään mahdollisimman identtisinä.

  16. Mikä SAHA3? • Selainpohjainen annotointi- eli dokumenttien kuvailujärjestelmä • Sovellus käyttäjille, jotka eivät tunne semanttisen webin tekniikoita eivätkä annotointiin liittyviä erityiskäsitteitä • Jaettavissa useiden käyttäjien kesken • Toimii web-palvelimella, ei edellytä asennuksia omalle työasemalle • Toteutettu Semanttisen laskennan tutkimusyksikössä (SeCo), Aalto-yliopisto • Dublin Core • Erilaisia ”sahoja”, räätälöitävyys tallennettavan tiedon ja sen käytön ja tarpeiden perusteella • Kirjasampo-SAHA: huomio fiktiivisen aineiston kuvailun erityispiirteisiin • SAHA<3

  17. Semanttinen verkko "Semantic web is so difficult to explain to people who are used to the Web. Before the Web, it was so difficult to explain to people what the Web was all about." - Tim Berners-Lee

  18. Semanttinen web… • Tavoitteena luoda internetiin metadatakerros, jonka avulla sen sisältöjä voidaan tunnistaa ja käsitellä koneellisesti aiempaa tehokkaammin • Semanttinen verkko, jossa dataa prosessoidaan monipuolisemmin • Tiedon kontekstualisointi, metadatan monipuolinen käyttö eri yhteyksissä – koneluettavuus ja linkitettävyys • Ontologioilla tässä keskeinen rooli: mm. niiden avulla kerrotaan, mitä sisältöjä missäkin on

  19. …ja Open Linked Data • From semantic web to web of data • Avoin data, tiedon yhdistely • Libris http://libris.kb.se/ • Richard Talis http://www.slideshare.net/rjw/semantic-web-libraries-ifla-2010 • Suomessa julkishallinnon tietoarkkitehtuurin tavoitteita: • Semanttisen webin, linkitetyn avoimen datan, paikkatietoinfrastruktuurin mahdollisuuksien yhteinen hyödyntäminen ja kehittäminen • Semanttinen yhteen toimivuus (tietojärjestelmä pystyy yhdistämään ja käsittelemään eri lähteistä saamaansa tietoa niin, että merkitys säilyy ja etsitty tieto löytyy) Anne Kauhanen-Simanainen: http://www.valtiokonttori.fi/public/default.aspx?contentid=34658

  20. How RDF(S) solves problems of XML and Literal Values? ... loc:Europe loc:partOf ... loc:Germany creationLocation vessels rdfs:subclassOf NBA_H26069_467 target cups target rdfs:subclassOf plates ... <artifact:artifact rdf:about=”&artifact;NBA_H26069_467” artifact:target_literal="cup and plate" artifact:material_literal="porcelain” artifact:creator_literal="Meissen” artifact:creationLocation_literal=”Germany”> <artifact:target rdf:resource="&artifacts;cups"/> <artifact:target rdf:resource="&artifacts;plates"/> <artifact:material rdf:resource="&materials;porcelain"/> <artifact:creationLocation rdf:resource="&locations;Germany"/> <artifact:creator rdf:resource="&actors;Meissen"/> </artifact:artifact> • Find all vessels? • Find all ceramic products? • Find artifacts manufactured in Europe? • Does the city of Meissen manufacture ceramics? Linkeddata.org

  21. www.kulttuurisampo.fi ja kaunokirjallisuus Kaunokirjallisuus testiaineistona Kulttuurisammossa: • mitä kirjallisuutta tiettyyn aiheeseen / paikkaan / henkilöön / kirjallisuudenlajiin liittyy, • mitkä teokset ovat "samankaltaisia" toistensa kanssa, • keiden kirjailijoiden tuotanto liittyy jollakin tavoin toisiinsa • semanttiset suosittelut, temaattiset yhteydet toimivat • tulokset rohkaisevia ja innostavia

  22. Lemminkäinen ja Sata naista

  23. Tiedontallennus 2.0? • Modernit verkkotekniikat + kirjastojen perinteinen tiedonhallinnan osaaminen = tiedontallennus 2.0 • Kortistoista verkon dynamiikkaan: tiedon linkittäminen, prosessointi ja aktiivinen tarjoaminen • Ontologiat: kytketään yhteen verkon palveluita ja sisältöjä • Monipuolisempi metadata – metadatan monipuolisempi käyttö • Esineen kuvailusta sisältöjen kuvailuun • Kirjaston tuottama metatieto uusissa yhteyksissä: muistiorganisaatioiden portaalit, oppimisympäristöt, matkailu- ja paikkatietopalvelut, mobiiliversiot… • Viitetiedon ilmaisuvoima semanttisessa verkossa • Enemmän ja parempia sisältöjä!

  24. Content king - Context is! no longer Lise Vandborg, Project Manager, Litteratursiden.dk

  25. Kiitos! Lue lisää: http://wiki.kirjastot.fi > Kirjasampo Kysy lisää: kaisa.hypen@turku.fi Kuva: Päivi Autere

More Related