Sanastosta ontologiaksi
This presentation is the property of its rightful owner.
Sponsored Links
1 / 35

Sanastosta ontologiaksi PowerPoint PPT Presentation


  • 70 Views
  • Uploaded on
  • Presentation posted in: General

Sanastosta ontologiaksi. mikä muuttuu? Seinäjoen kaupunginkirjasto-maakuntakirjasto 4.11.2009 Kaisa Hypén. Ontologian määrittelyä. ontologia fil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja)

Download Presentation

Sanastosta ontologiaksi

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Sanastosta ontologiaksi

Sanastosta ontologiaksi

mikä muuttuu?

Seinäjoen kaupunginkirjasto-maakuntakirjasto 4.11.2009

Kaisa Hypén


Ontologian m rittely

Ontologian määrittelyä

  • ontologiafil. olevaisen perimmäistä olemusta tutkiva filosofian osa (Kielitoimiston sanakirja)

  • käsite on omittu tietohallintaan ja tekoälytutkimukseen, ja sillä on useita, toisistaan poikkeavia määritelmiä

  • ontologioilla keskeinen asema semanttisessa webissä

  • tässä: tesauruslähtöinen, tietokoneohjelmistojen näkökulmasta kehitettyä sisällönkuvailujärjestelmää, joka

    • kuvaa mikromaailman käsitteet / oliot

    • järjestää käsitteiden väliset suhteet

    • on formaali, eksplisiittinen ja yhdenmukainen

    • on verrattavissa tesauruksiin ja indeksointiin

      Eija Airio


Sanastosta ontologiaksi

Käsitteiden väliset suhteet kuvataan loogisella,

myös tietokoneen "ymmärtämällä" tavalla.

Funktio- eli assosiatiivinen

suhde

Koostumussuhde

Hierarkkinen suhde

Katri Seppälä: Käsiteanalyysi ontologiatyössä


Asiasanasto ontologia

Asiasanasto / ontologia

Asiasanastojen avulla tuotettu

tieto edellyttää aina ihmisen tulkintaa.

Asiasanasto > ontologia:

  • Asiasanaston termien analyysi, merkitysten ja keskinäisten

  • suhteiden määrittely.

  • Ontologian käsitteet yksilöidään urien avulla

  • koneluettavuus

  • linkitettävyys


Kaunokin ontologisointi

Kaunokin ontologisointi

  • Osa Kirjasampo –projektia Turun kaupunginkirjastossa, TKK:n ohjaus.

  • Protégé-ontologisointiohjelma.

  • Käsiteanalyysi, käsitteiden väliset suhteet ja hierarkiat, ripustus YSO:an.

  • Lisätään Kaunokin sisäistä hierarkkisuutta ja käsitteiden määritelmiä (esim. genret).

  • Kaunokin fasetit huomioitu ontologiassa.

  • Kaunokki-ontologia = yhdistelmäontologia, jossa mukana Kaunokin ja YSA:n termit ontologisoituna.

  • Sisällöllisesti asiasanasto ja ontologia pyritään pitämään mahdollisimman identtisinä.

  • käytettävissä ONKI-palvelimella


Esimerkki 1 kaunokin k sitteiden tarkempi m rittely

Esimerkki 1: Kaunokin käsitteiden tarkempi määrittely


Esimerkki 2 yhdist minen yso an

Esimerkki 2: yhdistäminen YSO:an

  • Kirjallisuus, YSOssa eritelty käsite

    • Kirjallisuus taidelajina

    • Kirjalliset teokset

    • Kirjallisuus erikoisalana

  • Kaunokki-ontologiassa noudatetaan YSOn logiikkaa, osittain eri kuin Kaunokissa


Esimerkki 3 lis merkityksi yso ssa oleville k sitteille

Esimerkki 3: lisämerkityksiä YSO:ssa oleville käsitteille

  • Lisämerkitys mm. näille YSO:n käsitteille:


Sanastosta ontologiaksi

  • Kaunokin myötäyhdistelmäontologioihin tulee runsaasti lisää

  • termejä erityisesti luokkiin

  • kulttuuriset ilmiöt

  • kulttuuriset tuotokset

  • mentaaliset ilmiöt

  • keskinäinen toiminta

  • sisäiset ja ulkoiset ominaisuudet


Summa summarum

Summa summarum

  • Pohjana sanasto, jonka termistö esitetään uudella tavalla

    • Uusi tapa ja menetelmä hahmottaa sanaston kokonaisuutta

    • Ontologiarakenne myös sanaston sisällöllisen kehittämisen työväline

  • Asiasanastot ja tesaurukset kortistoajan sisällönkuvailuväline, ontologiat verkkomaailman

  • Sanastot muodostavat hyvän lähtökohdan ontologioille, ontologiat kehittävät osaamista edelleen


Sanastosta ontologiaksi

Ontologiainfrastruktuuri, perusta luotu FinnONTO-hankkeessa (TKK) 2003-2007

KOKO

YSO

KAUNOKKI

AFO

MAO

VALO

TAO

Ontologisointi tehty

osana Kirjasampo-projektia.

Julkistus syyskuussa 2009.

...

...

Ontologiat käytettävissä ONKI-palvelimellahttp://www.yso.fi/


Miksi kirjastoissa pit isi tiet semanttisesta webist ja ontologioista

Miksi kirjastoissa pitäisi tietää semanttisesta webistä ja ontologioista?

  • Semanttinen web vahvistuu vähitellen?

  • Ontologiat vaikuttavat sisällönkuvailutyön käytäntöihin

  • Uudella tavalla tuotettu metadata on käytettävissä monipuolisemmin – kirjastot osaksi semanttista verkkoa?

  • Semanttinen verkko, jossa tietoja prosessoidaan aiempaa tehokkaammin

  • Mikä vahvistaa kirjaston roolia verkossa, auttaa myös fyysisessä kirjastossa


Ent p sitten k yt nn ss

Entäpä sitten käytännössä?

  • Mikä Saha?


Muumimamman meditatiivinen saha

Muumimamman meditatiivinen Saha?

  • Äiti sahasi sahaamistaan lempeässä

  • harmaassa ilmassa, hän mittasi pölkyt

  • täsmälleen yhtä pitkiksi ja järjesti ne

  • sievästi kaareksi ympärilleen. Puumuuri

  • kasvoi yhä korkeammaksi, ja lopulta äiti

  • sahasi pienessä tilassa, joka antoi hänelle

  • erinomaisen turvallisuuden tunteen…

  • Jakaranda ja palisanteri, mutisi äiti

  • hartaan tyytyväisenä ja jatkoi

  • sahaamistaan.

  • … Toiset olivat tottuneet sahaavaan

  • äitiin, jota näkyi yhä vähemmän puupinon

  • takaa… Lopulta pino tuli niin korkeaksi, että

  • äidistä näkyivät vain korvat. Mutta hän vain

  • sahasi sahaamistaan, ja joka aamu hän

  • kulki ympäri saaren ja kokosi uusia

  • laudanpätkiä.

  • Tove Jansson: Muumipappa ja meri.

  • Suom. Laila Järvinen.


Vai t llainen

… vai tällainen…


Sittenkin t llainen saha3

Sittenkin tällainen: SAHA3

  • Selainpohjainen annotaatiojärjestelmä

  • Sovellus käyttäjille, jotka eivät tunne semanttisen webin tekniikoita eivätkä annotointiin liittyviä erityiskäsitteitä

  • Jaettavissa useiden käyttäjien kesken

  • Toimii tietokoneen sijasta web-palvelimella

    (Valkeapää 2006, 35)


Kaunokki saha

Kaunokki-Saha

  • Semanttisen laskennan tutkimusyksikön kehittämä annotaatioeditori

  • Annotointi = kuvailusta käytetty termi semanttisessa webissä

  • Lähtökohtana kaunokirjallisuuden erityispiirteet

  • Erityistä huomiota

    • Sisällönkuvailuun

    • Osakohteiden tallennukseen

    • Teosten välisten yhteyksien esilletuomiseen

  • Funktionaalisen luetteloinnin piirteitä

    • Kukin teos yhtenä tietueena

    • Kieliversiot

  • Mukana myös kirjailijoihin liittyvää tietoa

    • Kehittyneemmät ja monipuolisemmat hakuehdot

  • Kun tallennetaan yhden teoksen tietoja, täydennetään samalla semanttista verkkoa


Sis ll nkuvailu kaunokki sahaan

Sisällönkuvailu Kaunokki-Sahaan

  • Kaunokki-ontologia integroitu Kaunokki-Sahaan

    • sisällönkuvailutermejä ei tarvitse etsiä erillisistä selaimista

    • käytettävissä YSOn ja Kaunokin käsitteet

    • sisällönkuvailu tehdään vain yhdellä kielellä, voidaan näyttää käyttöliittymässä/Sahassa halutulla kielellä (Kaunokki-ontologia: suomi, ruotsi, YSO: suomi, ruotsi, englanti)

  • Sisällönkuvailutyön perusteet eivät muutu, tiedontallennuksen ja –esittämisen välineet kyllä

  • Lukijat mukaan sisällönkuvailutyöhön?


Abstrakti ja fyysinen teos sahassa

Abstrakti ja fyysinen teos Sahassa

  • Abstrakti teos - kuvaillaan sitä, mikä on yhteistä kaikenkielisille ja eri formaateissa julkaistuille versioille

    • Sisällönkuvailu

    • Päävastuullinen tekijä

  • Fyysinen teos – kuvaillaan sitä, mikä liittyy kyseiseen kirjaan

    • Kirjaan liittyvät tekijät (kääntäjä, toimittaja, kuvittaja…)

    • Ulkoasu (sivumäärä, kansi…)

    • Julkaisuhistoria (kieli, kustantaja, ilmestymisaika…)

  • Ohje: http://wiki.kirjastot.fi/index.php/Kirjasampo-Sahan_ohjeistus


Mit kirjastoilta toivotaan miten kirjastot hy tyv t

Kaunokki-Sahassa suomenkielisen kaunokirjallisuuden perustiedot

Tarvitaan yhteistyötä vanhemman kaunokirjallisuuden sisällönkuvailuun

Kirjastot rakentavat yhdessä kaunokirjallisuuden tiedonhaun välinettä

Voimat yhdistämällä ja keskittämällä parempia tuloksia

Miten yhdessä tuotettu metadata on integroitavissa esim. kirjastojärjestelmiin?

Mitä kirjastoilta toivotaan? Miten kirjastot hyötyvät?


Kauno kirjallisuuden sis ll nkuvailu

Kauno- kirjallisuuden sisällönkuvailu

4.11.2009

Seinäjoki

Kaisa Hypén


Kirjastonhoitaja jouko raivion kirjaston kaunokirjallisuutta k ytt vien asiakkaiden tyypittely 1990

Kirjastonhoitaja Jouko Raivionkirjaston kaunokirjallisuutta käyttävien asiakkaiden tyypittely (1990)

  • tekijäorientoituneet: etsivät tietyn kirjailijan tuotantoa

    • apuna kokoelmatietokanta, tekijän mukaan järjestetyt kokoelmat

  • lajiorientoituneet: etsivät tiettyyn lajityyppiin kuuluvaa kirjallisuutta

    • apuna kokoelmatietokanta, jos kirjallisuutta on asiasanoitettu

    • apuna hyllyryhmittely, jos se on kirjastossa käytössä

  • aiheorientoituneet: etsivät kirjallisuutta tietystä aiheesta

    • apuna kokoelmatietokanta, jos kirjallisuutta on asiasanoitettu

    • apuna kirjaston henkilökunta, erilaiset hakemistot

      Näiden lisäksi erilaiset samoojat, etsijät, vanhoja lukukokemuksia

      kaipaavat, löytöjen tekijät, palautushyllyjen selaajat.


  • Sanastosta ontologiaksi

    Kaunokirjallisuuteen liittyviä tietopalvelukysymyksiä

    • ”missä romaanissa on kuvaus Suurinkvisiittorista”

    • ”Daniil Harmsin tyyppistä satiiria”

    • ”runo yksinaruisesta keinusta”

    • ”runo, josta asiakas muistaa ainoastaan ’yksinäisyys soittaa viuluaan’”

    • ”romaaneja, joissa veisataan virsiä”

    • ”romaaneja, joissa kuvataan työntekoa positiivisessa hengessä”

    • ”amerikansuomalaisen kirjoittajan kirjoittama romaani, jossa käytetään hienoa amerikansuomea ja se on suht vanha, ehkä 1960-luvulta. Tekijän etunimi alkaa ehkä A-kirjaimella”

    • ”turkin kielestä käännetty, turkkilaista surrealismia edustava teos, lienee kirjoitettu noin kolmekymmenluvulta, ruotsinnos tai suomennos”


    Kaunokirjallisuuden indeksoinnin perusteista

    Kaunokirjallisuuden indeksoinnin perusteista

    • Jarmo Saarti: Kaunokirjallisuuden sisällönkuvailun aspektit: kirjastoammattilaisten ja kirjastonkäyttäjien tekemien romaanien tiivistelmien ja asiasanoitusten yhdenmukaisuus. Väitöskirja, Oulun yliopisto 1999.

    • kirjallisuuden monitulkintaisuus, oman tulkinnan osuuden tunnistaminen

    • vaatii asiantuntemusta, yleissivistystä, genrejen sisäisten konventioiden tuntemusta

    • ns. genre-kirjallisuuden asiasanoitus: genren konventiot ohjaavat lukutapaa

    • ns. avoin (”laatu”) kirjallisuus: avoin useammille tulkinnoille


    Sanastosta ontologiaksi

    Mikä Kaunokki?

    • Fiktiivisen aineiston asiasanasto, n. 4 500 termiä

    • Kokeilupainos v. 1996, varsinainen asiasanasto v. 2000, verkkoversio v. 2007

    • Perustana Jarmo Saartin väitöskirja ja sisällönkuvailutyö Kajaanin kaupunginkirjastossa

    • Kattaa kaikki kirjallisuudenlajit, aikuisten ja lasten kirjallisuuden, elokuvat

    • Mukana jonkin verran kirjallisuudentutkimukseen liittyviä termejä

    • Noudatettu YSAn periaatteita ja rakennetta

    • Ruotsinkielinen versio Bella

    • Ylläpito ja kehittäminen Helsingin kaupunginkirjastossa, Kaunokki-työryhmä


    Sanastosta ontologiaksi

    Kaunokin erityisyydestä

    • Kaunokirjallisuuden luonne – teos omalakisensa taideluomus, kielen eri tasot (metaforisuus, konnotaatiot, vertaukset) > monitulkintaisuus

    • ”[Kirjallisuuden kieli] on aina ihmisenä olemista koskevan perustiedon kieltä.” (Rikama, 2007)

    • Kirjallisuuden aiheena voi olla mikä vain, sen käsittelytapa yksilöllinen > haasteita sanastoille!

    • Kohderyhmän vaikutus: lasten- ja aikuistenkirjallisuus

    • Kaunokirjallisuuden sisällönkuvailun luonne – ”aboutness”


    Kaunokin fasetit

    Kaunokin fasetit

    • Genre, laji, tyyli

    • Teema

    • Henkilö, toimija

    • Paikka, miljöö

    • Aika

    • Muut


    Genrest 1

    Genrestä (1)

    • genre ~ kirjallisuudenlaji, -luokka

    • genrejä satoja, uusia syntyy jatkuvasti

    • Kaunokissa n. 600 genreä, liittyvät niin kirjan muotoon (novellit) kuin sisältöön (filosofiset romaanit)

    • ”genrekirjallisuus” ~ viihdekirjallisuus (esim. dekkarit, naisten viihdekirjallisuus): ”ajanvietteeksi tarkoitettu kaunokirjallisuus, jolla ei ole kunnianhimoisia taiteellisia tavoitteita” (Otavan kirjallisuustieto 1990). Pyrkii noudattamaan genren vakiintuneita piirteitä, vastaamaan lukijan odotuksiin.

    • genrellä tärkeä merkitys teoksen markkinoinnissa, ja se ohjaa myös lukijan odotuksia, valintoja ja lukutapaa


    Genrest 2

    Genrestä (2)

    • genre kuvaa kokoavasti sitä, miten teoksessa käsitellään aiheita ja teemoja, mikä teoksen näkökulma kuvaamiinsa asioihin

    • teoksessa käytetyt kerronnan keinot, mikä teoksen tyyli on

      esim. sairaus motiivina dekkarissa tai elämäkerrallisessa romaanissa.

    • kaikkia nimekkeitä ei voi määritellä kuuluvaksi johonkin genreen - on romaaneja, joille voi luontevasti antaa useitakin genrejä

    • kaunokirjallisuuden hyllyryhmittely perustuu genreille


    Muut fasetit 1

    Muut fasetit (1)

    • aiheet, teemat, motiivit

      • ”aboutness”: mistä kirjassa on kyse

      • liittyy usein tarinaan, juoneen

      • vältettävä liikaa tulkintaa

      • keskeisimmät teemat, aiheet ja motiivit, myös sivuteemat, jos käsitelty

        aihe harvinainen

      • poimitaan ontologiasta

    • henkilöt, toimijat

      • teoksen keskeiset toimijat

      • ihmiset, eläimet, taruolennot, kyborgit… - poimitaan ontologiasta tai luodaan uusi, erityisesti nimetyt päähenkilöt

    • miljööt, tapahtumapaikat

      • todelliset, tunnistettavat paikat (maat, kaupungit, kylät)

      • fiktiiviset paikat (myyttien, tarujen paikat, avaruus…)

      • poimitaan ontologiasta (Kaunokki, paikkaontologia) tai luodaan uusi

      • tapahtumapaikat kannattaa indeksoida tarkasti, jos ne käyvät tekstistä

        ilmi


    Muut fasetit 2

    Muut fasetit (2)

    • tapahtuma-aika

      • tarkka aika (vuodet, päivä…)

      • ”sumea aika” (kesä, yö…) – poimitaan ontologiasta

    • muut kuvattavat seikat

      • esim. palkinnoille ja sovituksille Sahassa omat kentät

      • tähän kenttään on mahdollista tallentaa oma asiasana, jos ontologiasta ei löydy (harkintaa!)

    • asiasanayhdistelmät eli ketjut

      • toisiinsa liittyvät asiasanat, jotka eivät ole ontologiassa toistensa ylä- tai alakäsitteitä

        • esim. symboliikka : kivet

    • kuvaus

      • suorasanainen kuvaus teoksesta (esim. oma tiivistelmä, takakansiteksti, poiminta kritiikistä… lähde mainittava)


    Indeksoinnista viel

    Indeksoinnista vielä

    • yksityiskohtaisemmat ohjeet ks. Kaunokki s. 6-18

    • Kaunokin / Bellan lisäksi käytetty YSA Yleinen suomalainen asiasanasto ja Allärs Allmän tesaurus på svenska

    • indeksointi on aina subjektiivista, yksi näkemys teoksen sisältöön

      • erilaiset indeksoinnit samasta teoksesta, valitut asiasanat osattava perustella

      • yhtä ainoaa ”oikeaa” sisällönkuvailua ei ole!

    • Kirjasampo-Sahan pelisäännöt?

      • uusi, yhteisöllinen toimintatapa

      • erilaiset näkemykset, kompromissit, yhteisesti sovittavat käytännöt


    Ja ei kun testaamaan

    Ja ei kun testaamaan…


  • Login