1 / 30

Steve Pepper Chief Strategy Officer, Ontopia Convenor, JTC 1/SC 34/WG 3

Sømløs kunnskap for offentlig og privat. Om sammenkopling av informasjon og kunnskap (uten at sømmene synes). Why YOU need Published Subjects. Steve Pepper Chief Strategy Officer, Ontopia Convenor, JTC 1/SC 34/WG 3. Emnekart 2004 Oslo, 27. oktober 2004. Siden sist….

jenaya
Download Presentation

Steve Pepper Chief Strategy Officer, Ontopia Convenor, JTC 1/SC 34/WG 3

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sømløs kunnskap for offentlig og privat Om sammenkopling av informasjon og kunnskap(uten at sømmene synes) Why YOU need Published Subjects Steve Pepper Chief Strategy Officer, OntopiaConvenor, JTC 1/SC 34/WG 3 Emnekart 2004 Oslo, 27. oktober 2004

  2. Siden sist… • En rekke nye emnekart-baserte portaler • Flere andre typer emnekart-applikasjoner • F.eks. innen applikasjonsintegrasjon (se Stians presentasjon) • Hodejegere ute etter folk med emnekart-kompetanse • Stadig flere utlysninger nevner emnekart • Nå sist Skolenettet • Flere konsulentselskaper kaster seg over emnekart • Se deg rundt i salen  • Flere og mer modne verktøy å velge mellom • Se Kals presentasjon senere • Spennende nye anvendelser under oppseiling • FTs metadata-server • Applikasjoner innen eLæring

  3. Offentlig og privat sektor… • Så langt har de fleste applikasjoner vært relativt enkle • Størst fokus på forbedret gjenfinning av informasjon på nettsteder • Nøkkelegenskaper ved emnekart i disse anvendelser: • God model for strukturering av informasjon • Tilbyr effektive og intuitive navigasjonsveier • En internasjonal standard • De mest synlige anvendelser er i offentlig sektor • Men emnekart brukes også til bl.a. intranett-løsninger i privat sektor • De samme fordelene eksisterer begge steder • (det er bare viljen til å vise frem ting offentlig som er forskjellig!)

  4. I produksjon http://www.itu.nohttp://www.luna.itu.no(Utdanningsdepartementet) http://www.forskning.nohttp://www.nysgjerrigper.no(Forskningsrådet og partnere) http://forbrukerportalen.no(Forbrukerrådet) http://www.skifte.no(Forsvaret) http://www.hoyre.no++(Partiet Høyre) http://matportalen.no(Landbruksdepartementet) http://www.udi.no(Justisdepartementet) http://www.skatteetaten.no(Skatteetaten) Under utvikling Statsministerens kontor Statistisk Sentralbyrå IFE/Halden Kulturnett.no Norsk polarinstitutt Skolenettet Apollon … Noen emnekartportaler i Norge Under vurdering Norge.no Utdanning.no …

  5. Dette er bare begynnelsen… • Emnekart har flere egenskaper som etter hvert blir tatt i bruk • Disse gir muligheter som går langt utover forbedret navigering • Kontekstavhengighet • Håndteres gjennom “perspektiv” (scope) • Hoyre.no: 450 ulike portaler drevet av ett emnekart • Sammenkopling • Automatisk integrering av informasjon og kunnskaper fra ulike kilder • Danner grunnlaget for sømløs kunnskap

  6. Eksempel: Sammenkopling av portaler • Vi er inne i en YAP-tid (Yet Another Portal) • Og det blir ropt stadig høyere om “integrering” • Jo flere portaler, desto mer overlapper de hverandre • Ta disse tre portalene som eksempel: • De er tilfeldigvis alle sammen bygget på emnekart • forskning.no • Forskningsnettsted rettet mot unge voksne • forbrukerportalen.no • Forbrukerrådets nettsted • matportalen.no • Mattilsynets nettsted med fokus på sunn og trygg mat

  7. Genetically modified food at forskning.no

  8. Genetically modified food at Forbukerrådet

  9. Genetically modified foodstuffs at Matportalen

  10. Tre emnekartportaler – Ett felles tema  én “virtuell portal” med sømløs navigering på kryss og tvers Vel – dette er nå mulig, som følgende demo skal vise…

  11. Topic Rapping demo med Omnigator • To Omnigator-applikasjoner kjører på denne maskinen • Forskjellige browsere (Opera og Internet Explorer) • Forskjellige farger (Ontopia National Colours og Vive Québec) • Forskjellige navnpepperpoivre • Forskjellige emnekart (Italian Opera og Diverse emnekart om geografi) • Disse applikasjoner kjenner til hverandre • Og de støtter noe som heter TMRAP…

  12. Simulation of VISIT demo • View Topic Page for Japan in @pepper • Go to Manage page in @poivre and load Scripts and Languages • Reload Topic Page in @pepper • Links to Remote Topic Page automatically inserted • Click on VISIT and navigate to the Topic Page in @poivre • Go to Manage Page, load CIA World Factbook, go back to Japan Topic Page in @poivre, VISIT @pepper, note new Remote Topic Link… • etc. etc.

  13. Simulation of GET demo • View Topic Page for Japan in @pepper • Go to Manage page in @poivre and load both Scripts and Languages and CIA World Factbook • Reload Topic Page in @pepper • Links to Remote Topic Pages automatically inserted • Click on GET for each one and see the set of information be augmented by the addition of names, associations and occurrences from the remote topic maps.

  14. Observasjoner vedr. demoen • Demoen har vist at det er mulig å kople sammen portaler helt automatisk • Portalene kan selv oppdage når det finnes mer informasjon om et gitt tema • Lenkene kan legges inn uten menneskers hjelp (“VISIT”) • Man kan til og med utveksle informasjonsbiter om man vil (“GET”) • Vi har sett dette med to “portaler” basert på Omnigator… • Men det kunne også vært: • Matportalen og Forbrukerportalen… • Apollon og forskning.no… • To (eller flere) interne kunnskapsbaser innenfor en bedrift som Veritas eller Volvo… • Meyers Min side og en rekke offentlige databaser… • Kulturnett.no og Musikkinformasjonssenteret og Phonofile og Kunstnernes Informasjonskontor og Norsk forfattersentrum og Nasjonalbiblioteket og … • Din organisasjons intranett og diverse eksterne nettsteder… • osv. osv.

  15. Hva er det som skal til? • For eksisterende emnekart-portaler er det svært lite som skal til • Alle sammen har allerede gjennomført temabasert organisering av innholdet • Uten temabasert organisering av informasjon er sømløs kunnskaputenfor rekkevidden • Men det må ikke nødvendigvis være emnekart i bunnen • Utover det er det kun to brikker som må på plass (teknisk sett): • #1: En protokoll • for utveksling av informasjon, og • #2: En identitetsmekanisme • for å sørge for riktige koblinger • (Det må også eksistere et reelt ønske om å dele innhold, men det er en “politisk” sak)

  16. Ja. Min URL er: http://matportalen.no/Emner/gmo Portal A: forskning.no Portal B: Matportalen Brikke #1: Protokollen Hei! Kjenner du til temaet “genmodifisert mat”? http://matportalen.no/Emner/gmo Dette er kun et teknisk problem – og det er allerede løst. TMRAP (Topic Maps Remote Access Protocol) gjør det mulig. Dette er den enkle varianten (“VISIT”)

  17. Tja, litt av hvert.Vær så god, her får du det jeg har! Portal A: forskning.no Portal B: Matportalen En litt mer avansert variant (“GET”) Hei! Hva vet du om “genmodifisert mat”? Dette krever støtte for utveksling av emnekart-fragmenter og fletting (merging) av emnekart

  18. Brikke #2: Identitetsmekanismen • Enkelt uttrykt: • Hvordan kan en datamaskin vite at “genmodifisert mat” dreier seg om det samme som “genmodifiserte matvarer” (eller “genetically modified food”, eller “GM food” for den saks skyld)? • Å basere dette på navn er åpenbart utilstrekkelig • Synonymer, homonymer og polysemer gjør navn til et minefelt for datamaskiner • Synonymer(fører til lav “recall”) • Ett tema kan ha mange navn selv i ett språk • genmodifisert mat / genmodifiserte matvarer • Dessuten vil man gjerne støtte flere språk • genmodifisert mat / genetically modified food • Homonymer og polysemer(fører til lav “precision”) • Samme navn kan bety mange ting • Paris (Frankrike, Texas, Troja, botanikk, reality TV, …) • Hvis du har lurt på hvorfor søking på nett så ofte er utilfredsstillende er dette svaret!

  19. Løsningen er identifikatorer – ikke navn • Med identifikatorer behøver ikke datamaskiner bry seg om navn • Alle strukturerte datasystemer benytter identifikatorer • Problemet er at alle bruker forskjellige identifikatorer og mange identifikatorer har flere betydninger • For eksempel koden (identifikatoren) "no" kan bety Norge eller norsk • Krav til en god identifikator: • Må være unik • Må være global • Må være enkelt å definere • Må være enkelt å bruke • For å oppnå sømløs kunnskap trenger vi (intet mindre enn)unike, globale identifikatorer for alle temaer • En umulig oppgave? Faktisk ikke. Svaret finnes allerede. • Løsningen heter Published Subjects

  20. Men først noen ord om metadata, taksonomier, o.l. • Det vi nå skal snakke om har mye bredere betydning • Det dreier seg ikke bare om sammenkopling av emnekart-baserte portaler • Det dreier seg om integrasjon av informasjon og kunnskap i sin alminnelighet • Det er mye snakk for tiden om metadata (og om taksonomier og ontologier…) • Meyer-rapporten(MOD) snakker om behovet for felles metadata for å oppnå “elektronisk samhandling i offentlig sektor” • Brønnøysundregistrene (NHD) arrangerte nylig et seminar med internasjonal deltakelse om “semantisk interoperabilitet” • “å sikre at den presise betydningen av utvekslet informasjon er forståelig av en annen applikasjon” (og felles metadata sees på som sentralt) • Norsk digitalt bibliotek (KKD) arbeider med kartlegging av metadataformater fordi forbedret metadata er av avgjørende betydning for digitalisering av biblioteker • (Og disse er bare tuppen av isfjellet. Vent til dere hører om OLUF…) • Metadata, taksonomier og ontologier trenger også unike globale identifikatorer for å fungere • Published Subjects kan løse behovene for alle disse anvendelsene

  21. Hva er så Published Subjects? Eller skal vi si publiserte temaer på norsk? • Publiserte temaer er en distribuert mekanisme fortildeling av unike, globale identifikatorer • Denne mekanismen er basert på URLer • f.eks. Ibsenmuseet in Oslo: http://psi.kulturnett.no/museum/ibsen-museet • Mekanismen har to viktige (og unike) egenskaper: #1 Den er tosidig – den virker både for datamaskiner og mennesker #2 Den virker nedenfra og opp – ikke ovenfra og ned • Begge disse egenskaper er viktige…

  22. #1: For datamaskiner OG mennesker • Det er en selvfølge at dette skal virke for datamaskiner • Det er tross alt det som er hensikten: • Å gjøre det mulig for datamaskiner å avgjøre om to temaer er like • Det skjer ved at datamaskinen sammenligner URLene • Maskinen sammenligner simpelthen strengene: • http://psi.kulturnett.no/museum/ibsen-museet +http://psi.kulturnett.no/museum/ibsen-museet = OK • http://psi.kulturnett.no/museum/ibsen-museet +http://psi.kulturnett.no/museum/ibsen-huset = ikke OK • Men det skal også virke for mennesker • Fordi det er mennesker som i siste instans tildeler identifikatorer ved strukturering av informasjon • Det mennesket må kunne vite nøyaktig hvilket tema er representert av • http://psi.kulturnett.no/museum/ibsen-museet • f.eks. Ibsen-museet i Oslo eller Henrik Ibsen Museum i Skien • Det skjer ganske enkelt ved at man klikker på URLen • Resultatet er et dokument for forklarer betydningen av identifikatoren • Vi kaller dette dokumentet en indikator…

  23. subject subject identifier topic http://psi.kulturnett.no/museum/ibsen-museet Ibsen Museum Ibsen-museet: Leiligheten i Arbiens gate i Oslo hvor dikteren Henrik Ibsen bodde de siste 11 år av sitt liv, fra 1895 til 1906. http://psi.kulturnett.no/museum/ibsen-museet subject indicator Slik virker det… A subject is identified via a URL • The URL is called a subject identifier • Computers use the identifier Simple comparison of string values: Identical values mean that the subject is the same The URL is the address of a document • That document provides a human-interpretable indication of the identity of the subject • The document is called a subject indicator • Humans use the indicator By inspecting the document one can be sure that the identifier does not refer to, say, the Henrik Ibsen Museum in Skien

  24. Nok et forsøk på forklaring! Vi benytter forkortelsen “PSI” – som kan ekspanderes på to måter (og dermed avspeiler tosidigheten i mekanismen)

  25. #2: Nedenfra og opp, ikke ovenfra og ned • Tidligere forsøk på å lage globale identifikatorer ovenfra og ned har ikke fungert • Det klassiske eksempelet er URNer – Uniform Resource Names • Man må søke om “lov” til å opprette URNer hos IETF • I løpet av ca. 12 år er det kun gitt ca. 12 tillatelser • Publiserte temaer benytter motsatt tilnærming… • Hvem som helst kan lage en PSI ! • Prosessen virker nedenfra og opp • Anarkistisk og åpent – som web’en selv! • En evolusjonsaktig, darwinistisk utvelgelsesprosess vil finne sted • “De troverdigstes overlevelse” • Jo mer autoritativ utgiveren er, desto større sjanse det er for at dens identifikatorer blir gjenbrukt • Etterhvert vil stabile sett med troverdige identifikatorer oppstå • Norge kan være en pådriver i denne prosessen…

  26. Kulturnett.no og informasjonsallmenningen • I det nye Kulturnett.no legges det stor vekt på publiserte temaer • Nesten hvert eneste tema som publiseres på Kulturnett.no vil ha sin egen PSI • enten det er et “ontologisk” tema (dvs. en type) • museum http://psi.kulturnett.no/ontologi/museumperson http://psi.kulturnett.no/ontologi/personpostadresse http://psi.kulturnett.no/ontologi/postadressebor i http://psi.kulturnett.no/ontologi/bor_i • eller et hvilket som helst annet tema • Blaafarveværket http://psi.kulturnett.no/museum/blaafarvevaerketNesna folkebibliotek http://psi.kulturnett.no/bibliotek/2182800Gol bygdearkiv http://psi.kulturnett.no/arkiv/gol_bygdearkivErlend Loe http://psi.kulturnett.no/person/erlend_loe • Dette er Kulturnetts bidrag til Norges nasjonale kunnskapsbase… og til informasjonsallmenningen

  27. Published Subject Indicator for Publisert temaindikator for BLAAFARVEVÆRKET http://psi.kulturnett.no/museum/blaafarvevaerket Blaafarveværket: Norwegian museum in Modum kommune in Buskerud fylke based on the former cobolt mining industry. Once the leading factory of cobalt blue pigment in the world, Blaafarveværket is today a cultural museum. Its annual art exhibitions are among the most important in Scandinavia. Blaafarveværket: Museum på Modum i Buskerud basert på det gamle koboltgruveanlegget. Anlegget består av en rekke fredede bygninger som ligger på sitt opprinnelige sted. Her arrangeres konserter og utstillinger, blant annet av bildende kunst, og her finnes også bygdemuseets samlinger. Ψpsi

  28. Sømløs kunnskap – noen konklusjoner • Sømløs kunnskap betyr sammenkopling av informasjon og kunnskap på tvers av systemer – uten at sømmene synes • Perspektivene er lokale, nasjonale og globale • De viktigste forutsetninger er • Temabasert organisering av innhold • Bruk av Published Subjects til semantisk oppmerking • De som satser på emnekart vil stå på det tryggeste fundamentet • Følg eksemplene til bl.a. Kulturnett.no og Universitetet i Oslo (Apollon) • Norsk digitalt bibliotek, eNorge, ODIN, eStandard-prosjektet og andre bør være pådrivere for innføring og bruk av PSIer

  29. “Now! …. That should clear upa few things around here!” Semantisk oppmerking: En nødvendig forutsetning for å oppnå visjonen om sømløs kunnskap Og for øvrig så mener jeg at Norges nasjonale kunnskapsbase må baseres på emnekart!

More Related