O metapodatkih
This presentation is the property of its rightful owner.
Sponsored Links
1 / 21

O METAPODATKIH PowerPoint PPT Presentation


  • 76 Views
  • Uploaded on
  • Presentation posted in: General

O METAPODATKIH. Jernej Južna. Poletna šola COLOS 1. julij 200 8. MOTIV. Količina mojih podatkov v letu in pol 58 GB podatkov 156 000 datotek 70 000 slikovnih “ le” 10 000 fotografij 55 000 tekstovnih “le” 2 000 uporabnih 1 000 zvočnih 300 video Kako se znajti v tej množici?.

Download Presentation

O METAPODATKIH

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


O metapodatkih

O METAPODATKIH

Jernej Južna

Poletna šola COLOS

1. julij 2008


Motiv

MOTIV

  • Količina mojih podatkov v letu in pol

    • 58 GB podatkov

    • 156 000 datotek

      • 70 000 slikovnih

        • “le” 10 000 fotografij

      • 55 000 tekstovnih

        • “le” 2 000 uporabnih

      • 1 000 zvočnih

      • 300 video

        Kako se znajti v tej množici?


Motiv ii

MOTIV (II)

  • So direktoriji in poimenovanje dovoj?

    • Primer: zbirka fotografij

      • po datumu nastanka

      • imenu dogodka

      • po avtorju

  • Problemi

    • Katere slike so dobre?

    • Kaj prikazuje slika img_5043.jpg?

  • Drugačna klasifikacija vodi v podvajanje


Mo na re itev

MOŽNA REŠITEV

  • Uporaba metapodatkov

    • podpora na nivoju datotečnega sistema

      • trenutno le delno realizirano (najbljižje je MacOS)

    • podpora na nivoju datoteke

      • različni metapodatki za različne podatke

    • uporaba namenskih programov

      • zgradijo digitalno knjižnico


Kaj so metapodatki

KAJ SO METAPODATKI?

  • podatki o podatkih oz. informacije o vsebini

    • dajejo pomen podatkom

    • opisujejo/razvrščajo vsebino

1234

46,044739

Franc

car


O metapodatkih

KAJ SO METAPODATKI?

  • podatki o podatkih oz. informacije o vsebini

    • dajejo pomen podatkom

    • opisujejo/razvrščajo vsebino

  • poštna številka Mengša

  • letnica

1234

geografska širina fakultete

46,044739

najpogostejše ime v Sloveniji

Franc

  • angleška beseda za avto

  • ruski vladar

car


Uporaba metapodatkov

UPORABA METAPODATKOV

  • lažje/boljše/hitrejše iskanje

    • lažje definiranje kriterijev

    • boljše filtriranje

  • klasifikacija/taksonomija (predalčkanje)

  • zmanševanje semantičnega prepada

    • računalniku omogočajo »razumevanje« vsebine

  • računalniška forenzika

    • (skriti) metapodatki kot dokaz


Pridobivanje metapodatkov

PRIDOBIVANJE METAPODATKOV

Delitev glede na “kdo jih ustvarja”

avtorji in strokovnjaki za indeksiranje

strojno pridobivanje

folksonomija in družbeno označevanje

Delitev glede na “kdaj se ustvarjajo”

pred uporabo (a priori)

po uporabi (a posteriori)


Pridobivanje metapodatkov ii

PRIDOBIVANJE METAPODATKOV (II)

Avtorji

najbolj poznajo vsebino

lahko dodajajo sproti

običajno ne poznajo klasifikacije

Strokovnjaki za indeksiranje

poznajo klasifikacijo in sistem

lahko preverijo že vpisane metapodatke

dragi in počasni


Pridobivanje metapodatkov iii

PRIDOBIVANJE METAPODATKOV (III)

Strojno pridobivanje

hitro in poceni

natančen za tehnične podatke

še ni primerno za področja, kjer je potrebno “razumevanje”


Pridobivanje metapodatkov iv

PRIDOBIVANJE METAPODATKOV (IV)

Folksonomija (folksonomy) in družbeno označevanje (social tagging)

taksonomija, ki jo ustvarijo uporabniki

uporaba prostih oznak (tag)

uporabniki si jih delijo med seboj

ni nadomestilo za klasično taksonomijo

problem končnic, sopomenk

potrebna kritična masa uporabnikov


Metapodatki dokumentov

METAPODATKI DOKUMENTOV

  • naslov, avtor, ključne besede, opis, ...

  • datum zadnjega urejanja, št. sprememb, ...

  • MS office, Adobe pdf, OO odf, ...

meta:generator

dc:title

dc:description

dc:subject

meta:keyword

meta:initial-creator

dc:creator

meta:printed-by

meta:creation-date

dc:date

meta:print-date

dc:language

meta:editing-cycles

meta:editing-duration


Metapodatki web strani

METAPODATKI WEB STRANI

  • omogoča že sam standard HTML

    • značke: <title>,<meta>,<h1>, ...

    • atributi: alt, rel, ...

  • RDF (Resource Description Framework) (1999)

    • oznaka vsebine s posebnimi značkami

    • RSS (really simple syndication/RDF site summary)


Metapodatki web strani ii

METAPODATKI WEB STRANI (II)

sistem del.icio.us (2003)

uporabniki si ustvarjajo svoje zaznamke

zaznamke opišejo s (poljubnimi) tagi

sistem družbenih zaznamkov

lažje iskanje strani s podobno tematiko

iskanje ljudi s podobnimi interesi


Metapodatki slik

METAPODATKI SLIK

JPEG - EXIF (1998)

  • velikost, način zapisa, dpi, ...

  • čas zajema, model fotoaparata, thumbnail, ...


Metapodatki slik ii

METAPODATKI SLIK (II)

  • sistem flickr (2004)

    • uporabniki objavljajo svoje fotografije

    • fotografije opišejo s (poljubnimi) tagi

    • podobna funkcionalnost kot del.icio.us

  • sistem Panoramio (2005)

    • opremljanje fotografij z geo-podatki

    • uporaba v Google Earth


Metapodatki slik iii

METAPODATKI SLIK (III)


Metapodatki zvoka

METAPODATKI ZVOKA

  • standard CD ne podpira metapodatkov

    • razširitev CD-Text (1996)

  • sistem CDDB (1993)

    • podatki o (praktično vseh izdanih) CD-jih

    • izvajalec, naslov, leto, ...

  • ID3 zapis

    • uporaba pri mp3

    • izvajalec, naslov, album, ...


Prihodnost

PRIHODNOST

  • Eksplozija digitalnih podatkov

    • v letu 2007 ocenjena velikost digitalnega vesolja: 281 exabajtov (1 exabyte = 1 milijon terabytov)

    • exponentna rast

predvidena rast količine podatkov


Prihodnost ii

PRIHODNOST (II)

  • Podpora metapodatkom na nivoju OS

    • koncept enega direktorija

  • Razvoj sistemov za razumevanje

    • avtomatski opisni metapodatki

      • ključne besede, opisi, ...

    • razpoznavanje motivov na sliki

    • iskanje po melodiji


Za konec

ZA KONEC

  • Zaključek

    • iskanje zelo pomembno (podatkovna džungla)

    • format sam naj podpira zapis metapodatkov

    • čimveč metapodatkov naj se ustvari samodejno

  • Viri

    http://en.wikipedia.org/wiki/...(poljubna kratica )

    http://en.wikipedia.org/wiki/Category:Metadata


  • Login