1 / 29

B a k a l á r s k a p r á c a

Geokódovanie mediálnych správ. B a k a l á r s k a p r á c a. Autor: Peter Nemec Vedúci bc. práce: doc. Dr. Ing. Jiří Horák. Úvod. Priestorový charakter mediálnych správ Lokalizácia udalostí Priestorová rozšírenosť spravodajstva. Ciele projektu.

darva
Download Presentation

B a k a l á r s k a p r á c a

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Geokódovanie mediálnych správ B a k a l á r s k a p r á c a Autor: Peter Nemec Vedúci bc. práce: doc. Dr. Ing. Jiří Horák

  2. Úvod • Priestorový charakter mediálnych správ • Lokalizácia udalostí • Priestorová rozšírenosť spravodajstva

  3. Ciele projektu • Spracovanie textu z titulkov spravodajstva • Geokódovanie automatizované • Geoparsing • Vytvorenie mapy správ • Posúdenie priestorovej distribúcie spravodajstva • Zber a zobrazovanie správ týkajúcich sa záujmového miesta (oblasti)

  4. Geokódovanie • Umiestnenie objektov do mapy • Geokód • Referenčná vrstva Ostrava 37 Nádražní ulice 136 East Birmingham Drive, 93562 1 Chapel Hill Heswall Kamenné nám. 46, Bratislava

  5. Geoparsing • Metóda podobná geokódovaniu • Informácie o polohe v neštruktúrovanej forme • Jednoznačná identifikácia 40 km západne od Brna Bělkovice-Lašťany neďaleko Olomouca Petrovice v okrese Blansko

  6. Základný koncept Analýzy Záznamy správ RSS kanál - čt24 rubrika regionální Geokódovanie (geoparsing) Mapy Zoznam obcí (referenčná tabuľka) UIR - ZSJ

  7. Ukážka RSS kanálu

  8. Zber správ Zlínská policie kontrolovala taxikáře Zlín - Policie na Zlínsku při nočním zátahu kontrolovala, jestli taxikáři nejezdí načerno nebo opilí. Hlavním impulzem pro kontroly se stala nedávná tragédie, která se odehrála ve Vizovicích, kde jednaosmdesátiletý důchodce zemřel pod koly taxíku, jehož řidič řídil načerno a bez jakéhokoli řidičského oprávnění. http://www.ct24.cz/regionalni/8864-zlinska-policie-kontrolovala-taxikare/ Sat, 15 Mar 2008 15:43:00 +0100 zber.php

  9. Tvorba zoznamu miest Duplicita názvov obcí Špecifické názvy so zátvorkou Názvy s rímskou číslicou

  10. Tvorba zoznamu miest – pády • Lemat slova+ zoznam pádových koncoviek • Ostrava, Ostravy, Ostravě, Ostravou pady.php

  11. Geokódovanie mediálnych správ geocoding.php 1 2 1

  12. Prepojenie • Výsledkom je tabuľka prepojení • Ohodnotenie významnosti výskytu (domicil)

  13. Geoparsing mediálnych správ geoparsing.php

  14. Rola užívateľa • Výber oblasti záujmu • Editácia slovných tvarov (nepovinne) • Zber a zobrazovanie správ

  15. Editácia slovných tvarov

  16. čt24 RSS Zber správ Geokódovanie Agregácia UIR-ZSJ + Vizualizácia UŽÍVATEĽ

  17. Mapa správ Dáta získané z RSS kanálu ČT24 za obdobie: 1.12.2007 – 12.4.2008

  18. Počet správ na 100 000 obyv. - okresy Dáta získané z RSS kanálu ČT24 za obdobie: 1.12.2007 – 12.4.2008

  19. Počet správ na 100 000 obyv. - kraje Dáta získané z RSS kanálu ČT24 za obdobie: 1.12.2007 – 12.4.2008

  20. Počet geokódovaných správ - okresy Dáta získané z RSS kanálu ČT24 za obdobie: 1.12.2007 – 12.4.2008

  21. Počet geokódovaných správ - kraje Dáta získané z RSS kanálu ČT24 za obdobie: 1.12.2007 – 12.4.2008

  22. Ukazovateľ pravidelnosti výskytu správ • Vyhodnotenie distribúcie vzdialeností • Výpočet na základe indexu NNI: podiel medzi pozorovanou a očakávanou minimálnou strednou vzdialenosťou medzi udalosťami NNI = 0 ... zhluková vzorka NNI = 1 ... čisto náhodná vzorka maximálna hodnota NNI – pravidelne rozptýlená vzorka

  23. UPVS

  24. Vyhliadky do budúcnosti • Optimalizácia geokódovania • Rozšírenie vyhľadávania o časti obce • Možnosti vizualizácie na webe • Lokalizácia zvukovej, obrazovej informácie

  25. Použité dáta a technológie • RSS kanál ČT24 • UIR – ZSJ • ArcCR 500 • PHP, MySQL, HTML, CSS • ArcGIS, MS Access

  26. Literatúra • ARCDATA PRAHA: ArcČR 500 – Novinky ve verzi 2.0. [online]. 2007 Dostupné na internete: <http://www.arcdata.cz/data/arccr#novinky20>. • MINISTERSTVO OBRANY ČR: Vojenské újezdy. [online]. 2007 Dostupnéna internete: <http://www.army.cz/scripts/detail.php?id=215> • THE BERKMAN CENTER FOR INTERNET & SOCIETY AT HARVARD LAW SCHOOL: RSS 2.0 Specification. [online]. 2008 Dostupné na internete: <http://cyber.law.harvard.edu/rss/rss.html#requiredChannelElements> • RSS SPECIFICATIONS: History of RSS. [online]. 2008 Dostupné na internete: <http://www.rss-specifications.com/history-rss.htm> • HOLZNER, Steve- Šindelář, Jan.: RSS: Automatické doručování obsahu vašich WWW stránek. Brno: Computer Press, 2007. 278 s. ISBN 978-80-251-1479-7 • BELLA, T: Prvá slovenská mapa spravodajstva. [online]. 2008 Dostupné na internete: http://bella.blog.sme.sk/c/109353/Prva-slovenska-mapa-spravodajstva.html • CHARVÁT, Karel- Kocáb, Milan-Konečný, Milan- Kubíček, Petr.: Geografická data v informační společnosti. Praha: VŮGTK, 2007. s. 42-44. ISBN 970-80-85881-28-8 • RAPANT, Petr.: Geoinformatika a geoinformační technologie. Ostrava: Institut geoinformatiky, 2006. s. 135-139. ISBN 80-248-1264-9 • HORÁK, Jiří.: Prostorová analýza dat. Skriptá, Ostrava: Institut geoinformatiky, 2006. s. 37-38

  27. Ďakujem za pozornosť

More Related