html5-img
1 / 38

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali. LE TRE V. Volume : gestione di moltissimi dati Velocità : gestione in tempo reale Varietà : fonti e tipologie diverse.

pink
Download Presentation

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Big Data : • volume di dati • livelli variabili di complessità • generati a velocitàdifferenti • non elaborabili con tecnologie tradizionali

  2. LE TRE V • Volume: gestione di moltissimi dati • Velocità: gestione in tempo reale • Varietà: fonti e tipologie diverse

  3. DUE V IN PIÙ • Veridicità: attendibilità dei dati raccolti • Volatilità: tempo di validità dei dati

  4. PERCHÉ UTILIZZARE I BIG DATA • Opportunità di conoscenza • Capire il mondo reale • Opportunità commerciali

  5. DATI NON STRUTTURATI • Non possiedono un modello prestabilito • Non sono organizzati • Possono causare ambiguità • Sono costituiti da: • Testo • Audio • Video • Flussi di click • …

  6. RACCOLTA DI DATI ORDINARI • Raccolta di informazioni • Classificazione in categorie prestabilite • Organizzazione secondo uno schema preciso • Memorizzazione fisica dei dati

  7. ELABORAZIONE DEI BIG DATA • Collezione e memorizzazione dei dati • Classificazione per categorie • Trasformazione dei dati • Generazione dei risultati trovati

  8. ANALISI DEI COMPORTAMENTI SOCIALI

  9. ANALISI DEI SENTIMENTI • ASCOLTARE • CAPIRE • RIELABORARE • VISUALIZZARE

  10. HEDONOMETER • Script pattern matching: • individuaretokens • stabilireilpatterndellefrequenze in un testo • Set di parole: • Google books • Twitter • Canzoni 1960/2007 • New York Times 1987/2007 • Grado di felicitá: • Amazon’s Mechanical Turk http://www.hedonometer.org/index.html

  11. havg(T) = livello di felicitá della frase T • havg (wi) = felicitá di ciascuna parola • Fi = frequenza della i-esima parola

  12. TWITTER ANALYSIS • 484 miloni di tweets • 9.8 milionidi persone • Luglio2009 e Gennaio 2012 • 54 piúlarghecittádella Gran Bretagna • Parole cercate: PAURA, GIOIA, RABBIA, TRISTEZZA PAPER: <<Big Data Analysis of News and Social Media Content>> Ilias Flaounas, Thomas Lansdall-Welfare, Nello Cristianini Intelligent Systems Laboratory, University of Bristol

  13. TIMELINE GENERATE GRAFICO DELLA GIOIA GRAFICO DELLA RABBIA

  14. GRAFICO SETTIMANALE GRAFICO GIORNALIERO PAPER: <<Temporal patterns of happiness in a global social network: Hedonometrics and Twitter>> P. Sheridan Dodds, K. Decker Harris, I. Kloumann, Center of complex systems of the university of Vermont

  15. VOICES FROM THE BLOG http://www.blogsvoices.unimi.it

  16. LIMITAZIONI • AMBIGUITÁ • SENSI MULTIPLI • TONO • SARCASMO • SOPRANNOMI • IMMAGINI

  17. CONSIDERAZIONI «Il Big Data ha avuto un impatto nello studio del comportamento umano simile all’introduzione del microscopio o del telescopio nei campi della biologia e dell’astronomia» Zeynep Tufekci “Big Questions for Social Media Big Data”

  18. BIG DATA ELE AZIENDE

  19. BIG DATA vs MARKETING • Big Data aiutano a comprendere le dinamiche del proprio mercato di riferimento • Per riuscire a trarne il massimo bisogna sodisfare alcuni requisiti: • Nuova mentalità • Leadership • Team di ricerca • Gestione dei dati

  20. BIG DATA vs ROI Big Data + Marketing = ROI enorme

  21. Perché le aziende ti conoscono meglio della tua famiglia Attraverso un’analisi dei dati il negozio Target è riuscito a scoprire che una ragazza era incinta, ancora prima che lo sapessero i suoi genitori. Fedelity Card Informazioni Personali + Informazioni di Vendita Big Data

  22. AMAZON • 152 milioni di conti cliente Amazon Web Services: • Raccolta • Archiviazione • Calcolo • Condivisione Ricerche + Acquisti + Desideri Big Data Pubblicità

  23. AMAZON CLOUD DRIVE • 5 GB gratis • 1.000 GB massimo • 2 GB trasferimento massimo per file • $ 0.50 per GB • Online software  Cloud Player

  24. SPEDIZIONE ANTICIPATA Obiettivi: • Restringere tempi di attesa • Predire gli ordini del cliente « Se non lo vuoi, te lo regaliamo! »

  25. SPEDIZIONE CON DRONI Amazon Prime Air: • 15 KM massimo • 2 KG massimo • Spediti 30/60 minuti dall’ordine • Ricevuti nella stessa giornata dell’ordine

  26. Servizi per: • Utenti: • Motore di ricerca • Chrome • Gmail • Aziende: • Pubblicità con testo • Pubblicità multimediale

  27. GOOGLE NOW OGGI Schede: • Traffico • Meteo • Sport • Attività • Appuntamenti • Trasporto pubblico • Attrazioni nelle vicinanze • Amici nelle vicinanze • Notizie

  28. GOOGLE NOW DOMANI • Salvataggio posizione parcheggio • Conto alla rovescia • Promemoria pagamento bollette DATI GOOGLE NOW • Cronologia delle posizioni • GPS • Gmail • Calendario • Contatti • Ricerche Google

  29. RICERCA TRAMITE IMMAGINE Ricerca per: • Trascinamento • Caricamento • URL • Click su un’immagine Web Risultati: • Immagine stessa • Immagini simili • Siti web contenenti immagini simili

  30. Caratteristiche: • 80 lingue • traduzione automatica statistica • possibilità di cambiare il testo tradotto scegliendo alternative da un elenco esistente News: « Improvethistranslation »

  31. GoogleTranslate:App • immissione vocale • fotocamera • scrittura a mano libera • modalità offline

  32. INFORMATION RETRIEVAL Reperimento delle informazioni: È l'insieme delle tecniche utilizzate per gestire oggetti contenenti informazioni

  33. INFORMATION RETRIEVAL Permette di: • Rappresentare • Memorizzare • Organizzare

  34. INFORMATION RETRIEVAL Soddisfa: • Il bisogno informativo dell’utente Gestistione: • Ricerca di informazioni, non di dati • Possibile restituzione di risultati non pertinenti

  35. È un movimento che promuove il non utilizzo del modello relazionale. Identifica: • un'ampia varietà di tecnologie legate ai database Risponde: • al crescente volume di dati memorizzati sulla Rete • alle modalità e alla frequenza di accesso ai dati • alla necessitá di performance e di potenza di calcolo

  36. NOSQL I PUNTI DI FORZA • Scalabilitá • Prestazionimigliori • Schemidinamici • Facile da utilizzare • Flessibile

  37. È un framework che supporta applicazioni distribuite con elevato accesso ai dati • Permette di lavorare con migliaia di nodi e petabyte di dati

  38. Yahoo! è il più grande contributore a questo progetto • È usato anche da:  AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter

More Related