fundamentos de miner a de datos n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Fundamentos de Minería de Datos PowerPoint Presentation
Download Presentation
Fundamentos de Minería de Datos

Loading in 2 Seconds...

play fullscreen
1 / 17

Fundamentos de Minería de Datos - PowerPoint PPT Presentation


  • 161 Views
  • Uploaded on

Fundamentos de Minería de Datos. Introducción al Data Mining. Fernando Berzal fberzal@decsai.ugr.es. ¿Qué es la minería de datos?. Extracción de patrones (“conocimiento”) en grandes cantidades de datos. Definición Técnicas de Data Mining Evaluación de resultados Sistemas de Data Mining

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Fundamentos de Minería de Datos' - flo


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
fundamentos de miner a de datos

Fundamentos de Minería de Datos

Introducción alData Mining

Fernando Berzalfberzal@decsai.ugr.es

qu es la miner a de datos
¿Qué es la minería de datos?

Extracción de patrones (“conocimiento”)en grandes cantidades de datos

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

qu es la miner a de datos1
¿Qué es la minería de datos?

Extracción de patrones (“conocimiento”)en grandes cantidades de datos

Requisitos

  • No trivial
  • Implícito
  • Previamente desconocido
  • Potencialmente útil

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

qu es la miner a de datos2

“Data rich,

Information poor”

Conocimiento(patrones interesantes)

¿Qué es la minería de datos?

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

kdd knowledge discovery in databases
KDD (Knowledge Discovery in Databases)

Extracción de conocimiento en bases de datos

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

kdd knowledge discovery in databases1
KDD (Knowledge Discovery in Databases)

Extracción de conocimiento en bases de datos

  • Limpieza de datos(eliminación de ruido e inconsistencias)
  • Integración de datos(combinación de múltiples fuentes de datos)
  • Reducción/Selección de datos(identificación de datos relevantes para el problema)
  • Transformación de datos(preparación de los datos para su análisis)
  • Minería de datos(técnicas de extracción de patrones y medidas de interés)
  • Presentación de resultados(técnicas de visualización y de representación del conocimiento)

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

kdd knowledge discovery in databases2
KDD (Knowledge Discovery in Databases)

Extracción de conocimiento en bases de datos

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

car cter multidisciplinar
Carácter multidisciplinar

Evaluación de resultadosResumen de datos

Gestión de grandes cantidades de datos

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

Bases de datos

Estadística

Data Mining

Visualización

IA

AprendizajeRepresentación del conocimiento

Presentación de resultados

clasificaci n de t cnicas
Clasificación de técnicas

En función de su propósito general:

    • Técnicas descriptivas
    • Técnicas predictivas

También se pueden clasificar atendiendo a

  • el tipo de datos que hay que analizar
  • el tipo de “conocimiento” que se obtiene
  • el tipo de herramienta que utiliza
  • el dominio de aplicación

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

fuentes de datos
Fuentes de datos
  • Bases de datos relacionales
  • Bases de datos multidimensionales (DW)
  • Bases de datos transaccionales
  • Series temporales, secuencias y data streams
  • Datos estructurados (grafos, redes sociales)
  • Datos espaciales y espaciotemporales
  • Textos e hipertextos (p.ej. Web)
  • Bases de datos multimedia (p.ej. imágenes)

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

t cnicas de data mining
Técnicas de Data Mining

Caracterización o resumen

Discriminación o contraste

Patrones frecuentes, asociaciones y correlaciones

Clasificación y predicción

Detección de agrupamientos (clustering)

Detección de anomalías (outliers)

Análisis de tendencias (series temporales)

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

evaluaci n de resultados
Evaluación de resultados

Un resultado es interesante si…

  • es comprensible (por seres humanos)
  • es válido con cierto grado de certeza
  • es potencialmente útil
  • es novedoso o sirve para validar una hipótesis

El interés de los resultados se puede evaluar

  • objetivamente (criterios estadísticos)
  • subjetivamente (perspectiva del usuario)

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

sistemas de data mining
Sistemas de Data Mining

Una tarea de minería de datos puede describirse en términos de…

  • Datos relevantes(lo que hay que analizar)
  • Tipo de conocimiento(lo que se desea obtener)
  • Conocimiento previo (background knowledge, para guiar el proceso)
  • Medidas de interés(para evaluar los resultados obtenidos)
  • Técnicas de representación(para representar los resultados obtenidos)

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

sistemas de data mining1
Sistemas de Data Mining

Arquitecturatípica

Interfaz de usuario

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

Evaluación de patrones

Base de conocimiento

Motor de minería de datos

Base de datos o Data Warehouse

Limpieza, integración, selección y transformación de datos

DB

DW

WWW

temas de investigaci n
Temas de investigación
  • Técnicas eficientes de minería de datos
    • Escalabilidad
    • Técnicas incrementales
    • Algoritmos paralelos
  • Incorporación de conocimiento previo
  • Evaluación de resultados (interés)
  • Interacción con el usuario
    • Técnicas interactivas (a distintos niveles de abstracción)
    • Técnicas de presentación y visualización de resultados
  • Análisis de “nuevos” tipos de datos
    • Estructuras complejas (grafos, redes sociales)
    • Bases de datos heterogéneas…

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

bibliograf a libros de texto
Bibliografía: Libros de texto

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía

Jiawei Han & Micheline Kamber: “Data Mining: Concepts and Techniques”

Morgan Kaufmann, 2006, ISBN 1558609016

Pang-Ning Tan, Michael Steinbach & Vipin Kumar:

“Introduction to Data Mining”

Addison-Wesley, 2006, ISBN 0321321367

bibliograf a investigaci n
Bibliografía: Investigación
  • REVISTAS
  • ACM Transactions on KDD
  • IEEE Transactions on Knowledge and Data Engineering
  • Data Mining and Knowledge Discovery (DMKD)
  • ACM SIGKDD Explorations
  • Data & Knowledge Engineering (DKE)
  • CONGRESOS
  • KDD (ACM SIGKDD International Conference on KDD)
  • ICDM (IEEE International Conference on Data Mining)
  • SDM (SIAM Data Mining Conference)
  • PKDD (Principles and Practices of KDD)
  • SIGMOD (Management of Data)
  • CIKM (Information and Knowledge Management)
  • WEB: http://www.kdnuggets.com/

Definición

Técnicas deData Mining

Evaluaciónde resultados

Sistemas deData Mining

Temas de investigación

Bibliografía