Mineração de dados

Mineração de dados Exercícios sobre classificação

O que deveria ser feito, na fase de preparação de dados, para aplicar o método ID3 para classificação com os dados abaixo?

O que deveria ser feito, na fase de preparação de dados, para aplicar o método k-NN para classificação com os dados abaixo?

O que deveria ser feito, na fase de preparação de dados, considerando uma rede neural backpropagation para classificação usando os dados abaixo?

O que deveria ser feito, na fase de preparação de dados, considerando o uso do algoritmo naïve bayes e os dados abaixo?

Considere o seguinte conjunto de treino, em que cada exemplo é definido por três atributos (A,B,C) e a classe X. Sabendo que: • Entropia (S) = - (p+ log2 p+ + p- log2 p-) • Ganho (S, A) = Entropia (S) -  ((|Sv| / |S|) * Entropia (Sv)), onde Sv = subconjunto de S para um valor do atributo At |Sv| = número de elementos de Sv |S| = número de elementos de S a) Qual a incerteza (entropia) associada ao conjunto de treino inicial? b) Qual o Ganho de Informação para cada um dos atributos? (log2 1=0, log2 0,5=-1, log2 0,25=-2 , log2 0,75=-0,415, log2 0,333=-1,585, log2 0,667=-0,585) c) Face a este resultado, qual seria a árvore de decisão obtida para este conjunto de treino, construída de acordo com o critério de maximização do ganho de informação?

Dada a árvore de decisão abaixo, que regras seriam geradas pelo algoritmo C4.5?

Considerando os dados de treino abaixo e o algoritmo C4.5, quais seriam os intervalos de decisão considerados para o atributo Peso? Peso <= 65 e peso > 65 Qual a árvore de decisão gerada?

Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo naive Bayes, considerando os dados de treino abaixo e sabendo que P( E1 |H ).P( E2 | H)... .P(En | H).P(H ) P(H|E)= P( E1 ).P( E2)... .P(En)

Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo e k=1.

Determine a classificação obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo, k=3, e a seguinte tabela de distâncias para o atributo Z1:

lágrimas reduzida normal astigmat. 1 sim não prescrição 2 miopia hipermetr. 4 3 Complete a árvore de decisãocolocando no lugar dos números das folhas, a classe, de forma a minimizaroserros de classificação. Faça a matriz de confusãocorrespondente.

Mineração de dados

Mineração de dados

Presentation Transcript

MINERÍA y FUENTES DE ENERGÍA

John L. Lewis is most closely associated with what group?

Modelo de Dados Objeto-Relacional

Dados e Resultados do Projeto-Piloto Tratamento do Superendividamento

Relatório em Janeiro de 2013

Introdução à Comunicação de Dados

Sistemas de Informações Geográficas

LA TIERRA: geodinámica interna y externa

Prof.: José Eustáquio Rangel de Queiroz rangel@dsc.ufcg.br rangeldequeiroz@gmail

Aquisição de Dados Multimédia

Capítulo 7 Conhecendo os Dados

Estatística e Análise de Dados

Rumunsko 2007

SCC0141 - Bancos de Dados e Suas Aplicações

Fundamentos de Minería de Datos

Módulo I Interface com BancoDados JDBC

Struktura půdy

Prof. Lorí Viali, Dr. viali@ufrgs.br ufrgs.br/~viali/

Banco de Dados I Capítulo 6: Uso de SQL em Aplicações

Capítulo 3 : Modelo de Dados Objeto-Relacional

Banco de Dados Multimídia

3 rd Grade Science For The Year