1 / 14

Planejamento de Experimentos Aplicação ao SCAE

Planejamento de Experimentos Aplicação ao SCAE. Eliana Zandonade Estatística elianaz@cce.ufes.br. Sumário. Problema estatístico a ser resolvido Noções básicas do planejamento de experimento Como escolher uma base de dados representativa para o projeto Propostas de base de dados

amaris
Download Presentation

Planejamento de Experimentos Aplicação ao SCAE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Planejamento de Experimentos Aplicação ao SCAE Eliana Zandonade Estatística elianaz@cce.ufes.br

  2. Sumário • Problema estatístico a ser resolvido • Noções básicas do planejamento de experimento • Como escolher uma base de dados representativa para o projeto • Propostas de base de dados • Atividades atuais

  3. Problema estatístico Definir uma base de dados representativa que tenha como missão: 1) aferir a capacidade de classificação dos classificadores manuais; 2) estudar os modelos quanto a sua capacidade de resolver o problema proposto no projeto, considerando as particularidades; 3) calibrar os modelos automatizados propostos (baseados em aprendizado); 4) aferir a capacidade de classificação dos modelos propostos; 5) comparar estatisticamente estes modelos.

  4. Planejamento Experimentos • Da metodologia científica temos: • Problema definido • Planejamento do experimento: organização da pesquisa experimental • Cálculo do Tamanho da amostra • Coleta dos dados • Análise estatística do problema • Conclusões

  5. Pesquisa Experimental • Definição: Experimentos aleatórios são situações que ao serem repetidas nas mesmas condições não produzem o mesmo resultado. • Definição: Planejamento de Experimento é uma atividade necessária para se descobrir informações sobre um processo ou sistema em particular

  6. Processo a ser estudado: • dicionário • tabela cnae 2.0 • conhecimento das regras Fatores controláveis • contrato social • texto livre ......... x1 x2 xp Entrada Saída Processo Y • códigos • descritores ......... zq • interpretação • Codificação errada z1 z2 Fatores incontroláveis

  7. Método do Planejamento O delineamento é um teste ou uma série de testes que modifica propositalmente as variáveis de entrada para observar mudanças nas variáveis de saída.

  8. Conseqüências da Utilização • Redução da variabilidade; • Redução de tempo; • Redução de custos.

  9. Três princípios Básicos • REPETIÇÃO • ALEATORIZAÇÃO • FORMAÇÃO DE BLOCOS OU ESTRATOS

  10. Nossa base de dados • Repetição:Para cada código CNAE precisamos ter mais de um objeto social. O número de objetos sociais em questão depende da dificuldade de classificação de cada documento. Podemos, no entanto, definir que todos os documentos têm o mesmo grau de dificuldade e assim definir um número mínimo de documentos de cada código. Vamos chamar aqui de código, o código da atividade principal.

  11. Nossa base de dados • Aleatorização:Os objetos sociais devem ser escolhidos aleatoriamente, incluindo todas as possibilidades em todas as unidades da federação.

  12. Nossa base de dados c) Formação de estratos: Definição das possíveis fontes conhecidas de variação de classificação dos códigos, como por exemplo • as três esferas do governo: federal, estadual e municipal, • os Códigos no nível hierárquico de subclasse • e as demandas regionais (sul, sudeste, centro oeste, nordeste e sul).

  13. Nossa base de dados BASE 1: dados da central de dúvidas do IBGE (texto da atividade principal, perguntas do IBGE e o código atribuído pelos especialistas). Ver documento! Ver Protótipo de avaliação BASE 2: dados de objeto social das prefeituras de Vitória e Belo Horizonte (texto das atividades e códigos atribuídos pelos órgãos). Ver documento!

  14. Nossa base de dados BASE 3: Dados da pesquisa econômica do IBGE. Em torno de 30 mil empresas. Dados da atividade principal, perguntas e códigos. Ver documento! BASE 4: Base montada para os experimentos do projeto. Será criado um protótipo de entrada de dados com texto livre de atividades, perguntas adicionais e estes dados serão classificados pelos classificadores manuais. Ver documento!

More Related