1 / 50

Estatística Espacial Análise de Padrões de Distribuição de Pontos

Estatística Espacial Análise de Padrões de Distribuição de Pontos. INPE - Divisão de Processamento de Imagens. Organização. Introdução Distribuição de Pontos Caracterização de Distribuição de Pontos Estimador de Intensidade (“Kernel Estimation”) Modelagem de Distribuição de Pontos

Download Presentation

Estatística Espacial Análise de Padrões de Distribuição de Pontos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística EspacialAnálise de Padrões de Distribuição de Pontos INPE - Divisão de Processamento de Imagens

  2. Organização • Introdução • Distribuição de Pontos • Caracterização de Distribuição de Pontos • Estimador de Intensidade (“Kernel Estimation”) • Modelagem de Distribuição de Pontos • Método do Vizinho Mais Próximo • Função K • Exemplos Práticos com o Sistema Spring Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  3. Introdução - preliminares • Consideramos aqui fenômenos expressos através de ocorrências pontuais. • São observações disponíveis no espaço. • Representações pontuais podem corresponder a dados como • índice de mortalidade, • ocorrências de doenças, • localização de espécie vegetais, etc. • Objetivo • aumentar o entendimento do processo verificando hipóteses viáveis ou inferir valores em áreas sem observações. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  4. Introdução - preliminares A L G U N S E X E M P L O S • Epidemologia • A distribuição dos casos de uma doença formam um padrão no espaço ? Existe associação com alguma fonte de poluição ? Evidência de contágio ? • Crime • Roubos que ocorrem em determinadas áreas estão correlacionados com características sócio econômicas ? • Geologia • Dado um conjunto de amostras, qual a extensão de um depósito mineral ? Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  5. Introdução - preliminares Mapeando a violência - localização pontual Santos,S.M., 1999 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  6. Clusters • “Cluster”: qualquer agregado de eventos. • resultado de classificação onde se busca definir um grupamento de “semelhantes”. • Cluster espacial • agregado de eventos no espaço ou a ocorrência de “taxas semelhantes” em área próximas. • Detecção de cluster espacial • estabelecer a significância de um sobre-risco em um determinado espaço ou tempo e espaço. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  7. Clusters • O que causa um “cluster”? • Agentes infecciosos, contaminação ambiental localizada, efeitos colaterais de tratamentos, etc. • Os estudos • evidência de tendência geral à clusterização, ou a um determinado e predefinido agregado. • Podem ser usados para pontos ou áreas. • Fatores de controle: • distribuição populacional e outras covariáveis que podem criar agregados. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  8. Conceitos Básicos • Estacionariedade • As propriedades estatísticas da variável independem de sua localização absoluta, ou seja, a média e a variância são constantes em qualquer sub-área e a covariância entre dois pontos quaisquer depende somente de sua localização relativa; • Isotropia • Além de estacionário, a covariância depende somente da distância entre os pontos e não da direção entre eles. • Processo de modelagem • Transformações visando obtenção de estacionariedade; • Ajuste de modelos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  9. Introdução - preliminares • Fenômeno espacial: contínuo ou discreto • Discreto - espaço contém entidades do mundo real • Na concepção Spring denominado de modelo de objetos • Exs: municípios, quadras, escolas, hospitais, etc... • Contínuo - informação presente em todas as posições • Na concepção Spring denominado de modelo de campo • Exs: temperatura, pressão, teor de argila no solo, etc... Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  10. Introdução - preliminares Problemas Típicos Tipos de Dados Exemplo Análise de Padrões Pontuais Eventos Localizados Ocorrência de Doenças Determinação de Padrões Análise de Superficies Amostras de Campo Depósito Minerais Interpolação de Superfície Relacionamento das entidades Regressão Análise de Áreas Entidades e Atributos Dados Censitários C L A S S E S D E P R O B L E M A S Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  11. Distribuição de Pontos • Padrão pontual - conjunto de dados consistindo de uma série de localizações pontuais (p1, p2, ...,pn) que estão associados a eventos de interesse dentro da área de estudo. • p1 • p2 • p3 • p1 Área de Estudo • p4 • p5 • p6 • p7 • p8 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  12. Distribuição de Pontos  Distribuições pontuais tem as seguintes características: • As localizações não estão associadas a valores, mas apenas a ocorrência dos eventos. • Dimensão das medidas é zero. Medidas válidas na distribuição de pontos são o # de ocorrências no padrão e as localizações geográficas. • Área dos eventos não é uma medida válida apesar de em muitos casos ocuparem espaço. • Entidades geográficas representadas como pontos no mapa são considerados de mesma qualidade. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  13. Distribuição de Pontos - Estatísticas Descritivas • A distribuição de características pontuais pode ser descrita pela: • Frequência • Densidade • Centro Geométrico • Dispersão Espacial • Arranjo Espacial * • Com exceção do arranjo espacial, a avaliação das propriedades espaciais • pontuais pode ser realizada através de estatísticas descritivas básicas. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  14. Distribuição de Pontos - Estatísticas Descritivas • Frequência:- # de características pontuais que ocorrem no mapa. • Nota:-A comparação de duas distribuição de frequência pode ser enganosa • se a área não é considerada. • Quando dois padrões de pontos que diferem na área são comparados, • é aconselhável compará-los pela densidade. • Densidade:- Frequência / Área • Centro Geométrico e Dispersão Espacial:- são medidas que caracterizam as • propriedades geográfica de um padrão de pontos. • Centro Geométrico = média das coordenadas de localização X e Y • Dispersão = desvio padrão de cada média (X e Y). Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  15. Distribuição de Pontos - Estatísticas Descritivas (12, 15) A B (0,0) C D • A figura abaixo apresenta quatro padrões de pontos (A, B, C e D). L O C A L I Z A Ç Õ E S ----------------------------------------------------------------------------------------- A BCD ----------------------------------------------------------------------------------------- (2, 7)(3, 6)(2,4)(3,4) ----------------------------------------------------------------------------------------- (3, 5)(4, 4)(3,10)(5,2) ----------------------------------------------------------------------------------------- (3, 6)(4, 5)(4,7)(5,8) ----------------------------------------------------------------------------------------- (3, 7)(4, 6)(5,2)(7,11) ----------------------------------------------------------------------------------------- (3, 8)(5, 4)(7,4)(8,5) ----------------------------------------------------------------------------------------- (4, 6)(5, 5)(7,6)(8,8) ----------------------------------------------------------------------------------------- (4, 7)(5, 6)(7,9)(9,2) ----------------------------------------------------------------------------------------- (4, 8)(5, 7)(10,2)(10,8) ----------------------------------------------------------------------------------------- (5, 6)(6, 4)(11,6)(12,2) ----------------------------------------------------------------------------------------- (5, 7)(6, 5)(11,10)(13,4) ----------------------------------------------------------------------------------------- (5, 8)(6, 6)(13,4)(13,6) ----------------------------------------------------------------------------------------- (5, 9)(7, 5)(13,8)(13,8) Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  16. Distribuição de Pontos - Estatísticas Descritivas (12, 15) A B (0,0) C D • A figura abaixo apresenta quatro padrões de pontos (A, B, C e D). Frequência = 12 em A, B, C, D Densidade = 180/12 em A, B, C, D Centro Geométrico CGa CGd CGb CGc Nota: CGa e CGb representam bem a tendência central porque ambas distri- buições estão concentradas em torno dos respectivos centros. Por outro lado, CGc e CGd não são bons indicadores para suas respectivas distribuições. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  17. Distribuição de Pontos - Estatísticas Descritivas • Padrões de pontos com diferentes características de dispersão espacial x > y x < y 2x ~ 2y 2x ~ 2y  (significante)  (insignificante) Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  18. Distribuição de Pontos - Arranjos Espaciais • Uma característica importante de um padrão espacial é a localização dos pontos e • a relação entre eles. Isto tem um efeito significativo na distribuição dos padrões. • Objetivo : verificar se os eventos observados apresentam algum tipo de padrão sistemático, ao invés de estar distribuídos aleatoriamente. Aleatório Agrupado Regular • Na realidade o que se deseja é detectar padrões de aglomerados espaciais (“clusters”). • Base conceitual -> supor uma distribuição estocástica que serve de base para a hipótese de aleatoriedade. • No caso de pontos é usual utilizar a distribuição de Poisson. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  19. Caracterização de Distribuição de Pontos • Processo de análise de pontos pode ser descritos em termos de : • Efeitos de Primeira Ordem • considerados globais ou de grande escala. • correspondem a variações no valor médio do processo. • Neste caso estamos interessados na intensidade do processo (No Eventos / Unidade de Área). • Efeitos de Segunda Ordem • denominados locais ou de pequena escala. • representam a dependência espacial no processo • A maior parte das técnicas de análise de distribuição de pontos supõe um comportamento isotrópico. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  20. Caracterização de Distribuição de Pontos • Técnicas a serem abordadas : • Para Efeitos de Primeira Ordem • Estimador de Intensidade (“Kernel Estimation”)  • Para Efeitos de Segunda Ordem • Vizinho mais Próximo  • Função K  Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  21. Estimador de Intensidade (“Kernel Estimation”) • Segundo (Bailey e Gatrell, 1995): Onde: • A função I( ) -> FDP, escolhida de forma adequada para construir uma superfície contínua sobre os dados. • O parâmetro  denominado “largura de faixa”, controla o amaciamento da superfície gerada. • Srepresenta uma localização qualquer na área de estudo e Si são as localizações dos eventos observados. • n representa o número de eventos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  22. Estimador de Intensidade (“Kernel Estimation”) • Uma função muito utilizada para I() é: onde: • h representa a distância entre a localização em que desejamos calcular a função e os eventos observados. • Assim o estimador de intensidade pode ser expresso como: onde: • hi é a distância entre o ponto a calcular S e o valor observado Si. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  23. Estimador de Intensidade (“Kernel Estimation”) • A Figura abaixo ilustra a idéia do estimador de intensidade kernel S t Si hi Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  24. Estimador de Intensidade (“Kernel Estimation”) Observações • Efeito da Largura de Faixa (t) Banda estreita t Banda larga Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  25. Estimador de Intensidade (“Kernel Estimation”) • Uma visão do Kernel no Sistema SPRING Plano de Informação (PI) Grade de Intensidade Superfície de saída Observações kernel Ponto a ser estimado Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  26. Estimador de Intensidade (“Kernel Estimation”) • Exemplo: Mapeando a violência na cidade de Porto Alegre - RS. Kernel Santos,S.M., 1999 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  27. Vizinho mais próximo • Kernel • explorar a variação da média do processo na região de estudo - propriedade de primeira ordem • Propriedades de segunda ordem • distâncias entre os eventos • Dois tipos de distâncias: • evento-evento (W) e ponto aleatório-evento (X) • Função empírica • histograma das distâncias para o vizinho mais próximo - cada classe do histograma é uma contagem de eventos que ocorrem até aquela distância Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  28. Vizinho mais Próximo • O método do vizinho mais próximo estima a função de distribuição • cumulativa ( ) baseado nas distâncias entre eventos em uma • região de análise. • Pode ser estimado empiricamente por: onde: • w distância de entrada • wi distância entre eventos • n número de eventos • A plotagem dos resultados de em relação as distâncias, pode ser • utilizado como um método exploratório para verificar se existe evidência • de interação entre os eventos. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  29. Método - Vizinho mais Próximo Baseado na distância mínima entre os pontos 1 distância distância mínima 2 distância 3 distância Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  30. Método - Vizinho mais Próximo w mín. máx. 1 2 3 4 5 6 7 8 9 no intervalos 1 Distância entre eventos 0 w 0 • Na prática a distância de entrada w está compreendida entre um valor • mínimo e máximo estabelecido pelo usuário.Além disso, deve-se definir • também o número de intervalos desejados (Ex: com 9 intervalos). Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  31. Método - Vizinho mais Próximo • Análise exploratória de padrões de distribuição de pontos utilizando 1 0 w 0 1 0 w 0 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  32. Teste de Significância • Teste de Significância • comparar com distribuições teóricas ou simulações querepresentem a “Completa Aleatoriedade Espacial” • A hipótese de CAE • evento segue um processo de Poisson homogêneo sobre a região estudada, • Outras modelos • processo de Poisson heterogêneo, processo de Cox, etc. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  33. Método - Vizinho mais Próximo • A significância do resultado da análise exploratória, do padrão de • distribuição de pontos, utilizando o método vizinho mais próximo pode ser • avaliada através de um modelo teórico denominado Aleatoriedade Espacial • Completa ( “Complete Spatial Randomness - CSR” ). • Na realidade o que se faz é comparar a distribuição dos eventos observados • com o que se esperaria na hipótese CSR. • Esta metodologia consiste em se criar envelopes de simulação para a • distribuição CSR, afim de acessar a significância dos desvios. • Na hipótese de CSR, a função de distribuição G(w) seria dada por um • processo de Poisson, como segue (Bailey e Gatrell, 1995): Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  34. Método - Vizinho mais Próximo • A estimação simulada para a distribuição G(w) assumindo-se CSR é • calculada como (Bailey e Gatrell, 1995): onde: • , i =1, 2, ..., m são funções de distribuição empíricas, estimadas a • partir de m simulações independentes dos n eventos, na hipótese • CSR (n eventos independentes e uniformemente distribuídos). Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  35. Método - Vizinho mais Próximo • Para calcular a condição de aleatoriedade, calcula-se os envelopes de • simulação superior e inferior, definidos como segue (Bailey e Gatrell, 1995): • Envelope superior • Envelope inferior Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  36. Método - Vizinho mais Próximo • A plotagem x , com adição dos envelopes, permite medir a • significância dos desvios relativo a aleatoriedade. Envelope Inferior Estimado Envelope Superior • Se a condição de CSR for válida para os dados observados, a plotagem • x deve ser praticamente linear com um ângulo de 45o Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  37. Método - Vizinho mais Próximo • Se o dado apresenta tendências para agrupamento, os traçados no gráfico • estarão acima da linha de 45o. • Por outro lado, se o dado apresenta padrões de regularidade os traçados • ficarão abaixo da linha de 45o. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  38. Método - Vizinho mais Próximo • O exemplo abaixo refere-se a crimes juvenis na região de Cardiff, UK • (Herbert, 1980). Neste caso percebe-se a posição dos envelopes e • da distribuição acima da linha de 45o, o que caracteriza agrupamento • para as distâncias em análise. Distância mín.=0. máx.=16 #intervalos=10 #simulações=10 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  39. Função K • Vizinho mais próximo • pequena escala • Função K • propriedades de segunda ordem de um processo isotrópico • Definição (Bailey e Gatrell, 1995): K(h) =E[#(eventos a distância hde um evento arbitrário)] onde:  - No eventos / área E() - operador esperança. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  40. Função K • K(h) =E[#(eventos a distância hde um evento arbitrário)] R # eventos = 7 h Lembrando que:  denominado de intensidade ou  =no eventos/R R = área # eventos = 3 h Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  41. Função K • Necessitamos agora, definir um estimador para a função k • K(h) =E[#(eventos a distância hde um evento arbitrário)] • K(h) =, onde: dijé a distância entre os eventos i e j. Ih(dij)= 1 sedij <=h, 0 sedij > h. R = n = # eventos em R. • Resultando • O estimador de lambda , então: Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  42. Função K R h=5 # eventos=7 # eventos=7 h=5 # eventos=3 h=5 • Uma idéia gráfica do que está embutido na notação do estimador da função K Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  43. Função K Tipo de Processo K(h) Randômico = h2 Ordenação regular < h2 Agregação espacial > h2 • Para um processo aleatório o # esperado de eventos a uma distância h • de UMevento escolhido aleatoriamente é lk(h)=lph2(Bailey e Gatrell, 1995) h Processo aleatório h h Área=ph2 h h h Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  44. Função K Tipo de Processo L(h) K(h) Randômico = 0 = h2 Ordenação regular < 0 < h2 Agregação espacial > 0 > h2 • Uma vez obtido, este pode ser plotado e examinado. • O gráfico da função K não é tão intuitivo quanto a do gráfico do vizinho • mais próximo. Portanto utiliza-se uma função auxiliar L, para facilitar a • interpretação. • O estimador da função L é: Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  45. Função K • Interpretação da plotagem de • extremos positivos: mais agrupamento • em torno de zero aleatório 0 • extremos negativos: mais regularidade h Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  46. Função K • Exemplo :- O exemplo abaixo refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. Neste caso percebe-se que para distâncias entre aproximadamente 2.5 a 3 (extremo positivo do gráfico) há evidências de agrupamento. Distância mín.=0.5 máx.=4 #intervalos=10 Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  47. Função K • Uma abordagem similar a do vizinho mais próximo pode ser feita para se • estimar a significância dos desvios da distribuição em relação a aleato- • riedade (CSR). • Idéia realizar simulações CSR sobre a região R e computar os envelopes • superior e inferior. • O envelope superior é definido como (Baley e Gratel, 1995): • O envelope inferor é definido como (Baley e Gratel, 1995): Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  48. Função K 1.5 - 1.0 - 0.5 - 0.0 - -0.5 - -1.0 - -1.5 - • Análise do gráfico com os envelopes Upper(h) e Lower(h). Upper(h) aleatório Lower(h) h Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  49. Função K • Exemplo :- mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m2. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

  50. AULA PRÁTICA NO SISTEMA SPRING • BANCOS DE DADOS: • PORTO ALEGRE: eventos de violência (homicídios, acidentes de transito e suicídios) na cidade de Porto Alegre - RS. • BoodminMoor: refere-se ao município Bood Moor, situado no condado de Cornwall, Inglaterra. Dados geomorfológicos com 36 localizações de rochas de granito. • Cardiff: estado em Wales, UK. Dados representam localizações das 168 residências de infratores juvenis no estado de Cardiff. • Redwood: mudas de Sequoia, Califórnia. Dados representam 62 mudas distribuídas numa região de 23m2. Estatística Espacial - Análise de Padrões de Distribuição de Pontos

More Related