240 likes | 317 Views
Explore the application of multivariate ordination methods in ecology to interpret complex ecological datasets and patterns over space and time. Learn about key methods such as PCA, PCOA, CA, NMDS, and CCA.
E N D
Métodos de Ordenação Valério De Patta Pillar Departamento de Ecologia Universidade Federal do Rio Grande do Sul Porto Alegre, RS vpillar@ufrgs.br http://ecoqua.ecologia.ufrgs.br
Em ecologia buscamos revelar padrões, processos e mecanismos ao examinar conjuntos, geralmente complexos, de unidades ecológicas descritas por muitas variáveis. Métodos de ordenação podem sintetizar conjuntos complexos de dados, permitindo interpretações sobre padrões no espaço e no tempo.
Bibliografia • Legendre, P.; Legendre, L. 1998. Numerical Ecology 2nd ed. Elsevier, Amsterdam. 853 p. • Podani, J. 2000. Introduction to the Exploration of Multivariate Biological Data. Leiden, Backuys Publishers. 407 p. ISBN 90-5782-067-6 • Pillar, V.D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902. • Valentin, J.L. 2000. Ecologia Numérica. Rio de Janeiro, Interciência. • Wildi, O. & Orlóci, L. 1990. Numerical Exploration of Community Patterns. Haia, SPB Academic Publishing. p. 65-68.
Análise de dados com MULTIV Disponível em http://ecoqua.ecologia.ufrgs.br
Ordenação Os dados podem ser representados em um espaço de comparação, abstrato, multidimensional: • p variáveis são as dimensões que descrevem • n unidades amostrais, pontos no espaço de comparação. Ordenação é uma projeção dos pontos em um número menor de dimensões (geralmente 2 ou 3) com mínima perda de informação. • Alguns métodos de ordenação: • Análise de Componentes Principais (PCA) • Análise de Coordenadas Principais (PCOA) • Análise de Correspondência (CA) • Ordenação não-métrica (NMDS) • Ordenação Canônica (CCA, Análise de Redundância)
Diagrama de dispersão de 22 paleo-inventários (unidades amostrais) descritas por três variáveis. A terceira dimensão (variável 3) é representada pelo diâmetro das esferas (esferas maiores estão mais próximas do observador e indicam maior abundância da variável 3).
Ordenação de dados de pólen de um perfil de sedimento, Cambará do Sul, Brazil, indicando a trajetória da composição da vegetação em 42.840 14C anos antes do presente. Método de análise de coordenadas principais com base em distâncias euclidianas usando porcentagem de pólen em 138 taxa. Taxa mais correlacionados com os eixos de ordenação estão indicados em posições proporcionais ao nível de correlação. Fonte:Behling, H.; Pillar, V.D.; Orlóci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, studied by high-resolution pollen, charcoal and multivariate analysis of the Cambará do Sul core in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.
Ordenação de dados de pólen de um perfil de sedimento, Cambará do Sul, Brazil, indicando a trajetória da composição da vegetação desde 610 anos antes do presente. Método de análise de coordenadas principais com base em distâncias euclidianas usando porcentagem de pólen em 92 taxa. Taxa mais correlacionados com os eixos de ordenação estão indicados em posições proporcionais ao nível de correlação. Fonte:Behling, H.; Pillar, V.D.; Orlóci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, inferred from a high resolution pollen and charcoal record at Cambará do Sul in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.
Análise de Componentes Principais(Hotelling 1933) n x p Dados Calcula matriz de semelhança p x p Extração de raízes da matriz
Análise de Coordenadas Principais(Gower 1966) ou Metric Multidimensional Scaling (Torgerson 1952) n x p Dados Calcula semelhanças n x n Extração de raízes da matriz
Análise de Correspondênciaou “contingency table analysis”, “reciprocal averaging”, “reciprocal ordering”, “analyse factorielle des correspondances” (ref. em Legendre & Legendre 1998:451) n x p Dados ajuste duplo Calcula matriz de semelhança p x p Extração de raízes da matriz
É estável esta ordenação, i.e., as mesmas tendências de variação nesse espaço de ordenação em duas dimensões reapareceriam se o mesmo universo amostral fosse reamostrado? É suficiente o número de unidades amostrais para responder essa questão?
Significância de eixos de ordenação • Um problema na ordenação é saber quantas dimensões são significativas, a serem então interpretadas. • Interpretações podem ser enganosas quando baseadas em dimensões representando tendências instáveis de variação que não reapareceriam na análise de outras amostras do mesmo universo amostral. • Pode haver perda de informação importante ao descartar dimensões significativas. • Jackson, D.A. 1993. Stopping rules in principal components analysis: a comparison of heuristical and statistical approaches. Ecology 74: 2204-2214. • Pillar, V. D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902.
Ajuste de Procrustes • O ajuste envolve rotação, translação e dilatação do sub-espaço de ordenação da amostra bootstrap de modo a maximizar o ajuste com a ordenação do pseudo universo amostral. • O ajuste é necessário devido à forma como os algoritmos de ordenação posicionam os eixos de diferentes amostras. Primeiro, imagens especulares são comuns e arbitrárias. Segundo, há variação entre amostras boostrap na ordem de expressão da mesma dimensão intrínseca porque podem ser muito semelhantes. Schönemann, P.H. & Carroll, R.M. 1970. Fitting one matrix to another under choice of a central dilation and a rigid motion. Psychometrika 35: 245-256.
The effect of sample size on the significance of ordination axes (PCOA). The method involved bootstrap resampling with increasing sample size. Upper: data set with 60 species and 60 relevés from grassland in the south of Brazil. Bottom: the data set with the same relevés described by 20 environmental variables. (Pillar 1999)
Efeito do tamanho da amostra na significância de eixos de ordenação. O método envolveu auto-reamostragem (bootstrap) com tamanhos crescentes de amostra. A análise usou matrizes simuladas com 3 grupos de 4 variáveis cada e 40 unidades amostrais: correlação entre variáveis r = 0.6 dentro e r = 0.3 entre grupos. (Pillar 1999)