1 / 27

Анализ последовательности данных (временн ы х рядов).

Анализ последовательности данных (временн ы х рядов). Рассматриваются данные, образующие временную или пространственную последовательность, т.е. связанные между собой отношением предыдущий, последующий.

Download Presentation

Анализ последовательности данных (временн ы х рядов).

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Анализ последовательности данных (временных рядов). Рассматриваются данные, образующие временную или пространственную последовательность, т.е. связанные между собой отношением предыдущий, последующий. Например, результаты наблюдений по профилю или по разрезу, многолетние наблюдения над каким-либо событием в определённом месте (даты землетрясений, извержений вулканов). Большинство методов анализа последовательности данных основывается на предположении o равенстве временных или пространственных промежутков между событиями.

  2. Зонирование. Зонирование – это разделение последовательности на относительно однородные сегменты, каждый из которых отличен от прилегающих сегментов. Имеется 2 типа методов зонирования – локальный и глобальный. Локальный тип основан на поиске внезапного изменения средних значений последовательности. Ряд значений изучается движением короткого интервала вдоль последовательности. Этот интервал называется скользящим окном. Он распадается на 2 части: сегмент от точки i+h до точки i и другой сегмент от точкиi до точки i-h. Далее вычисляется обобщённая разность D2: - средние значения в сегментах - дисперсии в сегментах Методы локального поиска могут привести к получению большого количества границ, в частности, в наиболее изменчивой части последовательности. Кроме того, первые точки последовательности до границы скользящего окна и последние точки, расположенные после границы не могут быть сегментированы Функция D2 приводит к преобразованию траверса в новую последовательность, в которой границы зон имеют вид острых пиков.

  3. Глобальное зонирование основано на последовательном дихотомическом разбиении всего ряда. На первом шаге для всех возможных положений границы, которая разделила бы ряд на 2 сегмента (т.е. для каждой точки) рассчитывается величина - сумма кувадратов между сегментами, которая характеризует межгрупповую изменчивость. – сумма кувадратов внутри сегментов, которая характеризует внутригрупповую изменчивость Далее выбирается точка с наибольшим значением R, проводится проверка значимости разбиения (как в дисперсионном анализе) и если различия между сегментами значимы, в этой точке проводится граница, разбивающая последовательность на 2 сегмента. Далее процедура повторяется для каждого из выделенных сегментов.

  4. Сглаживание (фильтрация) данных. Сглаживание включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга.

  5. Самый общий метод сглаживания - скользящее среднее, в котором каждый член ряда заменяется простым или взвешенным средним nсоседних членов, где n - ширина окна

  6. Вместо среднего можно использовать медиану значений, попавших в окно. Основное преимущество медианного сглаживания, в сравнении со сглаживанием скользящим средним, в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри окна). Основной недостаток медианного сглаживания в том, что при отсутствии явных выбросов, он приводит к более зубчатым кривым (чем сглаживание скользящим средним) и не позволяет использовать веса.

  7. 4253H фильтр. Фильтр включает несколько последовательных преобразований: (1) 4-х точечная скользящая медиана, центрированная скользящей медианой 2, (2) 5-ти точечная скользящая медиана, (3) 3-х точечная скользящая медиана, (4) 3-точечное взвешенное скользящее среднее с весами (.25, .5, .25), (5) вычисляются остатки вычитанием преобразованного ряда из исходного ряда, (6) шаги 1 - 4 повторяются для остатков, (7) преобразованные остатки добавляются к преобразованному ряду. На практике этот метод фильтрации дает сглаженный ряд, сохраняя основные характеристики исходного ряда.

  8. - - + +

  9. Сглаженные данные Исходные данные На верхних графиках показано распределение Au и Hg по профилю до и после сглаживания, на нижних – корреляция между Au и Hg.

  10. Гармонический анализ. Гармонический анализ используется для изучения явлений, в которых предполагается периодичность (ритмичном напластовании горных пород, развитие систем упорядоченных трещин, формирование рудных столбов, землетрясения, цунами, извержение вулканов и т.д.

  11. + + 0 0 A - - Длина волны - расстояние от одной точки волны до эквивалентной точки на следующей волне. Фазовый угол (фаза) - начальный угол синусоиды (на рис. различия между y1 и y2 для определённого x характеризуют разность фаз двух волновых форм). В составе закономерной изменчивости часто присутствует периодическая составляющая. Гармонический анализ позволяет представить ряд исходных данных как сумму синусоид и выделить наиболее существенные синусоиды, которые вносят основной вклад в изменчивость пространственной переменной. Каждая синусоида имеет три характеристики: амплитуду А, длину волныL(или обратную ей величину – частоту) и начальную фазу , АмплитудаA - высота волны (характеризует энергию волны или её дисперсию).

  12. + + + 0 0 0 - - - Частота – число волн, укладывающихся в единицу времени или длины (например, при анализе данных по профилю единицей длины будет длина профиля) Частота = 1 Частота = 2 Частота = 4 Частота – величина, обратная длине волны

  13. + + 0 0 - - - угол в радианах (координата x в радианах) - фазовый угол k-ой гармоники Для выделения наиболее существенных синусоид, которые вносят основной вклад в изменчивость пространственной переменной используется соотношение Фурье, которое утверждает, что любой временной ряд (если он непрерывен, без изломов и для каждого X может быть определено только одно значение Y) может быть представлен суммой рядов синусоидальных волн. Ak- амплитуда k-ой гармоники, X– длина профиля или количество точек в профиле; x – расстояние конкретной точки от начала профиля или её порядковый номер в профиле. Если длина профиля X=180 точек (расположенных на равных расстояниях друг от друга), то координата x ( ) точки с номером 60 при частоте=1 равна радиан или 120°, а при частоте = 2 - 240° Все точки профиля, отстоящие друг от друга на расстояние, равное длине волны, при фиксированной частоте и фазе будут иметь одну и ту же угловую координату , т.е. все точки как бы проектируются на одну единственную волну.

  14. - значение i-ого наблюдения - частота Имея временной ряд (т.е. последовательность значений Y и расстояние между ними), можно рассчитать амплитуду и фазовый угол для любой гармоники, заданной частотой vили периодом (длиной волны). Амплитуда Фазовый угол В этих формулах:

  15. График спектральной плотности солнечной активности Периодограмма солнечной активности Амплитуда Амплитуда Период Частота Вычислив амплитуды для всех частот (количество частот ограничено количеством наблюдений), можно построить графики частота – амплитуда (график спектра) период – амплитуда (периодограмму). По графикам можно судить о наличии или отсутствии цикличности во временном ряду и, если цикличность выявлена, то оценить степень её проявления и величину наиболее значительных периодов.

  16. Исходные данные Гармоника с периодом 340 м «объясняет» 48,8% общей дисперсии Гармоника с периодом 160 м «объясняет» 24% общей дисперсии Сумма гармоник 340 и 160 м «объясняет» 72,8% общей дисперсии Приммер

  17. Гармонический анализ может быть использован для сглаживания данных и выявления закономерной составляющей.

  18. Автокорреляция. Лаг = 1 Лаг = 2 Лаг = 3 Автокорреляция – это корреляция последовательности данных со своей копией, смещённой относительно оригинала на расстояния, кратные интервалам между соседними наблюдениями. 1,0 0,8 0,6 0,4 0,2 0 -0,2 -0,2 20 24 16 0 12 4 8 Радиус нулевой корреляции

  19. Автокорреляционные функции идеализированных временных рядов. 1. Синусоидальная волна с длиной 20 единиц 2. Последовательность случайных чисел (шум) 3. Последовательность, возрастающая по линейному закону (тренд) 4. Сумма синусоидальных волн и случайного шума (сумма 1 и 2) 5. Сумма синусоидальных волн и случайного шума и линейного тренда (сумма 1, 2 и 3) С помощью автокорреляционной функции можно установить размер области, в пределах которой существует зависимость между значениями признака. На расстояниях превышающих радиус нулевой корреляции проводить интерполяцию бессмысленно.

  20. Ni Cr Взаимная корреляция. В отличие от автокорреляции, при которой временной ряд сравнивается сам с собой, взаимная корреляция – это сравнение 2-х разных временных рядов с целью определить положение наибольшего соответствия.

  21. Анализ временных рядов в STATISTICA Запуск анализа Выбор переменных

  22. Выбор анализа. Сглаживание, Автокорреляция, Взаимная корреляция (кросскореляция) Гармонический анализ

  23. Сглаживание (фильтрация)

  24. Посмотреть результат сглаживания и сравнить с исходной кривой.

More Related