1 / 25

97 , 72 % встречающихся значений нормально распределённой случайной величины имеют значения,

97 , 72 % встречающихся значений нормально распределённой случайной величины имеют значения, не превышающие 2t ( t= µ + σ , где µ - математическое ожидание; σ – стандартное отклонение). 99,38% - µ + 2 ,5 σ. 99,87% - µ + 3 σ.

Download Presentation

97 , 72 % встречающихся значений нормально распределённой случайной величины имеют значения,

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 97,72% встречающихся значений нормально распределённой случайной величиныимеют значения, не превышающие 2t (t=µ+σ, где µ - математическое ожидание; σ – стандартное отклонение) 99,38% - µ+ 2,5σ 99,87% - µ+ 3σ 68,27% наиболее часто встречающихся значений нормально распределённой случайной величины лежат в интервале от -t до +t (t=µ±σ, где µ - математическое ожидание; σ – стандартное отклонение 95,45% - в интервале µ± 2σ 99,73% - в интервале µ± 3σ Эти соотношения широко используются в статистических критериях.

  2. Например, мы можем считать аномальной геохимическую пробу, в которой содержание элемента индикатора превысит 3t, при этом вероятность ошибки будет составлять всего 0,13% Пример: Пусть среднее фоновое содержание Pb*10-3 % на участке равно 10 и стандартное отклонение 5. Тогда минимально аномальное содержание для единичной пробы будет = µ + 3σ=10+3*5 = 25. (для нескольких смежных проб эта граница уменьшается до , где n – число смежных проб ≤ 9. Например, для 9 смежных проб минимально аномальным содержанием будет µ + σ = 10+5 = 15) Чтобы использовать эти вероятности, надо выполнить ряд условий, которые редко осуществимы на практике. Мы обычно не знаем истинных значений параметров распределения (μ и σ2), т.к. не можем измерить всё множество элементов генеральной совокупности. Вместо этого, мы оцениваем эти параметры по выборке. Наши оценки допускают некоторую степень неопределённости, которую можно учесть, если использовать распределение с более широкой областью значений, чем у нормального распределения. Одно из распределений такого типа называется t – распределением Стъюдента.

  3. Распределение Стьюдента (t– распределение) Критерий Стьюдента был разработан английским химиком У.Госсетом (William Sealy Gosset), когда он работал на пивоваренном заводе Гиннеса и по условиям контракта не имел права открытой публикации своих исследований. Поэтому публикации своих статей по t-критерию У.Госсет сделал в 1908г. в журнале "Биометрика" под псевдонимом "Student", что в переводе означает "Студент". В отечественной же литературе принято писать "Стьюдент". Коварная простота вычисления t-критерия Стьюдента, а также его наличие в большинстве статистических пакетов и программ привели к широкому использованию этого критерия даже в тех условиях, когда применять его нельзя. Функция плотности вероятности Интегральная функция Параметром распределения Стьюдента является Число степеней свободы k , зависящее от объёма выборки. При увеличении значения k распределение приближается к нормальному и в пределе (при k = ) совпадает с ним. Практически уже при k = 20 можно пользоваться таблицами нормального распределения.

  4. +t t 0 –t Коэффициенты вероятности tраспределения Стьюдента при заданной вероятности  и степени свободы k

  5. Логнормальное распределение. Случайная величина X имеет логнормальное распределение с параметрами μ, σ, если X = exp(Y), где Y имеет нормальное распределение с параметрами μ, σ. Случайная величина с логнормальным распределением является непрерывной, и принимает только положительные значения. Графики плотности Логнормальным законом удовлетворительно описывается частота появления низких содержаний химических элементов. Академик А.Н.Колмогоров теоретически обосновал логнормальное распределение частиц при дроблении, что используется при гранулометрическом анализе обломочных пород. При расчетах вначале находят натуральные или десятичные логарифмы значений случайной величины. Далее вся работа ведется с логарифмами: вычисляют их среднее значение, дисперсию, среднеквадратичное отклонение, асимметрию, эксцесс, а по таблицам нормального закона определяют вероятности. Так как логарифм нуля равен –, обычно нулевые содержания заменяют какими-то минимальными значениями, например половиной предела чувствительности анализа.

  6. При логнормальном распределении: Математическое ожидание Дисперсия Стандартное отклонение Коэффициент вариации - среднее значение натуральных логарифмов исходных данных В этих формулах: - дисперсия натуральных логарифмов исходных данных

  7. Расчёт необходимого числа измерений n для достижения заданной погрешности среднего значения. Геологическое приложение одномерной статистической модели. Точечная оценка погрешности (ошибки) среднего значения Интервальная оценка математического ожидания случайной величины. Выделение аномальных значений. Проверка гипотез о равенстве математических ожиданий (сравнение средних).

  8. Среднее значение из n независимых значений случайной величины также является случайной величиной. Если случайная величина имеет дисперсию , то среднее значение имеет дисперсию в n раз меньше. Распределение стремится к нормальному при увеличении n. Дисперсия выборочных средних значений Стандартное отклонение выборочных средних значений называется стандартной ошибкой среднего или абсолютной ошибкой среднего, Относительная погрешность среднего - Среднее значение случайной величины - Выборочное стандартное отклонение - Коэффициент вариации Точечная оценка погрешности (ошибки) среднего значения В этих формулах:

  9. Стандартная ошибка среднего , вычисленная по выборке, определяет интервал значений, в пределах которого с определённой вероятностью находится математическое ожидание генеральной совокупности. - коэффициент вероятности t-распределения Стьюдента для заданной вероятности q и объёма выборки n+1 Интервальная оценка среднего – t < М(х) <  + t. Интервальная оценка математического ожидания случайной величины. При n>100:

  10. Если вы оценили среднее значение ( ) и стандартную ошибку ( ) по 21 наблюдению, то интервальная оценка математического ожидания совокупности ( ) будет равна Другими словами, в 95 случаях из 100 математическое ожидание совокупности, из которой извлечена выборка, Будет лежать в интервале Коэффициенты вероятности t распределения Стьюдента при заданной вероятности  и степени свободы k Значение t можно получить в MS EXEL функцией СТЬЮДРАСПОБР

  11. С вероятностью 95 % выборочное среднее будет попадать в интервал Интервальная оценка математического ожидания случайной величины. С вероятностью 68,2% выборочное среднее будет попадать в интервал 0.4 И наоборот, математическое ожидание совокупности находится в интервале с вероятностью 95,4% 0.2 0.0 2 4 3 -3 -2 1 -1 -4

  12. q = 95 % q =68,2% Интервальная оценка математического ожидания случайной величины. Графическая форма представления интервальной оценки – диаграмма размаха (ящик с усами)

  13. - Среднее значение случайной величины - Выборочное стандартное отклонение - Коэффициент вариации - Стандартная ошибка среднего Расчёт необходимого числа измерений n для достижения заданной относительной погрешности среднего значения В этих формулах: Значения вероятностей нормального распределения (могут использоваться в качестве приближённых значений коэффициентов вероятности распределения Стьюдента при объёме выборки > 30) t - Коэффициент вероятности распределения Стьюдента

  14. Распространенный способ выделения аномальных значений называется правилом«трех сигм» и основан на том, что случайная величина при нормальном законе распределения практически полностью (на 99,7 %) заключена в пределах от до Выделение аномальных значений. Если значение случайной величины отличается от среднего значения больше чем на 3, то оно является аномальным.При этом испытуемое значение не должно участвовать в расчете среднего значения и среднеквадратичного отклонения. Если распределение случайной величины логнормальное, то правило «трех сигм» применяется к логарифмам значений, что используется при геохимическом методе поисков месторождений для выделения геохимических аномалий.

  15. =0,2787+3*0,6897=0,2787+2,0691=2,3478 = 10,46 =1,195+3*0,5419=1,195+1,62=2,815 =1,279+3*0,6278=1,279+1,884=3,163

  16. Критерий Н.В. Смирнова Если U1 > критического значения Ua при выбранном уровне значимости α или   Un >  Ua, нулевая гипотеза отклоняется, т. е. выброс xmin или xmax не случаен, не характерен для рассматриваемой совокупности данных. В этом случае значение xmin или xmax исключают из рассмотрения, а найденные ранее оценки и s подвергают корректировке с учетом отброшенных результатов. - выборочное среднее значение случайной величины - смещённая выборочная дисперсия Использование критерия Н.В.Смирнова предполагает нормальное распределение изучаемой случайной величины. Критерий действителен для наиболее широко встречающихся случаев, при которых генеральные параметры неизвестны, а известны лишь их оценки, произведенные на основании анализируемой выборки. нормальное распределение

  17. - дисперсия исходной совокупности - дисперсия после исключения n предполагаемых аномальных значений. Критерий Титьена – Мура Если изнормальнораспределенной совокупности, содержащей N значений, исключить n максимальных или минимальных значений, то дисперсия уменьшится , и по степени ее уменьшения можно судить об аномальности исключенных значений. где Критерий Титьена – Мура при  = 0,05

  18. Проверка гипотез о равенстве математических ожиданий (сравнение средних). Задача сравнения средних значений возникает при решении широкого круга геологических задач: вопрос о комагматичности эффузивных и интрузивных образований о принадлежности интрузивных тел к определённому магматическому комплексу нескольких вулканических построек к одному глубинному очагу внешний контроль опробования вопрос о возможности замены трудоёмких и дорогих аналитических методов более быстрыми и дешёвыми степень влияния состава пород на геохимический фон возможность использования геофизических методов для выделения пород разного состава Статистические методы используются в тех случаях, когда путём визуального сравнения средних невозможно уверенно решить вопрос об их сходстве или различии. Особенно часто это бывает, когда объем выборок невелик, а значения свойств обладают большой изменчивостью Для решения подобных задач в статистике используются параметрические и непараметрические критерии. Параметрические критерии основаны на известных законах распределения (Стьюдента, Фишера и др.). Для их применения необходимо, чтобы выборочные данные соответствовали определённому закону распределения. Непараметрические критерии могут использоваться при любом, в том числе и неизвестном законе распределения. Они часто применяются при малых объёмах выборок, когда из-за недостаточного количества данных невозможно провести тест на соответствие определённому закону распределения. Кроме того, непараметрические методы позволяют анализировать данные, измеренные в порядковой шкале. Однако непараметрические критерии обладают меньшей мощностью (т.е большей вероятностью принятия ошибочного решения) и менее чувствительны.

  19. и - дисперсии выборок случайных величин xи y и - выборочные дисперсии основных xи контрольных yпроб и - выборочные средние случайных величин xи y и - объёмы выборок случайных величин xи y Параметрические критерии. t-критерий Стьюдента. Для независимых выборок Количество степеней свободы = Для зависимых выборок r – коэффициент линейной корреляции xи y n – количество сравниваемых пар xиy

  20. t-критерий Стьюдента. Величина t распределена по закону Стьюдента с числом степеней свободы = n1+n2-2 Критерий двухсторонний. Критические значения можно найти по таблицам коэффициентов вероятности t распределения Стьюдента. Критерий двухсторонний. Критические значения можно найти по таблицам коэффициентов вероятности t распределения Стьюдента. в пакете STATISTICAс помощью вероятностного калькулятора, в пакете STATISTICAс помощью вероятностного калькулятора, в MS EXELс помощью функции СТЬЮДРАСПР в MS EXELс помощью функции СТЬЮДРАСПР Если рассчитанное значение t превысит критическое при заданном уровне значимостии числе степеней свободы = n1+n2-2, гипотеза о равенстве средних отвергается.

  21. Для использования t-критерия выборки должны быть отобраны из совокупностей, имеющих нормальное распределение и равные дисперсии при неравенстве дисперсий применять t-критерий не рекомендуется. Равенство дисперсий легко проверяется с помощью F-критерия Фишера: где и - дисперсии выборок, причём > График плотности вероятности F-распределения Ограничения применения t-критерия Стьюдента и проверка гипотезы о равенстве дисперсий При этом отклонение от нормальности распределения оказывает небольшое влияние на результат, в то время как (В числитель всегда ставится большая дисперсия). Параметрами распределения Фишера являются числа степеней свободы числителя n1 и знаменателя n2 Число степеней свободы равно объёму выборки - 1. Если рассчитанное значение F превысит критическое при заданном уровне значимости a и числах степеней свободы числителя и знаменателя n1 и n2, гипотеза о равенстве дисперсий отвергается c вероятностью ошибки = a.

  22. Проверка равенства дисперсийй с помощью F-критерия Фишера Критерий односторонний. Критические значения можно найти по таблицам коэффициентов вероятности F распределения Фишера, в пакете STATISTICAс помощью вероятностного калькулятора, в MS EXELс помощью функции ФТЕСТ Если рассчитанное значение F превысит критическое при заданном уровне значимостиaи числе степеней свободы n1, n2, гипотеза о равенстве средних отвергаетсяс вероятностью 1-a

  23. Выборка 1 Выборка 2 Ранги Непараметрические критерии сравнения средних. Если гипотеза о равенстве дисперсий отвергается, надо применять непараметрические критерии сравнения средних. Непараметрические методы сравнения средних основаны на замене выборочных значений групп их рангами в обобщённой выборке. В качестве примера можно рассмотреть U - критерий Манна-Уитни, который представляет собой непараметрическую альтернативу t-критерию для независимых выборок. U-статистика представляет собой общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза об отсутствии различий в средних значениях верна, то при объёме выборок > 20,U-статистика распределена нормально с математическим ожиданием mn/2 и дисперсией nm(n+m+1)/12, где n и m объёмы выборок. Порядок вычислений: 1) разделить единый ранжированный ряд на два, состоящие соответственно из элементов первой и второй выборок; 2) подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно — на долю элементов второй выборки; 3) определить большую из двух ранговых сумм (Tx), соответствующую выборке с nx элементов; 4) определить значение U-критерия Манна — Уитни по формуле ; 5) По таблице определить критическое значение критерия для данных n1 и n2. 6) Сравнить рассчитанное значение с критическим и принять решение. Гипотеза об отсутствии различий отвергается, если рассчитанное значение U окажется МЕНЬШЕили равно табличному критическому значению.

  24. Критические значениякритерия U Манна-Уитни при объёме выборок > 20,U-статистика распределена нормально с математическим ожиданием mn/2 и дисперсией nm(n+m+1)/12, где n и m объёмы выборок.

More Related