210 likes | 686 Views
Корреляция и регрессия. План. Понятие о корреляции. Типы корреляции. Корреляционный коэффициент. Корреляционное отношение. Регрессия. Корреляция качественных признаков. Корреляция означает связь, соотношение, сопряженность. Два вида связи: функциональная корреляционная
E N D
Корреляция и регрессия. План. Понятие о корреляции. Типы корреляции. Корреляционный коэффициент. Корреляционное отношение. Регрессия. Корреляция качественных признаков.
Корреляция означает связь, соотношение, сопряженность. Два вида связи: • функциональная • корреляционная Функциональная связь - это такая связь, при которой каждому значению одной величины соответствует строго определенное единственное значение другой величины. Корреляционная связь – это такая связь, при которой среднему значению одной величины соответствует несколько значений другой величины.
Корреляционная связь бывает нескольких типов: • простая • множественная. Простая корреляционная связь – это такая связь, когда исследования ведутся между двумя признаками: урожайность – предшественник урожайность – сорт урожайность – удобрение. Множественная корреляционная связь – это такая связь, когда зависимость исследуется между 3 –мя и более показателями: сорт урожайность предшественник удобрения
Корреляционная связь может быть прямолинейная и криволинейная. Прямолинейная связь – это такая связь, при которой с увеличением среднего значения одной величины - среднее значение другой величины увеличивается или с увеличением среднего значения одной величины среднее значение другой величины уменьшается. Связь криволинейная наблюдается когда с увеличением среднего значения одного признака – среднее значение другого сначала увеличивается, а потом уменьшается.
Корреляционный коэффициент. Коэффициент корреляции r-указывает на силу связи и на направление связи. Изменяется коэффициент корреляции от -1 до +1. Число указывает на силу связи, знак (+) на направление связи. По значению r связь может быть слабой – коэффициент корреляции изменяется от 0 до 0,33, средняя – от 0,33 до 0,66, сильная – от 0,66 до 0,99, полная r = 1.
∑х ∑у n ∑(х – х)(у – у) ∑(х –х) ∑(у – у) ху – ∑ 2 2 [ (∑х) n 2 ] [ 2 ] √ √ (∑у) n 2 2 Коэффициент корреляции: r = = х, у – индивидуальное значение х, у – среднее. Ошибка коэффициента корреляции: Sr = n – число пар Коэффициент корреляции всегда записывается вместе со своей ошибкой: r + Sr 0,73+ 0,03 ∑х – ∑у – √ 1-r n-2 2
Если число наблюдений n 100 – то существенность корреляционной зависимости определяется по критерию t –Стьюдента: tф = t теор определяется при заданном уровне вероятности или значимости и числе свободы: = n-2 tф ≥t теор - связь существенная, tф <t теор - связь не существенная. r Sr
2 Квадрат коэффициента корреляции r называется коэффициентом детерминации и обозначается dyx. r = dyx dyx - указывает на долю тех изменений, которые связаны с изучаемым признаком. r = 0,5 dyx = 0,25 2
η (эта) – корреляционное отношение. Если r = η-прямолинейная зависимость. Если η >r – криволинейная зависимость.
Регрессия показывает количественное изменение результативного признака у (функции) по мере изменения независимого признака х (аргумента). Коэффициент регрессии в показывает как изменяется величина по мере изменения другой величины на единицу измерения. вух (зависимость у от х) вху (зависимость х от у)
Регрессия может быть простая и множественная. Регрессия также может быть прямолинейная и криволинейная. Коэффициент регрессии рассчитывается: вух = вху = вух * вху = r ∑(х – х)(у – у) ∑ (х – х) 2 ∑(х – х)(у – у) ∑ (у - у) 2 2
Ошибка коэффициента регрессии рассчитывается: √ ∑( у – у) ∑(х – х) 2 2 Sвух = Sr Sвху = Sr tв = tтеор по таблице Стьюдента для принятого уровня вероятности и числа степеней свободы = n – 2 tr = tв √ ∑(х – х) ∑(у – у) 2 2 в – коэффициент регрессии Sв – ошибка регрессии
Корреляция качественных признаков n1*n4 – n2*n3 N1*N2*N3*N4 Расчет ведется по формуле Юла: r = где n1*n2– частоты признаков с одинаковыми значениями клеток n2*n3 – частоты признаков с различными значениями клеток N1*N2 – суммы частот по строкам N3*N4 – суммы частот по столбцам √
Коэффициент корреляции между качественными и количественными признаками вычисляют по формуле: x1 – х S n1 n – n1 √ * r = х – общее среднее для количественного признака х1 – среднее значение количественного признака с наличием качественного n – общее число всех наблюдений n1 – число случаев с наличием качественного признака S – общее стандартное отклонение для количественного признака