140 likes | 502 Views
Прогнозиране Основи на регресионния анализ.
E N D
ПрогнозиранеОснови на регресионния анализ Регресионният анализ - направление в математическатастатистика, изучават се и оценяват възможните функционални зависимости между две или повече случайни величини (променливи, показатели). Той дава оценка на връзката между една зависима променлива и една или повече независими променливи. Основни въпроси са: съществува ли функционална зависимост между две зависими случайни величини; ако съществува да се намери функция, която да я описва достатъчно точно и доколко е адекватен този модел на действителността. регресионно уравнение - линейна, квадратична, експоненциална и т.н. причинно-следствената последователност на измерваните величини, една зависима и една или няколко независими променливи и кои са те. Регресионният анализ - кои са причините, причинно-следствени връзки. Цели на регресионния анализ са: да определи как - функцията; в каква степен зависимата променлива се променя като функция от изменения на независимата променлива. Независимата/-ите променлива/-и се явява причината. Повече от една независима променлива - факторен анализ. Силата на зависимостта между величините определя се от корелационния анализ. Изследователят определя, кои променливи да бъдат зависими и кои независими.
Полиномна регресия Линейната регресия често пъти не удовлетворява данните. Полиноми от степен . • Познаване на явлението, което се изследва и сродните му такива, за да се зададе най-подходящ израз за търсената зависимост. • Степента се дефинира предварително, методът на най-малките квадрати за определяне на коефициентите и свободния член в полинома. Excel и другите програмни продукти извършват полиномна регресия максимум от 6 степен. Многомерна регресия Използва се, когато има експериментални точки с повече от две координати, функцията зависи от повече от един аргумент. В Excel не се използва многомерна регресия. С нея работят специализираните програмни продукти като MatLab, SPSS и др.
Корелационен анализ, 1 Корелационният индекс - степента, в която две променливи са взаимно свързани. Цел на корелационния анализ - да се определи степента на свързаност между две величини. Корелационният анализ се прилага, когато има данни за две различни променливи - x (независимата променлива -фактора), y (зависимата променлива - резултата). коефициент на Pearson = Характеристики на корелационния коефициент: • Безразмерна величина е, не зависи от мерните единици на двете променливи (метри, секунди и други) • Число е между -1 и +1, което показва: • степента на връзка между двете променливи; • посоката на връзката; • положителна, когато двете променливи едновременно растат или намаляват; • отрицателна, когато единият показател расте, а другият намалява или обратно.
Разпределение на стойностите на (x,y) и коефициентите на корелация. Корелационен анализ, 2 • Коефициентът на корелация - R. стойност от (-1) до 1. • R=0 - няма линейна връзка между променливите, т.е няма никаква корелация. • R=1 или R=-1 - има пълна линейна връзка между двете променливи, диаграмата в тези случаи е права линия. • R>0 - има права зависимост между двете променливи - при нарастване на x, нараства и y. • R<0 - има обратна зависимост - с нарастване на x, намалява yили обратното. Коефициентът на корелация изразява линейна зависимост (фиг. 1-ви ред), но не описва крива на зависимост (средния ред) и не подхожда за описание на сложни, нелинейни зависимости (последния ред). 1-ва скала: 0 < R < 0,3 – слаба корелация 0,3 < R < 0,5 – умерена корелация 0,5 < R < 0,7 – значителна корелация 0,7 < R < 0,9 – висока корелация 0,9 < R < 1,0 - много висока корелация 2-ра скала: 0 - 0,2 – слаба корелация 0,2 – 0,4 – умерена корелация 0,4 – 0,6 – значителна корелация 0,6 – 0,8 – висока корелация 0,8 – 1,0 - много висока корелация
Корелационен анализ, 3 Корелационният коефициент e по-лесен за работа, когато е повдигнат на квадрат. Зависимостта между двете променливи като процент от вариации(отклонения) между тях - коефициент на детерминация (определеност): • R=0,5, R2=(0,5)2 x100=25% - в 25% от случаите промените в едната променлива ще доведат до промени в другата. Допълнението до 1 е 75% - коефициентът на неопределеност - K2=75%, определя неопределеността на между променливите. • R=0,9. и R2=(0,9)2 x100=81%. – в 81% от случаите промените в едната променлива водят до промени в другата.
Линейна регресия с Excel Excelизползва пет метода за изчисляване на линейна регресия: • Използване на вградени функции на Excel; • Използване на Excel Add-Ins за анализ на данни; • Използване на Excel диаграми за анализ; • Използване на Excel матрична функция; • Използване на електронни листи на Excel за ръчно изчисляване.
1. Използване функции на Excelза работа с линейната регресия • Вградени функции за линейна регресия: • SLOPE – определя наклона на линейната регресия по експерименталните данни за x и y; • INTERCEPT – определя точката, в която графиката на функцията на линейната регресия пресича ордината y, използвайки експ. стойности на x и y; • CORREL - определя корелационния коефициент между двата масива от експериментални данни. Годините - независима променлива, а раждаемостта – зависимата. • year - област на годините, population - област на изменение на раждаемостта. Коефициентът на корелация е: • CORREL(year, population)=0,999, много висока корелация. • Линейната регресия зависимостите са: Slope(population, year) и Intercept (population, year). • population = next year*slope+intercept.
Активиране на Analysis Tool pack. Активиране на Regression от Data Analysis. Диалоговияат прозорец на регресията. 2. Използване на Data Analysisна Excel от Add-Ins за линейна регресия Помощните средства, команди-приставки (Add-Ins) и помощници (wizard - магьосници). • наклонът е 0.1006; • точката на пресичане на ординатата е -193.148 следващата 2006 година раждаемостта е:
Маркиране на опциите Display equation on chartи Display R-squared value on chart. Избиране типа на регресионната линия. XY диаграма. Добавяне на линия на тенденцията (Trendline). Регресионна линия, уравнение на регресионния модел и корелациониня коефициент. 3. Създаване на регресионен модел с изчисляване на тенденцията на диаграма в Excel Графика от експерименталните данни - регресионната линия и регресионното уравнение.