Как да стартирате многовариантна регресия в Excel

Преди да научим как да извършваме многовариантна регресия в Excel , е важно да имаме опреснителна информация за регресията като цяло и многовариантната регресия в частност.

Един от отличителните белези на човешката интелигентност е способността ни да разпознаваме модели около нас. Именно това ни кара да разпознаем кога две или повече неща изглеждат свързани и кога едно нещо е вероятно причината или следствието на друго.

Многовариантна регресия в Excel

Кажете например, че решавате да събирате данни за средните температури и средните валежи на определено място за цяла година, като събирате данни всеки ден. След това нанасяте данните за температурата и средните валежи върху лист милиметрова хартия. Можете да нанесете средните температурни стойности по оста x и средните стойности на валежите по оста y. Всяка точка на този разпръснат график ще има координати: х-координата и у-координата. Тези координати ще го намерят на специално място на графиката.

Докато начертавате точките, може да започнете да виждате как се появява шаблон. Може да изглежда, че - с увеличаване на средните температури - средните валежи в мястото, за което сте събирали данни, се увеличават. Двете данни, които сте събирали, са технически известни като променливи . В този случай средната температура е независимата променлива, докато средните валежи са зависимата променлива.

Когато забележите, че двете променливи са свързани, ние казваме, че те са свързани. Корелацията може да приеме много форми. Ако една променлива се покачи, докато другата се понижи, това е отрицателна корелация . Ако една променлива се покачва в тандем с другата, това е положителна корелация . Ако изглежда, че няма промяна в променливите, тогава казваме, че няма корелация.

Данни и корелации

На перфектната положителна корелация се дава стойност +1, докато на перфектната отрицателна корелация се дава стойност -1. 0, което е в средата на тези две стойности, не представлява никаква корелация. Следователно данните могат да приемат стойност на корелация навсякъде в този диапазон. Точната стойност на тази корелация е известна като коефициент на корелация, който се изчислява с помощта на специална формула за статистически данни, която съществува във вашия списък с функции на Excel.

Имайте предвид, че статистиците обичат да правят разлика между корелация и причинно-следствена връзка. Това, че две неща са свързани, не означава, че имат причинно-следствена връзка. В нашия пример по-горе фактът, че повишаването на средната температура съответства на увеличаването на средните валежи, не означава, че едното причинява другото. Може би просто трети скрит фактор причинява и двете.

В този случай е добре известно сред метеоролозите, че повишаването на влажността води до повишаване както на възприеманата температура, така и на валежите. Ето защо е важно да се разбере разграничението. Картирането на корелациите ви показва къде съществуват модели; да ви кажа, че ви показва какво причинява това, което би било, че надвишава неговото кратко.

Може да не се чувствате щастливи, че имате скатер. Може би наличието на линия през данните, която показва как изглежда връзката, би било по-лесно за разбиране. Това, което търсите, е линията на регресия или линията, която най-добре отговаря на данните, които имате преди вас. Това включва използването на формула за регресия, която използва коефициента на корелация, за да намери най-добрата линия на регресия.

Единични и многопроменливи

Забавлението не свършва дотук. Формулите по-горе са за една независима променлива и една зависима променлива. Както обаче обсъдихме по-горе, понякога в уравнението може да има повече от една независима променлива.

Например посочихме, че простото нанасяне на средната температура спрямо средните валежи не дава пълната картина. Средната влажност е още една независима променлива, която влияе както върху средната температура, така и върху средните валежи. Не би ли било отлично, ако имаше начин да начертаем средните валежи като зависима променлива спрямо двете независими променливи, които са средни валежи и средна влажност?

Както се оказва, точно това е многомерната регресия. Тя ви позволява да свържете една зависима променлива с множество независими променливи, върху които сте измерили и събрали данни.

Анализ на многовариантна регресия

Многовариантната регресия е много мощна форма за анализ на данни и се оказва по-точна, когато се прилага в реалния свят. В частност в света на бизнеса ситуациите рядко са повлияни от един фактор. Обикновено има много фактори, които работят съвместно, за да създадат резултати. Когато събирате данни за определени набори от условия, този вид анализ на данните ще ви позволи да прогнозирате данни в свързани условия.

Със силата на многовариантната регресия ще можете по-добре да разберете своя пазар и клиентите, които съществуват на него.

Регресионен анализ в Excel

Преди да се втурнете да купувате най-модерния статистически софтуер на пазара, ще се радвате да чуете, че можете да извършите регресионен анализ в Excel.

Стартирайте Excel

За да започнете многомерния си анализ в Excel , стартирайте Microsoft Excel. Кликнете върху раздела с надпис „Файл“ и след това върху бутона с надпис „Опции“. Ще се отвори диалогов прозорец.

Щракнете върху опциите

В лявата част на диалоговия прозорец има списък с опции. Кликнете върху опциите с надпис Добавки“. Ще можете да видите добавките за приложения. В списъка с неактивни добавки трябва да видите елемент с надпис Analysis ToolPak. Щракнете върху него, след което щракнете върху падащото меню до „ Добавки на Excel “. Щракнете върху бутона с надпис „Go“ в долната част и ще се появи друг диалогов прозорец с надпис „Add-Ins“ .

Поставете отметка в квадратчето

Пред опцията с надпис „Analysis ToolPak има отметка. Кликнете върху него и след това върху бутона от дясната страна на диалоговия прозорец с надпис „OK“. Това ще включи опцията, която току-що сте проверили.

Извършване на регресията

Сега е време да извършите регресията. Колоните ви ще се нуждаят от заглавия, които можете да въведете в ред 1. Данните отиват под заглавието. Имате колона специално за вашата зависима променлива. Трябва да е първата или последната колона. Независимите променливи могат да запълнят останалите колони и трябва да бъдат в последователен ред.

Раздел с данни

На лентата кликнете върху раздела с надпис „Данни“. В групата с надпис „Анализ“ кликнете върху елемента с надпис „Анализ на данни“. Ще се стартира диалогов прозорец.

Регресия

В инструментите за анализ в диалоговия прозорец потърсете Регресия и кликнете върху него, след което щракнете върху „OK“.

Зависима променлива

Сега въведете местоположението на диапазона от клетки, в който зависи вашата променлива, в полето с надпис „Input Y Range“.

Независима променлива

Сега въведете местоположението на диапазона от клетки, в който има вашата независима променлива, в полето с надпис „Input X Range“.

Поставете отметка в квадратчето

За да сте сигурни, че Excel знае, че първият ред няма нищо друго освен labels_, щракнете_ върху квадратчето с етикет „Labels“.

Щракнете върху Output Range

В раздела с надпис Output Options има радио бутон с надпис „Output Range“. Кликнете върху него и въведете диапазон за вашите данни в първия, за да определите къде ще се появи изходът от регресионния анализ. В случай, че искате резултатите ви да се появят в отделен работен лист, щракнете върху бутона за избор с надпис „Работен лист.“ Ако изобщо ги искате в нов файл, щракнете върху бутона за избор с надпис „Нова работна книга“.

Остатъци

Има раздел в диалоговия прозорец Регресия“ с надпис „Остатъци“. Това са обобщения на резултатите от вашия анализ, които разглеждат резултатите за всеки отделен случай. Те сравняват прогнозата с действителния резултат. Стандартизираните остатъци ще вземат стандартното отклонение на вашите остатъци и ще го коригират на 1.

Щракнете върху квадратчето за отметка на опцията, обозначена „Парцел“, и резултатите ви ще бъдат изобразени. Ако изберете „График на остатъци“, тогава ще бъдат изобразени само остатъците. Ако изберете „Line Fit Plot “, тогава прогнозата ще бъде начертана спрямо действителните резултати. Кликнете върху „OK“ и вашата регресия ще започне да се обработва. Можете да видите резултатите по-късно на мястото, което сте посочили по-рано.