Kako pokrenuti regresiju u Excelu

Sadržaj:

Kako pokrenuti regresiju u Excelu
Kako pokrenuti regresiju u Excelu
Anonim

Regresija u Excelu način je automatizacije statističkog procesa uspoređivanja nekoliko skupova informacija kako bi se vidjelo kako promjene u nezavisnim varijablama utječu na promjene u zavisnim varijablama. Ako ste ikada željeli pronaći korelaciju između dvije stvari, korištenje regresijske analize u Excelu jedan je od najboljih načina za to.

Upute u ovom članku odnose se na Excel 2019, Excel 2016, Excel 2013, Excel 2010.

Što je značenje regresije?

Regresija je pristup statističkom modeliranju koji analitičari koriste za određivanje odnosa između više varijabli.

Regresijska analiza počinje s jednom varijablom koju pokušavate analizirati i nezavisnim varijablama koje testirate da vidite utječu li na tu pojedinačnu varijablu. Analiza promatra promjene u nezavisnim varijablama i pokušava povezati te promjene s rezultirajućim promjenama u jednoj (ovisnoj) varijabli.

Ovo može zvučati kao napredna statistika, ali Excel čini ovu složenu analizu dostupnom svima.

Izvođenje linearne regresije u Excelu

Najjednostavniji oblik regresijske analize je linearna regresija. Jednostavna linearna regresija promatra odnos između samo dvije varijable.

Na primjer, sljedeća proračunska tablica prikazuje podatke koji sadrže broj kalorija koje je osoba pojela svaki dan i njihovu težinu tog dana.

Image
Image

Budući da ova proračunska tablica sadrži dva stupca podataka, a jedna varijabla potencijalno može utjecati na drugu, možete pokrenuti regresijsku analizu ovih podataka koristeći Excel.

Omogućivanje dodatka Analysis ToolPak

Prije nego što možete koristiti Excelovu značajku regresijske analize, trebate omogućiti dodatak Analysis ToolPak na ekranu Excel Options.

  1. U Excelu odaberite File izbornik i odaberite Options.

    Image
    Image
  2. Odaberite Add-ins u lijevom navigacijskom izborniku. Zatim provjerite je li Excel Add-ins odabrano u polju Manage.

    Image
    Image
  3. Na kraju odaberite gumb Go.

    Image
    Image
  4. U skočnom prozoru Dodaci. Omogućite Analysis ToolPack klikom na okvir ispred njega da dodate kvačicu i odaberete OK.

    Image
    Image

Sada kada je Analysis ToolPak omogućen, spremni ste za početak rada regresijske analize u Excelu.

Kako izvesti jednostavnu linearnu regresiju u Excelu

Koristeći proračunsku tablicu težine i kalorija kao primjer, možete izvesti linearnu regresijsku analizu u Excelu na sljedeći način.

  1. Odaberite Podaci izbornik. Zatim u grupi Analiza odaberite Analiza podataka.

    Image
    Image
  2. U prozoru Analiza podataka odaberite Regresija s popisa i kliknite OK.

    Image
    Image
  3. Ulazni Y raspon je raspon ćelija koji sadrži zavisnu varijablu. U ovom primjeru to je težina. Ulazni raspon X je raspon ćelija koji sadrži nezavisnu varijablu. U ovom primjeru, to je stupac kalorija.

    Image
    Image
  4. Odaberite Oznake za ćelije zaglavlja, a zatim odaberite Novi radni list za slanje rezultata na novi radni list. Odaberite OK kako bi Excel pokrenuo analizu i poslao rezultate u novi list.

    Image
    Image
  5. Pregledajte novi radni list. Izlaz analize ima niz vrijednosti koje morate razumjeti da biste protumačili rezultate.

    Image
    Image

    Svaki od ovih brojeva ima sljedeća značenja:

    • Multiple R: Koeficijent korelacije. 1 označava jaku korelaciju između dvije varijable, dok -1 znači da postoji jaka negativna povezanost. 0 znači da nema korelacije.
    • R Square: Koeficijent determinacije, koji pokazuje koliko točaka između dvije varijable pada na regresijsku liniju. Statistički, ovo je zbroj kvadrata odstupanja od srednje vrijednosti.
    • Prilagođeni R kvadrat: Statistička vrijednost nazvana R kvadrat koja je prilagođena za broj nezavisnih varijabli koje ste odabrali.
    • Standardna pogreška: Koliko su precizni rezultati regresijske analize. Ako je ova pogreška mala, onda su vaši rezultati regresije točniji.
    • Observations: Broj opažanja u vašem regresijskom modelu.

    Preostale vrijednosti u izlazu regresije daju vam detalje o manjim komponentama u analizi regresije.

    • df: Statistička vrijednost poznata kao stupnjevi slobode koji se odnose na izvore varijance.
    • SS: Zbroj kvadrata. Omjer rezidualnog zbroja kvadrata u odnosu na ukupni SS trebao bi biti manji ako većina vaših podataka odgovara regresijskoj liniji.
    • MS: Srednji kvadrat regresijskih podataka.
    • F: F statistika (F-test) za nultu hipotezu. Ovo daje značajnost regresijskog modela.
    • Značaj F: Statistička vrijednost poznata kao P-vrijednost F.

    Osim ako ne razumijete statistiku i izračunavanje regresijskih modela, vrijednosti na dnu sažetka neće imati puno značenja. Međutim, višestruki R i R kvadrat su dva najvažnija.

Kao što možete vidjeti, u ovom primjeru, kalorije imaju jaku korelaciju s ukupnom težinom.

Višestruka analiza linearne regresije u Excelu

Za izvođenje iste linearne regresije, ali s više nezavisnih varijabli, odaberite cijeli raspon (više stupaca i redaka) za Ulazni raspon X.

Image
Image

Kada birate više nezavisnih varijabli, manja je vjerojatnost da ćete pronaći tako jaku korelaciju jer postoji toliko mnogo varijabli.

Međutim, regresijska analiza u Excelu može vam pomoći pronaći korelacije s jednom ili više onih varijabli za koje možda niste svjesni da postoje samo ručnim pregledom podataka.

Preporučeni: