Kako napraviti T test u Excelu

Sadržaj:

Kako napraviti T test u Excelu
Kako napraviti T test u Excelu
Anonim

T-test je način odlučivanja postoje li statistički značajne razlike između skupova podataka, koristeći Studentovu t-distribuciju. T-test u Excelu je T-test s dva uzorka koji uspoređuje srednje vrijednosti dva uzorka. Ovaj članak objašnjava što znači statistička značajnost i pokazuje kako napraviti T-test u Excelu.

Upute u ovom članku odnose se na Excel 2019, 2016, 2013, 2010, 2007; Excel za Microsoft 365 i Excel Online.

Image
Image

Što je statistički značaj?

Zamislite da želite znati koja će od dvije kockice dati bolji rezultat. Bacite prvu kockicu i dobijete 2; bacite drugu kockicu i dobijete 6. Govori li vam to da drugi kockica obično daje više rezultate? Ako ste odgovorili: "Naravno da ne," tada već imate neko razumijevanje statističke važnosti. Razumijete da je razlika nastala zbog nasumične promjene rezultata, svaki put kada se kockica baci. Budući da je uzorak bio vrlo mali (samo jedan kolut), nije pokazao ništa značajno.

Sada zamislite da bacate svaku kockicu 6 puta:

  • Prva kocka baca 3, 6, 6, 4, 3, 3; Srednja vrijednost=4,17
  • Drugi kockica baca 5, 6, 2, 5, 2, 4; Srednja vrijednost=4,00

Dokazuje li ovo sada da prvi kockica daje bolje rezultate od drugog? Vjerojatno ne. Mali uzorak s relativno malom razlikom između srednjih vrijednosti čini vjerojatnim da je razlika još uvijek posljedica slučajnih varijacija. Kako povećavamo broj bacanja kockica, postaje teško dati zdravorazumski odgovor na pitanje - je li razlika između rezultata rezultat slučajne varijacije ili postoji veća vjerojatnost da će jedan dati više rezultate od drugog?

Značajnost je vjerojatnost da je opažena razlika između uzoraka posljedica slučajnih varijacija. Značaj se često naziva alfa razina ili jednostavno 'α'. Razina pouzdanosti, ili jednostavno 'c,' je vjerojatnost da razlika između uzoraka nije posljedica slučajne varijacije; drugim riječima, da postoji razlika između temeljnih populacija. Prema tome: c=1 – α

Možemo postaviti 'α' na bilo koju razinu kako bismo bili sigurni da smo dokazali značaj. Vrlo često se koristi α=5% (95% pouzdanost), ali ako želimo biti stvarno sigurni da razlike nisu uzrokovane nasumičnim varijacijama, možemo primijeniti višu razinu pouzdanosti, koristeći α=1% ili čak α=0,1 %.

Različiti statistički testovi koriste se za izračunavanje značajnosti u različitim situacijama. T-testovi se koriste kako bi se utvrdilo jesu li srednje vrijednosti dviju populacija različite, a F-testovi se koriste kako bi se utvrdilo jesu li varijance različite.

Zašto testirati statistički značaj?

Kada uspoređujemo različite stvari, moramo koristiti testiranje značajnosti kako bismo utvrdili je li jedna bolja od druge. Ovo se odnosi na mnoga polja, na primjer:

  • U poslu ljudi trebaju uspoređivati različite proizvode i marketinške metode.
  • U sportu ljudi trebaju uspoređivati različitu opremu, tehnike i natjecatelje.
  • U inženjerstvu ljudi trebaju uspoređivati različite dizajne i postavke parametara.

Ako želite testirati ima li nešto bolje rezultate od nečeg drugog, u bilo kojem polju, trebate testirati statističku značajnost.

Što je studentova T-distribucija?

Studentova t-distribucija slična je normalnoj (ili Gaussovoj) distribuciji. Ovo su obje raspodjele u obliku zvona s većinom rezultata blizu srednje vrijednosti, ali neki rijetki događaji prilično su daleko od srednje vrijednosti u oba smjera, što se naziva repovima distribucije.

Točan oblik Studentove t-distribucije ovisi o veličini uzorka. Za uzorke veće od 30 vrlo je sličan normalnoj distribuciji. Kako se veličina uzorka smanjuje, repovi postaju sve veći, što predstavlja povećanu nesigurnost koja proizlazi iz donošenja zaključaka na temelju malog uzorka.

Kako napraviti T-test u Excelu

Prije nego što možete primijeniti T-test da odredite postoji li statistički značajna razlika između srednjih vrijednosti dvaju uzoraka, prvo morate izvesti F-test. To je zato što se za T-test provode različiti izračuni ovisno o tome postoji li značajna razlika između varijanci.

Potreban vam je Analysis Toolpak dodatak za izvođenje ove analize.

Provjera i učitavanje dodatka Analysis Toolpak

Da biste provjerili i aktivirali Analysis Toolpak, slijedite ove korake:

  1. Odaberite FILE karticu >odaberite Opcije.
  2. U dijaloškom okviru Opcije odaberite Add-Ins s kartica s lijeve strane.
  3. Na dnu prozora odaberite padajući izbornik Upravljanje, zatim odaberite Excel dodaci. Odaberite Idi.

    Image
    Image
  4. Provjerite da je potvrdni okvir pored Analysis Toolpak označen, zatim odaberite OK.

  5. Paket alata za analizu sada je aktivan i spremni ste primijeniti F-testove i T-testove.

Izvođenje F-testa i T-testa u Excelu

  1. Unesite dva skupa podataka u proračunsku tablicu. U ovom slučaju, razmatramo prodaju dvaju proizvoda tijekom tjedna. Također se izračunava srednja dnevna vrijednost prodaje za svaki proizvod, zajedno sa svojom standardnom devijacijom.

    Image
    Image
  2. Odaberite karticu Podaci > Analiza podataka

    Image
    Image
  3. Odaberite F-Test dva uzorka za varijacije s popisa, zatim odaberite OK.

    Image
    Image

    F-test je vrlo osjetljiv na nenormalnosti. Stoga bi moglo biti sigurnije koristiti Welchov test, ali to je teže u Excelu.

  4. Odaberite raspon varijable 1 i raspon varijable 2; postavite Alpha (0,05 daje 95% pouzdanosti); odaberite ćeliju za gornji lijevi kut ispisa, uzimajući u obzir da će to ispuniti 3 stupca i 10 redaka. Odaberite OK.

    Image
    Image

    Za raspon za varijablu 1 mora se odabrati uzorak s najvećom standardnom devijacijom (ili varijancom).

  5. Pogledajte rezultate F-testa kako biste utvrdili postoji li značajna razlika između varijanci. Rezultati daju tri važne vrijednosti:

    • F: Omjer između varijanci.
    • P(F<=f) one-tail: Vjerojatnost da varijabla 1 zapravo nema veću varijancu od varijable 2. Ako je ovo veće od alfa, što je općenito 0,05, tada nema značajne razlike između varijanci.
    • F Kritični one-tail: Vrijednost F koja bi bila potrebna da se dobije P(F<=f)=α. Ako je ova vrijednost veća od F, to također znači da nema značajne razlike između varijanci.

    P(F<=f) također se može izračunati pomoću funkcije FDIST s F i stupnjevima slobode za svaki uzorak kao ulaznim podacima. Stupnjevi slobode su jednostavno broj opažanja u uzorku minus jedan.

  6. Sada kada znate postoji li razlika između varijanci, možete odabrati odgovarajući T-test. Odaberite Podaci karticu > Analiza podataka, zatim odaberite t-Test: Dva uzorka uz pretpostavku jednakih varijacijaili t-test: dva uzorka uz pretpostavku nejednakih varijacija

    Image
    Image
  7. Bez obzira koju ste opciju odabrali u prethodnom koraku, prikazat će vam se isti dijaloški okvir za unos pojedinosti analize. Za početak odaberite raspone koji sadrže uzorke za Raspon varijable 1 i Raspon varijable 2.

    Image
    Image
  8. Pod pretpostavkom da želite testirati da nema razlike između srednjih vrijednosti, postavite Hipotetiziranu srednju razliku na nulu.
  9. Postavite razinu značajnosti Alpha (0,05 daje 95% pouzdanosti) i odaberite ćeliju za gornji lijevi kut ispisa, uzimajući u obzir da će to ispuniti 3 stupca i 14 redaka. Odaberite OK.
  10. Pregledajte rezultate kako biste odlučili postoji li značajna razlika između srednjih vrijednosti.

    Kao i kod F-testa, ako je p-vrijednost, u ovom slučaju P(T<=t), veća od alfa, tada nema značajne razlike. Međutim, u ovom slučaju dane su dvije p-vrijednosti, jedna za jednostrani test, a druga za dvostrani test. U ovom slučaju upotrijebite dvosmjernu vrijednost budući da bi bilo koja varijabla koja ima veću srednju vrijednost bila značajna razlika.

Preporučeni: