Yhteenveto
Tässä artikkelissa kuvataan Microsoft Office Excel 2003:n ja Microsoft Office Excel 2007:n LUOTTAMUSVÄLI-funktio, kuvataan, miten funktiota käytetään, ja verrataan Excel 2003:n ja Excel 2007:n funktion tuloksia Excelin aiempien versioiden luottamusvälin tuloksiin.
Luottamusvälin merkitys tulkitaan usein väärin, ja yritämme antaa kelvollisten ja virheellisten lausekkeiden selityksen, joka voidaan antaa sen jälkeen, kun olet määrittänyt tiedoista LUOTTAMUSVÄLI-arvon.Lisätietoja
LUOTTAMUSVÄLI(alfa, sigma, n) -funktio palauttaa arvon, jonka avulla voit muodostaa luottamusvälin populaation keskiarvolle. Luottamusväli on arvoalue, joka keskitetään tunnettuun otoksen keskiarvoon. Otoksen havaintojen oletetaan olevan peräisin normaalijakaumasta, jossa on tunnettu keskihajonta, sigma, ja otoksen havaintojen määrä on n.
Syntaksi
CONFIDENCE(alpha,sigma,n)
Parametrit: Alfa on todennäköisyys ja 0 < alfa < 1. Sigma on positiivinen luku, ja n on positiivinen kokonaisluku, joka vastaa otoksen kokoa.
Yleensä alfa on pieni todennäköisyys, kuten 0,05.Esimerkki käytöstä
Oletetaan, että älykkyyden osamäärä (IQ) -pisteet noudattavat normaalijakaumaa, jonka keskihajonta on 15. Testaat älykkyysosamäärät 50 oppilaan otokselle paikallisessa koulussa ja saat otoksen keskiarvoksi 105. Haluat laskea 95 %:n luottamusvälin populaation keskiarvolle. Luottamusväli 95 % tai 0,95 vastaa alfa = 1 – 0,95 = 0,05.
Voit havainnollistaa LUOTTAMUSVÄLI-funktiota luomalla tyhjän Excel-laskentataulukon, kopioimalla seuraavan taulukon ja valitsemalla sitten tyhjän Excel-laskentataulukon solun A1. Valitse Muokkaa-valikossa Sijoita.Huomautus: Valitse Excel 2007:ssä Aloitus-välilehden Leikepöytä-ryhmässäLiitä.
Alla olevan taulukon merkinnät täyttävät laskentataulukon solut A1:B7.
Alpha |
0,05 |
Keskihajonta |
15 |
n |
50 |
otoksen keskiarvo |
105 |
=LUOTTAMUSVÄLI(B1;B2;B3) |
|
=NORM.JAKAUMA.NORMIT(1 - B1/2)*B2/NELIÖJUURI(B3) |
Kun olet liittänyt tämän taulukon uuteen Excel-laskentataulukkoon, napsauta Liittämisasetukset-painiketta ja valitse sitten Vastaa kohteen muotoilua.
Kun liitetty alue on edelleen valittuna, osoita Muotoile-valikonSarake-kohtaa ja valitse sitten Sovita valinta.
Huomautus: Valitse Excel 2007:ssä liitetty solualue valittuna Aloitus-välilehdenSolut-ryhmästäMuotoile ja valitse sitten Sovita sarakkeen leveys.
Solussa A6 näkyy LUOTTAMUSVÄLI-arvo. Solussa A7 näkyy sama arvo, koska luottamusväli(alfa, sigma, n) palauttaa tietojenkäsittelyn tuloksen:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
Muutoksia ei tehty suoraan LUOTTAMUSVÄLI-funktioon, mutta NORM.JAKAUMA.NORMIT-funktiota parannettiin Microsoft Excel 2002:ssa, ja sen jälkeen Excel 2002:n ja Excel 2007:n välillä tehtiin lisää parannuksia. Luottamusväli voi siis palauttaa erilaisia (ja parannettuja) tuloksia näissä Excelin uudemmissa versioissa, koska LUOTTAMUSVÄLI perustuu NORM.JAKAUMA.KÄÄNT-funktioon.
Tämä ei tarkoita sitä, että sinun ei pitäisi menettää luottamusta Excelin aiempien versioiden luottamusväliin. NORM.JAKAUMA.KÄÄNT-funktion epätarkkuuksia ilmeni yleensä sen argumentin arvoille, jotka olivat hyvin lähellä arvoa 0 tai hyvin lähellä arvoa 1. Käytännössä alfa-arvona on yleensä 0,05, 0,01 tai ehkä 0,001. Alfa-arvojen on oltava paljon pienempiä kuin esimerkiksi 0,0000001, ennen kuin NORM.JAKAUMA.KÄÄNT-funktion pyöristysvirheet todennäköisesti huomataan.Huomautus: LISÄTIETOJA NORM.JAKAUMA.NORMIT.KÄÄNT-funktion laskennallisista eroista on NORM.JAKAUMA.KÄÄNT-funktion artikkelissa.
Saat lisätietoja napsauttamalla seuraavaa artikkelin numeroa, jotta voit tarkastella artikkelia Microsoft Knowledge Base -tietokannassa:
826772 Excelin tilastofunktiot: NORM.JAKAUMA.KÄÄNT
Luottamusvälin tulosten tulkinta
Excelin LUOTTAMUSVÄLI-ohjetiedosto on kirjoitettu uudelleen Excel 2003:ssa ja Excel 2007:ssä, koska kaikki ohjetiedoston aiemmat versiot antoivat harhaanjohtavia neuvoja tulosten tulkitsemiseen. Esimerkissä sanotaan: "Oletetaan, että 50 työmatkalaisen otoksessa keskimääräinen työmatkamatka on 30 minuuttia ja populaation keskihajonta 2,5. Voimme olla 95-prosenttisen varmoja siitä, että populaation keskiarvo on väliltä 30 +/-0,692951", jossa 0,692951 on LUOTTAMUSVÄLI(0,05, 2,5, 50).
Samassa esimerkissä johtopäätöksessä lukee: "Työmatkan keskipituus on 30 ± 0,692951 minuuttia eli 29,3–30,7 minuuttia." Oletettavasti tämä on myös lauseke populaation keskiarvosta, joka laskee väliajalla [30 – 0,692951, 30 + 0,692951] todennäköisyydellä 0,95. Ennen kuin suoritat kokeen, joka antoi tiedot tässä esimerkissä, klassinen tilastotieteilijä (toisin kuin bayesilainen tilastotieteilijä) ei voi antaa mitään lausuntoa populaation keskiarvon todennäköisyysjakaumasta. Sen sijaan klassinen tilastotieteilijä käsittelee hypoteesin testausta. Esimerkiksi klassinen tilastotieteilijä voi haluta tehdä kaksipuolisen hypoteesitestin, joka perustuu oletuksena normaalijakaumaan, jossa tiedetään olevan keskihajonta (esimerkiksi 2,5), populaation keskiarvon ennalta valittu arvo, μ0 ja ennalta valittu tarkkuustaso (esimerkiksi 0,05). Testin tulos perustuisi havaitun otoksen keskiarvon (esimerkiksi 30) arvoon ja nollahypoteesiin siitä, että populaation keskiarvo on μ0, hylättäisiin tarkkuustasolla 0,05, jos havaittu otoksen keskiarvo olisi liian kaukana μ0:stä kumpaankaan suuntaan. Jos tyhjäarvoinen hypoteesi hylätään, tulkinta on, että otos tarkoittaa, että kaukana tai kauempana μ0:stä tapahtuu sattumalta alle 5% ajasta olettaen, että μ0 on todellinen populaation keskiarvo. Tämän testin suorittamisen jälkeen klassinen tilastotieteilijä ei vieläkään voi antaa mitään lausuntoa populaation keskiarvon todennäköisyysjakaumasta. Bayesilainen tilastotieteilijä taas aloittaisi oletetun todennäköisyysjakauman populaation keskiarvolle (nimeltään priori-jakauma), kerää kokeellista näyttöä samalla tavalla kuin klassinen tilastotieteilijä ja käyttäisi tätä näyttöä tarkistaakseen populaation keskiarvon todennäköisyysjakauman ja siten saadakseen posteriorijakauman. Excelissä ei ole tilastollisia funktioita, jotka auttaisivat bayesilaista tilastotieteilijää tässä yrityksessä. Excelin tilastofunktiot on tarkoitettu klassisille tilastoille. Luottamusvälit liittyvät hypoteesitesteihin. Kun otetaan huomioon kokeellinen näyttö, luottamusväli antaa ytimekkään lausekkeen hypoteesoidun populaation keskiarvon μ0 arvoista, jotka antaisivat tyhjäarvohypoteesin hyväksymisen siitä, että populaation keskiarvo on μ0 ja arvot μ0, jotka tuottaisivat tyhjäarvohypoteesin hylkäämisen siitä, että populaation keskiarvo on μ0. Klassinen tilastotieteilijä ei voi antaa mitään lausuntoa mahdollisuudesta, että populaation keskiarvo laskee tietyllä aikavälillä, koska hän ei koskaan tee ennakkooletuksia tästä todennäköisyysjakaumasta, ja tällaisia olettamuksia tarvittaisiin, jos niitä käytettäisiin kokeellisten todisteiden tarkistamiseen. Tutustu hypoteesitestien ja luottamusvälien väliseen yhteyteen tämän osan alussa olevan esimerkin avulla. Luottamusvälin ja NORM.JAKAUMA.KÄÄNT-funktion välisen suhteen ollessa mainittuna edellisessä osassa, sinulla on seuraavat tiedot:CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
Koska otoksen keskiarvo on 30, luottamusväli on 30 +/- 0,692951.
Harkitse nyt kaksipuolista hypoteesitestiä, jonka tarkkuustaso on 0,05 edellä kuvatulla tavalla ja jossa oletetaan normaalijakauman keskihajonta 2,5, otoksen koon 50 ja tietyn hypoteesoidun populaation keskiarvon, μ0. Jos tämä on todellinen populaation keskiarvo, otoksen keskiarvo tulee normaalijakaumasta, jossa populaation keskiarvo on μ0 ja keskihajonta 2,5/NELIÖJUURI(50). Tämä jakauma on symmetrinen noin μ0 ja haluat hylätä tyhjäarvohypoteesin, jos ABS(otoksen keskiarvo - μ0) > jonkin raja-arvon. Raja-arvo olisi sellainen, että jos μ0 olisi todellinen populaation keskiarvo, otoksen keskiarvon arvo - μ0 suurempi kuin tämä raja-arvo tai arvo μ0 – otoksen keskiarvo, joka on suurempi kuin tämä raja-arvo, tapahtuu todennäköisyydellä 0,05/2. Tämä raja-arvo on
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
Hylkää siis tyhjäarvoinen hypoteesi (populaation keskiarvo = μ0), jos jokin seuraavista lausekkeista on tosi:
otoksen keskiarvo – μ0 > 0.
692951 0 – otoksen keskiarvo > 0. 692951Koska esimerkkiesimerkki = 30, näistä kahdesta lausekkeesta tulee seuraavat lauseet:
30 – μ0 > 0.
692951 μ0 – 30 > 0. 692951Jos ne kirjoitetaan uudelleen niin, että vasemmalla näkyy vain μ0, saadaan seuraavat lausekkeet:
μ0 < 30-0.
692951 μ0 > 30 + 0. 692951Nämä ovat täsmälleen arvot μ0, jotka eivät ole luottamusvälillä [30 – 0,692951, 30 + 0,692951]. Luottamusväli [30 – 0,692951, 30 + 0,692951] sisältää μ0:n arvot, jos nollahypoteesi, jonka mukaan populaation keskiarvo on μ0, ei hylättäisi otoksen perusteella. Jos arvo on μ0 tämän välin ulkopuolella, tyhjäarvoinen hypoteesi siitä, että populaation keskiarvo on μ0, hylätään otoksen todisteiden perusteella.
Päätelmät
Excelin aiemmissa versioissa epätarkkuuksia esiintyy yleensä erittäin pienille tai erittäin suurille p-arvoille NORM.JAKAUMA.KÄÄNT(p). LUOTTAMUSVÄLIÄ arvioidaan kutsumalla NORM.JAKAUMA.KÄÄNT(p), joten NORM.JAKAUMA.KÄÄNT-funktion tarkkuus saattaa huolestuttaa luottamusväliä. Käytännössä käytetyt p-arvot eivät kuitenkaan todennäköisesti ole niin äärimmäisiä, että ne aiheuttaisivat merkittäviä pyöristysvirheitä NORM.JAKAUMA.KÄÄNT:ssä, eikä LUOTTAMUSVÄLI-funktion pitäisi huolestuttaa minkään Excel-version käyttäjiä.
Suurin osa tästä artikkelista on keskittynyt luottamusvälin tulosten tulkitsemiseen. Toisin sanoen olemme kysyneet: "Mikä on luottamusvälin merkitys?" Luottamusvälit ymmärretään usein väärin. Valitettavasti Excelin ohjetiedostot kaikissa Excel 2003:a aiemmissa Excel-versioissa ovat vaikuttaneet tähän väärinkäsitykseen. Excel 2003:n ohjetiedostoa on parannettu.