Zusammenfassung
In diesem Artikel wird die FUNKTION CONFIDENCE in Microsoft Office Excel 2003 und Microsoft Office Excel 2007 beschrieben, die Verwendung der Funktion veranschaulicht und die Ergebnisse der Funktion für Excel 2003 und Excel 2007 mit den Ergebnissen von CONFIDENCE in früheren Excel-Versionen verglichen.
Die Bedeutung eines Konfidenzintervalls wird häufig falsch interpretiert, und wir versuchen, eine Erklärung für gültige und ungültige Aussagen bereitzustellen, die gemacht werden können, nachdem Sie einen CONFIDENCE-Wert aus Ihren Daten ermittelt haben.Weitere Informationen
Die FUNKTION CONFIDENCE(alpha, sigma, n) gibt einen Wert zurück, mit dem Sie ein Konfidenzintervall für einen Auffüllungsmittelwert erstellen können. Das Konfidenzintervall ist ein Bereich von Werten, die auf einem bekannten Stichprobenmittelwert zentriert sind. Es wird davon ausgegangen, dass die Beobachtungen in der Stichprobe von einer Normalverteilung mit bekannter Standardabweichung sigma stammen, und die Anzahl der Beobachtungen in der Stichprobe ist n.
Syntax
CONFIDENCE(alpha,sigma,n)
Parameter: Alpha ist eine Wahrscheinlichkeit und 0 < Alpha < 1. Sigma ist eine positive Zahl, und n ist eine positive ganze Zahl, die der Stichprobengröße entspricht.
In der Regel ist Alpha eine kleine Wahrscheinlichkeit, z. B. 0,05.Beispiel für die Verwendung
Angenommen, die Intelligenzquotienten (IQ) folgen einer Normalverteilung mit der Standardabweichung 15. Sie testen IQs für eine Stichprobe von 50 Schülern in Ihrer lokalen Schule und erhalten einen Stichprobenmittelwert von 105. Sie möchten ein Konfidenzintervall von 95 % für den Auffüllungsmittelwert berechnen. Ein Konfidenzintervall von 95 % oder 0,95 entspricht Alpha = 1 – 0,95 = 0,05.
Um die FUNKTION KONFIDENZ zu veranschaulichen, erstellen Sie ein leeres Excel-Arbeitsblatt, kopieren Sie die folgende Tabelle, und wählen Sie dann zelle A1 in Ihrem leeren Excel-Arbeitsblatt aus. Klicken Sie im Menü Bearbeiten auf Einfügen.Hinweis: Klicken Sie in Excel 2007 auf der Registerkarte Start in der Gruppe Zwischenablage auf Einfügen.
Die Einträge in der folgenden Tabelle füllen die Zellen A1:B7 in Ihrem Arbeitsblatt aus.
Alpha |
0,05 |
Stdev |
15 |
m |
50 |
Stichprobenmittelwert |
105 |
=CONFIDENCE(B1;B2;B3) |
|
=NORMSINV(1 - B1/2)*B2/SQRT(B3) |
Nachdem Sie diese Tabelle in Ihr neues Excel-Arbeitsblatt eingefügt haben, klicken Sie auf die Schaltfläche Einfügeoptionen, und klicken Sie dann auf Zielformatierung übereinstimmen.
Wenn der eingefügte Bereich noch ausgewählt ist, zeigen Sie im Menü Format auf Spalte, und klicken Sie dann auf Auswahl automatisch anpassen.
Hinweis: Klicken Sie in Excel 2007 mit dem eingefügten Zellbereich auf der Registerkarte Start in der Gruppe Zellen auf Format und dann auf Spaltenbreite automatisch anpassen.
Zelle A6 zeigt den Wert konfidenz an. Zelle A7 zeigt denselben Wert an, da ein Aufruf von CONFIDENCE(alpha, sigma, n) das Ergebnis der Berechnung zurückgibt:
NORMSINV(1 – alpha/2) * sigma / SQRT(n)
Es wurden keine direkten Änderungen an CONFIDENCE vorgenommen, aber NORMSINV wurde in Microsoft Excel 2002 verbessert, und dann wurden weitere Verbesserungen zwischen Excel 2002 und Excel 2007 vorgenommen. Daher kann CONFIDENCE in diesen späteren Versionen von Excel unterschiedliche (und verbesserte) Ergebnisse zurückgeben, da CONFIDENCE auf NORMSINV basiert.
Dies bedeutet nicht, dass Sie das Vertrauen in VERTRAUEN für frühere Versionen von Excel verlieren sollten. Ungenauigkeiten in NORMSINV traten in der Regel für Werte seines Arguments auf, die sehr nahe bei 0 oder sehr nahe bei 1 liegen. In der Praxis ist Alpha im Allgemeinen auf 0,05, 0,01 oder vielleicht 0,001 festgelegt. Alphawerte müssen viel kleiner sein, z. B. 0,0000001, bevor Rundungsfehler in NORMSINV wahrscheinlich bemerkt werden.Hinweis: Im Artikel zu NORMSINV finden Sie eine Erläuterung der Berechnungsunterschiede in NORMSINV.
Weitere Informationen finden Sie im folgenden Artikel der Microsoft Knowledge Base:
826772 Statistische Excel-Funktionen: NORMSINV
Interpretation der Ergebnisse von CONFIDENCE
Die Excel-Hilfedatei für CONFIDENCE wurde für Excel 2003 und excel 2007 umgeschrieben, da alle früheren Versionen der Hilfedatei irreführende Hinweise zur Interpretation der Ergebnisse gegeben haben. Im Beispiel heißt es: "Angenommen, wir beobachten, dass in unserer Stichprobe von 50 Pendlern die durchschnittliche Fahrt zur Arbeit 30 Minuten mit einer Standardabweichung der Bevölkerung von 2,5 beträgt. Wir können zu 95 Prozent sicher sein, dass der Mittelwert der Grundgesamtheit im Intervall 30 +/- 0,692951 liegt, wobei 0,692951 der von KONFIDENZ (0,05, 2,5, 50) zurückgegebene Wert ist.
Im gleichen Beispiel lautet die Schlussfolgerung: "Die durchschnittliche Fahrtdauer zur Arbeit entspricht 30 ± 0,692951 Minuten oder 29,3 bis 30,7 Minuten." Vermutlich ist dies auch eine Aussage über den Bevölkerungsmittelwert, der innerhalb des Intervalls [30 – 0,692951, 30 + 0,692951] mit wahrscheinlicher Wahrscheinlichkeit 0,95 liegt. Vor der Durchführung des Experiments, das die Daten für dieses Beispiel lieferte, kann ein klassischer Statistiker (im Gegensatz zu einem bayesschen Statistiker) keine Aussage über die Wahrscheinlichkeitsverteilung des Bevölkerungsmittelwerts machen. Stattdessen befasst sich ein klassischer Statistiker mit Hypothesentests. Ein klassischer Statistiker möchte beispielsweise einen zweiseitigen Hypothesentest durchführen, der auf der Annahme einer Normalverteilung mit bekannter Standardabweichung (z. B. 2,5), einem bestimmten vorgewählten Wert des Grundgesamtmittels μ0 und einem vorab ausgewählten Signifikanzniveau (z. B. 0,05) basiert. Das Ergebnis des Tests würde auf dem Wert des beobachteten Stichprobenmittels (z. B. 30) basieren, und die NULL-Hypothese, dass der Grundgesamtmittel μ0 ist, würde bei einem Signifikanzniveau von 0,05 abgelehnt, wenn der beobachtete Stichprobenmittelwert in beide Richtungen zu weit von μ0 entfernt wäre. Wenn die Nullhypothese abgelehnt wird, ist die Interpretation, dass eine Probe bedeutet, dass weit oder weiter von μ0 zufällig weniger als 5 % der Zeit unter der Annahme auftreten würde, dass μ0 der wahre Grundgesamtheitsmittelwert ist. Nach der Durchführung dieses Tests kann ein klassischer Statistiker immer noch keine Aussage über die Wahrscheinlichkeitsverteilung des Bevölkerungsmittelmittels treffen. Ein bayesischer Statistiker hingegen würde mit einer angenommenen Wahrscheinlichkeitsverteilung für den Bevölkerungsmittelwert (als a priori-Verteilung bezeichnet) beginnen, experimentelle Beweise auf die gleiche Weise sammeln wie der klassische Statistiker und würde diesen Beweis verwenden, um seine Wahrscheinlichkeitsverteilung für den Bevölkerungsmittelwert zu überarbeiten und so eine nachher zu erhalten. Excel bietet keine statistischen Funktionen, die einem Bayesschen Statistiker bei diesem Vorhaben helfen würden. Die statistischen Funktionen von Excel sind alle für klassische Statistiker bestimmt. Konfidenzintervalle beziehen sich auf Hypothesentests. Unter Berücksichtigung der experimentellen Beweise gibt ein Konfidenzintervall eine präzise Aussage über die Werte des hypothesisierten Auffüllungsmittels μ0 ab, die die Annahme der NULL-Hypothese ergeben würde, dass der Mittelwert der Grundzahl μ0 ist, und die Werte von μ0, die eine Ablehnung der NULL-Hypothese, dass der Grundbestandsmittelwert μ0 ist, ergeben würde. Ein klassischer Statistiker kann keine Aussage über die Wahrscheinlichkeit treffen, dass der Bevölkerungsmittelwert in einem bestimmten Intervall fällt, da er oder er niemals a priori Annahmen über diese Wahrscheinlichkeitsverteilung trifft und solche Annahmen erforderlich wären, wenn man experimentelle Beweise verwenden würde, um sie zu überarbeiten. Untersuchen Sie die Beziehung zwischen Hypothesentests und Konfidenzintervallen anhand des Beispiels am Anfang dieses Abschnitts. Mit der im letzten Abschnitt genannten Beziehung zwischen CONFIDENCE und NORMSINV haben Sie Folgendes:CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951
Da der Stichprobenmittelwert 30 ist, beträgt das Konfidenzintervall 30 +/- 0,692951.
Betrachten Sie nun einen zweiseitigen Hypothesentest mit dem oben beschriebenen Signifikanzniveau 0,05, der von einer Normalverteilung mit einer Standardabweichung von 2,5, einer Stichprobengröße von 50 und einem spezifischen hypothesierten Populationsmittel μ0 ausgeht. Wenn dies der wahre Populationsmittelwert ist, wird der Stichprobenmittelwert von einer Normalverteilung mit dem Grundmittel μ0 und der Standardabweichung 2,5/SQRT(50) stammen. Diese Verteilung ist symmetrisch um μ0, und Sie sollten die NULL-Hypothese ablehnen, wenn ABS(Sample Mean - μ0) > einen Cutoff-Wert. Der Cutoff-Wert wäre so, dass bei μ0 der tatsächliche Auffüllungsmittelwert, ein Wert des Stichprobenmittels - μ0 höher als dieser Cutoff oder ein Wert von μ0 - probenmittel höher als dieser Cutoff mit der Wahrscheinlichkeit 0,05/2 auftreten würde. Dieser Cutoff-Wert ist
NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951
Daher lehnen Sie die NULL-Hypothese (Population Mean = μ0) ab, wenn eine der folgenden Aussagen zutrifft:
Probenmittelwert - μ0 > 0.
692951 0 – Stichprobenmittelwert > 0. 692951Da in unserem Beispiel der Mittelwert = 30 ist, werden diese beiden Anweisungen zu den folgenden Anweisungen:
30 - μ0 > 0.
692951 μ0 – 30 > 0. 692951Umschreiben sie so, dass nur μ0 auf der linken Seite erscheint, ergibt die folgenden Aussagen:
μ0 < 30 - 0.
692951 μ0 > 30 + 0. 692951Dies sind genau die Werte von μ0, die nicht im Konfidenzintervall [30 – 0,692951, 30 + 0,692951] liegen. Daher enthält das Konfidenzintervall [30 – 0,692951, 30 + 0,692951] die Werte von μ0, bei denen die NULL-Hypothese, dass der Grundgesamtwert μ0 ist, angesichts der Stichprobenbeweise nicht abgelehnt würde. Bei Werten von μ0 außerhalb dieses Intervalls würde die NULL-Hypothese, dass der Grundgesamtheitsmittel μ0 ist, angesichts des Stichprobenbeweis abgelehnt.
Schlussfolgerungen
Ungenauigkeiten in früheren Excel-Versionen treten in der Regel bei extrem kleinen oder extrem großen Werten von p in NORMSINV(p) auf. DIE ZUVERLÄSSIGKEIT wird durch den Aufruf von NORMSINV(p) ausgewertet, sodass die Genauigkeit von NORMSINV ein potenzielles Problem für Benutzer von CONFIDENCE ist. Werte von p, die in der Praxis verwendet werden, sind jedoch wahrscheinlich nicht extrem genug, um erhebliche Abrundungsfehler in NORMSINV zu verursachen, und die Leistung von CONFIDENCE sollte für Benutzer einer Version von Excel kein Problem sein.
Der Großteil dieses Artikels konzentriert sich auf die Interpretation der Ergebnisse von CONFIDENCE. Anders ausgedrückt: Wir haben gefragt: "Was bedeutet ein Konfidenzintervall?" Konfidenzintervalle werden häufig missverstanden. Leider haben Excel-Hilfedateien in allen Excel-Versionen vor Excel 2003 zu diesem Missverständnis beigetragen. Die Excel 2003-Hilfedatei wurde verbessert.