Použijete-li v aplikaci Excel analytické nástroje t-Test může získat nesprávné výsledky a chybné popisky

Souhrn

Tento článek popisuje analytické nástroje t-Test, který je pojmenován nástroj Dvouvýběrový párový dvě vzorek. Tento nástroj nebyl změněn pro aplikaci Microsoft Office Excel 2003 a vyšších verzích aplikace Excel. Tento nástroj však nabízí vadným výsledky po chybějící data. Kromě toho zda je chybějící data, jsou zavádějící popisky ve výstupu nástroje.

Microsoft Excel 2004 pro systém Macintosh informace

Statistické funkce v aplikaci Excel 2004 for Mac byly aktualizovány pomocí stejných algoritmů, které byly použity při aktualizaci statistických funkcí v aplikaci Excel 2003 a vyšších verzích aplikace Excel. Všechny informace v tomto článku, který popisuje, jak určitá funkce pracuje nebo jak byla upravena pro aplikaci Excel 2003 a vyšších verzích aplikace Excel platí také pro aplikaci Excel 2004 for Mac.

Další informace

Obvykle použijete párový Dvouvýběrový párový t-Test (někdy nazývaná odpovídajících dvojicích t-Test) máte před a po měření na stejné experimenty pro ošetření. Může být například změřit hmotnost subjektu před a po 30 dnech stravy plánu.

Obvykle můžete odstranit data na libovolný předmět, jehož před měřením nebo po měření chybí. Neúplné údaje o předmětu poskytuje informace o daném tématu nepoužitelné. Tento nástroj analytické bohužel chová odlišně než obvyklé praxe. Tento nástroj analytické nejprve spočítá počet předměty s před měření a počet předmětů se po měření. Pokud tyto součty se liší, obdržíte chybovou zprávu a tento nástroj analytické nepokračuje. Tedy například pokud jsou vystaveny 49 subjektů, kteří mají před a po měření a fiftieth kdo má pouze měření před, analytické nástroje neprovádí analýzy.

Pokud počet předmětů, které nebyly nalezeny před data se rovná počtu předměty, které jsou chybějící po data a toto číslo je kladné, provede nástroj nevhodný analýzy. Předpokládejme například, že se 50 subjektů. Chybí předmět A měření před a B předmět chybí měření po 48 předměty mají žádné chybějící data. Nástroj spočítá 49 před měření a 49 po měření; Nástroj se chová jako kdyby nebyla 49 subjekty s žádné chybějící data. To narušuje váš záměr vyloučit jakýkoli předmět, který chybí hodnota před nebo po hodnotu. Počet předmětů v tomto příkladu by měl být 48 ne 49. Proto nástroj používá nesprávný počet stupňů volnosti. Navíc vzhledem k tomu, že nástroj zahodí ani předmět A po měření ani předmět B před měřením, tyto dvě hodnoty jsou zahrnuty do výpočtů ukázkové znamená, že jsou použity v t-statistické hodnoty. Proto tyto vypočtené jsou nevhodné.

V souhrnu je nevhodné používat nástroj, pokud je chybějící data, protože nástroj buď nevypočítá nebo bude vypočítat pomocí vzorce nevhodné. Takovém případě nastane, když počet subjekty s chybějícími před data se rovná počtu subjekty s chybějícími po data.

V příkladu v části "Příklad použití" v tomto článku znázorňuje tyto problémy a také zdůrazňuje matoucí popisky ve výstupu nástroje. Části "Řešení" tohoto článku navrhne řešení v případech, kde nelze ověření nepřítomnosti chybějící data před použít nástroj.

Příklad použití

Pro ilustraci problému chybějících dat, vytvořte prázdný list aplikace Excel a potom zkopírujte následující tabulku. Vyberte buňku A1 v listu aplikace Excel a potom vložit položky tak, aby tabulka vyplní A1:I52 buněk v listu.
Pokus 1Experiment 2Experimentovat 3Experimentovat 3 změněn odebrat
PředPoPředPoPředPosubjekty s chybějící data
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
Chování oboustranné 2 t-test
=TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
Nástroj Generátor pseudonáhodných čísel pro Experiment 1:
t-Test: párový prostředky
Proměnná 1Proměnnou 2
Střední hodnota150144.090909090909
Rozptyl1100914.090909090909
Pozorování1111
Korelace PEARSON0.952384533866487
Hypotetický rozdíl středních hodnot0
DF10
t Stat1.92092590483801
P (T < = t) jeden ocas0.0418403929085198
t kritické1.81246110219722
P (T < = t) dvě ocas0.0836807858170396
t kritický dvě ocas2.22813884242587
Nástroj Generátor pseudonáhodných čísel pro Experiment 2:
Nelze vypočítat z důvodu neshodných čísla datapoints
Analytický nástroj pro 3 experimentu:
t-Test: párový prostředky
Proměnná 1Proměnnou 2
Střední hodnota151148.5
Rozptyl1210778.055555555556
Pozorování1010
Korelace PEARSON0.936537537274845
Hypotetický rozdíl středních hodnot0
DF9
t Stat0.141327169509421
P (T < = t) jeden ocas0.445362157564494
t kritické1.83311292255007
P (T < = t) dvě ocas0.890724315128988
t kritický dvě ocas2.26215715817358
Po vložení tabulky do listu aplikace Excel, klepněte na tlačítko Možnosti vložení a potom klepněte na tlačítko Přizpůsobit formátování cíli. Stále vybrán vložený rozsah použijte jeden z následujících postupů odpovídající verzi aplikace Excel, kterou používáte:
  • V aplikaci Microsoft Office Excel 2007 klepněte na kartu Domů , klepněte na tlačítko Formát ve skupině buňky a potom klepněte na tlačítko Přizpůsobit šířku sloupců.
  • V aplikaci Excel 2003 přejděte v nabídce Formátna příkaz sloupec a klepněte na příkaz Přizpůsobit.
List můžete porovnat výsledky funkce TTEST aplikace Excel analytické nástroje. Experimentu 1 zobrazuje kompletní údaje na jedenáct subjekty. Hodnota v buňce A16 TTEST je pravděpodobnost, že bude t-statistické hodnoty větší než pozorovaná hodnota, za předpokladu, že t rozdělení s deseti stupni volnosti. Tato hodnota 0.837, je rovněž zobrazeno ve výstupu nástroje v buňce B32. Popisek v buňce A32, by si měli přečíst "P (T > = | t |) dvě ocáskem", není" P (T < = t) dvě zadní ", ale číselnou odpověď je správná, protože není žádné chybějící data v experimentu 1. Podobně by měly přečíst popisek v buňce odpověď č. 30 "P (T > = | t |) jedna ocáskem", nikoli" P (T < = t) jeden ocas ". "T kritický" cutoffs jsou správné. Odpovídají-li výchozí úroveň významnosti 0,05, a že používají správný počet stupňů volnosti, 10.

Experiment 2 má jeden chybí po měření na jeden předmět a žádné chybějící data. Nástroj odmítne vypočítat. Hodnoty v buňkách A16 a A17 TTEST jsou stejné. V buňce A16 C3:D13 oblasti buněk dat slouží; Jedná se o poslední předmět pouze jeden s chybějící data. V buňce A17 se používá C3:D12 oblasti buněk dat; To odpovídá pokus s prvních deset předmětů a žádné chybějící data. Skutečnost, že výsledky jsou stejně znamená, že když je volána funkce TTEST buňku A16 TTEST odpovídajícím způsobem zahodí předmět s chybějící data.

Experimentovat 3 chybí jeden před měření a jeden chybí po měření na dvou různých předmětů. Experimentovat 3 změněn zobrazuje devět zbývající subjekty s žádné chybějící data. Výsledky funkce TTEST v buňkách buňku E16 E17 jsou stejné. V buňce buňku E16 TTEST nazývá experimentu 3 dat z buněk E3:F13. V buňce E17 TTEST nazývá na 3 pokus změnit data v G3:H11 buněk. Výsledky jsou stejné, protože TTEST zahodí odpovídajícím způsobem sedmá a jedenáctá předmětů v experimentu 3, dva s chybějící data. Pokud přezkoumat výstup nástroj pro 3 experimentu je počet před a za pozorování v buňkách B44 a C44 deset v každém případě. Je snadné si ověřte, zda je SUM(E3:E13) 1510 a SUM(F3:F13) je 1485; protože existují 10 pozorování v každé oblasti, jsou příslušné prostředky 151 a 148.5, které jsou zobrazeny v buňkách B42 a C42. Proto nástroj nebyl zrušeny všechny předměty a použila ve své analýze měření po sedmé subjektu a měření před jedenáctá subjektu. Počet stupňů volnosti v buňce B47 je nevhodné, protože by byly předměty devět a osm df. Díky nesprávné položky přerušení hodnot v buňkách B50 a B52 (navíc zavádějící popisky pro ty položky v buňkách A50 a A52.)

Výsledky ve všech verzích aplikace Excel

Bohužel tento nástroj nebyl opraven pro aplikaci Excel 2003 a vyšších verzích aplikace Excel.

Navrhované řešení pro všechny verze aplikace Excel

Můžete se jich zbavit subjekty s chybějící data před použít nástroj. Však pravděpodobně nebudete chtít upravit list aplikace Excel tímto způsobem. Jeden postup pro odstranění subjekty s chybějící data se zobrazí v následujících krocích. Chcete-li zbavit subjekty s chybějící data, postupujte takto:
  1. Dva datové oblasti zkopírujte do nové oblasti na listu.
  2. Skenování dat směrem nahoru od dolního běžných dvou oblastí.
    1. Dolní řádek obsahuje chybějící data, zrušte dolním řádku. To snižuje rozsah data. Přejděte ke kroku 3.
    2. Identifikujte řádek r nad dolní řádek, ale nejblíže dolní s chybějící data.
      1. Kopírovat všechna data pod řádek r.
      2. Vyberte řádek r a potom vložit kopírovaná data do něj.
      3. Zrušte dolní řádek dat (což bude nyní duplikovat na další poslední řádek dat). To snižuje rozsah data.
  3. Opakujte krok 2, dokud zůstává žádné chybějící data.
Poznámka: Nástroj můžete použít, pokud lze zaručit, že nechybí žádná pozorovaná.

Můžete duplikovat velkou, ale ne všechny nástroje pro výstup bez transformace dat. Nelze najít příslušné hodnoty pro průměr, rozptyl a pozorování, aniž by hodně úsilí. Nástroj nalezne nevhodné hodnoty porovnáním před a po data samostatně. Tento nástroj df je společnou hodnotu pozorování mínus jedna; Proto je také nevhodné Pokud jsou chybějící data. T Stat bez velké úsilí, nelze najít, protože je nutné zkontrolovat před a po dat současně.

Však můžete najít Pearsonův korelace použitím PEARSON a funkce CORREL rozsahy dat dva. Obě tyto funkce aplikace Excel správně zpracovat chybějící data. Navíc můžete najít pravděpodobností jedna ocasu a dva ocas t přidružené data voláním funkce TTEST Excel, která zpracovává chybějící data odpovídajícím způsobem. Pro jednostranné a oboustranné pravděpodobností v experimentu 3 můžete volat TTEST (E3:E13, F3:F13, 1, 1) a TTEST (E3:E13, F3:F13, 2, 1) v uvedeném pořadí. Může také ověřit, že výsledky těchto funkcí dohodnout se ty nástroj experimentu 1, kde chová nástroj odpovídajícím způsobem protože neexistují žádné chybějící data. Odpovídající volání experimentu 1 jsou TTEST (A3:A13, B3:B13, 1, 1) a TTEST (A3:A13, B3:B13, 2, 1) v uvedeném pořadí.

Pro kritické cutoffs musí stanovit počet stupňů volnosti. V experimenty 1, 2 a 3 správný počet stupňů volnosti je osm, devět a deset. Tato čísla jsou vždy jeden menší než počet užitečné subjekty v data bez chybí před nebo za měření. Pro 3 experimentu, například můžete by zadejte v buňce J3, = IF(OR(ISBLANK(E3), ISBLANK(F3)), 0, 1), poté Vyplnit dolů tento vzorec do buňky J4:J13 a najít df zadáním v buňce J14: =SUM(J3:J13) – 1.

Po navázání df, můžete pomocí funkce TINV aplikace Excel. S hladina významnosti 0,05 volání pro experimenty 1, 2 a 3 by TINV (0,05, 10), TINV (0,05, 9) a TINV (0,05, 8) respektive. To by vrátit hodnoty "t kritický dvě ocas". Získat "t kritický ocas jedné hodnoty", použijete analogická volání s hladina významnosti zdvojnásobil, například TINV (0,10, 10), TINV (0,10, 9) a TINV (0,10, 8) respektive.

Závěry

Nepoužívejte analytické nástroje t-Test Paired dva ukázkové prostředky nástroje, pokud můžete zajistit, že neexistují žádné chybějící datových bodů. Tento článek popisuje návrhy pro duplikaci většinu funkcí nástroje pomocí funkce v aplikaci Excel místo analytické nástroje.

Nástroj také poskytuje zavádějící "P (T < = t)" popisky. Tento článek popisuje správný výklad.
Vlastnosti

ID článku: 829252 - Poslední kontrola: 16. 1. 2017 - Revize: 1

Váš názor