Select the product you need help with
Beschrijving van de numerieke verbetering in Analysis ToolPak ANOVA-programma's in ExcelArtikel ID: 829215 - Bekijk de producten waarop dit artikel van toepassing is. Op deze paginaSamenvattingIn dit artikel worden de rekenkundige verbeteringen in elk van de drie Analysis ToolPak ANOVA-hulpprogramma's beschreven. Dit artikel illustreert ook onnauwkeurige resultaten in Microsoft Excel 2002 en oudere versies in extreme situaties. Meer informatieBij veel functies wordt de som van kwadratische afwijkingen ten opzichte van een gemiddelde berekend Daarvoor gebruiken Microsoft Office Excel 2003 en nieuwere versies een procedure met twee stappen waarbij in de eerste stap het gemiddelde wordt bepaald en vervolgens op basis daarvan in de tweede stap de som van de kwadratische afwijkingen wordt berekend. In precisieberekeningen wordt hetzelfde resultaat verkregen in oudere versies van Excel die de 'rekenmachineformule' gebruiken. Deze formule is zo genoemd omdat deze op grote schaal werd gebruikt in de tijd dat statistici rekenmachines in plaats van computers gebruikten. Met de rekenmachineformule wordt in oudere versies van Excel de som van de kwadraten van de metingen bepaald, waarna van dit totaal de volgende hoeveelheid wordt afgetrokken: In beperkte precisieberekeningen treden bij de rekenmachineformule afrondingsfouten op in extreme gevallen. Excel 2002 en oudere versies gebruiken de rekenmachineformule voor de meeste functies waarvoor een som van kwadratische afwijkingen ten opzichte van een gemiddelde nodig is (zoals VAR, STDEV, RICHTING en PEARSON). Deze versies van Excel gebruiken echter ook de numeriek krachtigere procedure in twee stappen voor de functies CORRELATIE, COVARIANTIE en DEV.KWAD. Experts in statistische berekeningen raden het gebruik van de rekenmachineformule af. In teksten over statische berekening wordt de rekenmachineformule gepresenteerd als voorbeeld van een ongeschikte methode. Helaas maken alle drie de Analysis ToolPak (ATP) ANOVA-programma's in Excel 2002 en oudere versies veel gebruik van de rekenmachineformule of een daarmee vergelijkbaar enkelvoudig gegevensverwerkingsproces. Excel 2003 en nieuwere versies gebruiken een procedure met twee stappen voor alle drie de ATP ANOVA-modellen. In dit artikel worden de volgende rekenkundige verbeteringen in de drie ATP ANOVA-modellen beschreven:
Omdat Excel voor DEV.KWAD altijd de procedure in twee stappen heeft gebruikt, wordt deze procedure in dit artikel geregeld gebruikt om de verbeterde procedures te beschrijven. Deze herziene procedures roepen ofwel DEV.KWAD aan, ofwel een gebruikerscode waarvan de functionaliteit exact overeenkomt met de functionaliteit van DEV.KWAD. Voor elk ANOVA-programma bevat de ATP-uitvoer een samenvattingstabel met de waarden van Aantal, Som, Gemiddelde en Variantie, en een ANOVA-tabel met verschillende sommen van kwadraten en waarden van SS, df, MS, F en P-waarde. Resultaten in de samenvattingstabel worden berekend door het aanroepen van de Excel-functies AANTAL, SOM, GEMIDDELDE en VAR. Van deze vier functies heeft alleen VAR te maken met afrondingsfouten. Excel 2002 en oudere versies implementeren VAR met de rekenmachineformule. In het volgende artikel over VAR worden de verbeteringen beschreven die in Excel 2003 en nieuwere versies zijn doorgevoerd. Dit artikel laat u ook experimenteren met numerieke gegevens zodat u ziet wanneer afrondingsfouten mogelijk optreden in oudere versies van Excel. Klik op het volgende artikelnummer in de Microsoft Knowledge Base voor meer informatie over VAR: 826112
(http://support.microsoft.com/kb/826112/
)
Statistische functies in Excel: VARAangezien in dit artikel de drie ANOVA-modellen worden behandeld, wordt hier vooral gekeken naar de resulterende ANOVA-tabellen. De samenvattingstabellen werken in alle gevallen naar behoren in Excel 2003 en nieuwere versies. In Excel 2002 en oudere versies treden problemen op in de kolom Variantie wanneer gegevens extreme waarden hebben. In dit artikel zijn de samenvattingstabellen echter opgenomen in de modelsecties omdat deze tabellen handig kunnen zijn ter vergelijking wanneer u de gewijzigde voorbeelden in de Bijlage bekijkt. Model 1: Single FactorHier volgt een eenvoudig gegevensvoorbeeld.Deze tabel samenvouwen
Ook bij model 2 en 3 wordt de som van kwadraten berekend en wordt van de som van kwadraten een hoeveelheid afgetrokken, zoals bij de rekenmachineformule. Helaas worden in algemene statistische teksten vaak benaderingen van ANOVA voorgesteld die vergelijkbaar zijn met de benadering die eerder in dit artikel werd weergegeven. Excel 2003 en nieuwere versies gebruiken een andere benadering voor het berekenen van de verschillende waarden in de SS-kolom van de ANOVA-tabel. Ter illustratie wordt er in dit artikel vanuit gegaan dat de numerieke gegevens uit het eerdere voorbeeld verschijnen in cel A2:C7, met ontbrekende gegevens in cel B6 en B7.
Model 2: Two-Factor with ReplicationHier volgt een eenvoudig gegevensvoorbeeld.Deze tabel samenvouwen
Hier volgt de rekenkundige procedure voor Excel 2003 en nieuwere versies. Deze procedure gebruikt DEV.KWAD voor de berekening van de verschillende waarden in de SS-kolom van de ANOVA-tabel. Ter illustratie wordt in dit voorbeeld aangenomen dat de numerieke gegevens verschijnen in de cellen B2:D7.
Model 3: Two-Factor without ReplicationHier volgt een eenvoudig gegevensvoorbeeld.Deze tabel samenvouwen
Excel 2003 en nieuwere versies gebruiken de volgende rekenkundige procedure. De procedure gebruikt DEV.KWAD voor de berekening van de waarden in de SS-kolom van de ANOVA-tabel. Ter illustratie wordt er in dit voorbeeld vanuit gegaan dat het cellenbereik uit het eerdere voorbeeld A1:D10 is. De numerieke gegevens verschijnen derhalve in de cellen B2:D10.
Resultaten in Excel 2002 en oudere versiesIn extreme gevallen, wanneer de gegevens veel significante cijfers maar tevens een kleine variantie bevatten, leidt de rekenmachineformule tot onnauwkeurige resultaten. De bijlage verderop in dit artikel bevat voorbeelden van afrondingsproblemen in dergelijke extreme gevallen.Resultaten in Excel 2003 en nieuwere versiesExcel 2003 en nieuwere versies gebruiken een gegevensverwerkingsproces in twee stappen. In de eerste stap berekenen Excel 2003 en nieuwere versies de som en het aantal van de gegevenswaarden. Op basis van dit resultaat kan Excel het steekproefgemiddelde (gemiddelde) berekenen.Bij de tweede gegevensverwerking wordt vervolgens het kwadratisch verschil tussen elk gegevenspunt en het steekproefgemiddelde berekend. Deze kwadratische verschillen worden opgeteld. Het gevolg is dat de resultaten in Excel 2003 en nieuwere versies numeriek stabieler zijn. ConclusiesEen uit twee stappen bestaande benadering verbetert de numerieke prestaties in alle drie de ATP ANOVA-hulpprogramma's in Excel 2003 en nieuwere versies ten opzichte van oudere versies van Excel. De resultaten die u verkrijgt met Excel 2003 en nieuwere versies zijn nooit minder nauwkeurig dan de resultaten die u verkrijgt met oudere versies van Excel.In de praktijk zijn de resultaten echter doorgaans hetzelfde. Dat komt omdat de gegevens doorgaans niet van die ongebruikelijke aard zijn die in de volgende bijlage wordt beschreven. Numerieke onstabiliteit treedt in oudere versies van Excel het meest op wanneer gegevens zowel een groot aantal significante cijfers bevatten als weinig variatie tussen de gegevenswaarden. Als u met een oudere versie van Excel werkt en wilt controleren of Excel 2003 of een nieuwere versie andere ANOVA-resultaten oplevert, kunt u de resultaten die u verkrijgt met de ANOVA-hulpprogramma's in uw oudere versie van Excel, vergelijken met de resultaten van de procedures die DEV.KWAD gebruiken. Opmerking De procedures die DEV.KWAD gebruiken, zijn eerder in dit artikel beschreven voor de ANOVA-tabel die betrekking heeft op het betreffende hulpprogramma. Als u wilt controleren of variantiewaarden in de samenvattingstabel voor elk bereik correct zijn, gebruikt u DEV.KWAD(bereik)/(AANTAL(bereik) ? 1). Bijlage: Numerieke voorbeelden van de prestaties van Excel 2002 en oudere versiesVoor elk basisvoorbeeld uit de modellen 1, 2 en 3 werd eerder in dit artikel het resultaat van het ATP-programma weergegeven. De resultaten bevatten de samenvattingstabellen en ANOVA-tabellen. In elk voorbeeld werden gegevens gewijzigd om een extreem voorbeeld te geven. Dit werd gedaan door 10^8 aan elke gegevenswaarde toe te voegen. Door een constante zoals 10^8 aan elke gegevenswaarde toe te voegen, wordt de Variantie in de samenvattingstabel niet beïnvloed (maar natuurlijk wel het resultaat van Gemiddelde en Som). Evenmin zouden waarden in de ANOVA-tabel beïnvloed mogen worden.Als u de Variantie in de samenvattingstabellen en SS in de ANOVA-tabellen vergelijkt, zult u zien dat al deze waarden onjuist werden berekend in alle drie de volgende extreme modellen, met uitzondering van één waarde in model 3, die wordt aangeduid met '<---'. In alle extreme gevallen komen de ANOVA-resultaten uit Excel 2003 en nieuwere versies overeen met de eerdere resultaten voor de basisgevallen (zoals verwacht). ANOVA 1, extreem model met grote gegevenswaardenDeze tabel samenvouwen
ANOVA 2, extreem model met grote gegevenswaardenDeze tabel samenvouwen
ANOVA 3, extreem model met grote gegevenswaardenDeze tabel samenvouwen
Eigenschappen | Vertaalde artikelen |


Naar boven








