Statistické funkce Excelu: INTERCEPT
Souhrn
Tento článek popisuje funkci INTERCEPT v Microsoft Excelu, ukazuje, jak tuto funkci používat, a porovnává její výsledky pro Excel 2003 a novější verze aplikace Excel s výsledky v dřívějších verzích aplikace Excel.
Další informace
Funkce INTERCEPT(known_y;known_x) vrátí funkci INTERCEPT lineární regresní přímky, která se používá k predikci hodnot y z hodnot x .
Syntaxe
INTERCEPT(known_y's,known_x's)
Argumenty known_y a known_x musí být matice nebo oblasti buněk, které obsahují stejný počet číselných datových hodnot. Funkce INTERCEPT často zahrnuje 2 oblasti buněk obsahující data, například INTERCEPT(A1:A100; B1:B100).
Příklad použití
Pokud chcete funkci INTERCEPT znázornit, vytvořte prázdný excelový list, zkopírujte následující tabulku, vyberte buňku A1 v prázdném excelovém listu a vložte položky tak, aby následující tabulka vyplnila buňky A1:D13 v listu.
A | B | C | D |
---|---|---|---|
Hodnoty y | hodnoty x | ||
1 | = 3 + 10^$D $3 | Výkon 10 pro přidání k datům | |
2 | =4 + 10^$D $3 | 0 | |
3 | =2 + 10^$D $3 | ||
4 | =5 + 10^$D $3 | ||
5 | =4+10^$D $3 | ||
6 | =7+10^$D $3 | Excel 2002 a starší | |
když D3 = 7,5 | |||
=SKLON(A2:A7;B2:B7) | -23717082.0762629 | ||
=INTERCEPT(A2:A7;B2:B7) | -24516534.4029667 | ||
= PRŮMĚR(A2:A7) - A9*PRŮMĚR(B2:B7) | když D3 = 8 | ||
=PRŮMĚR(A2:A7) - 0,775280899*PRŮMĚR(B2:B7) | #DIV/0! | ||
-77528089.6303371 |
Poznámka
Po vložení této tabulky do nového excelového listu klikněte na tlačítko Možnosti vložení a potom klikněte na Přizpůsobit cílové formátování. Se stále vybranou vkládanou oblastí použijte jeden z následujících postupů podle verze aplikace Excel, kterou používáte:
- V aplikaci Microsoft Office Excel 2007 klepněte na kartu Domů , klepněte na tlačítko Formát ve skupině Buňkya klepněte na tlačítko Přizpůsobit šířky sloupců.
- V excelu 2003 přejděte v nabídce Formát na Sloupec a potom klikněte na Přizpůsobit výběr.
Buňky B2:B7 můžete naformátovat jako číslo s 0 desetinnými místy a buňky A9:D13 jako číslo se 6 desetinnými místy.
Buňky A2:A7 a B2:B7 obsahují hodnoty y a hodnoty x, které volají INTERCEPT v buňce A10.
Ve verzích aplikace Excel, které jsou starší než Excel 2003, může funkce INTERCEPT vykazovat chyby zaokrouhlování. Excel 2003 a novější verze Excelu zlepšují chování interceptu. INTERCEPT(known_y, known_x) je výsledek vyhodnocení funkce PRŮMĚR(known_y) – SLOPE(known_y, known_x) * PRŮMĚR(known_x). I když kód pro INTERCEPT nebyl přímo změněn pro Excel 2003 a pro novější verze Excelu, chování INTERCEPT je vylepšeno kvůli vylepšenému kódu pro SLOPE.
Pokud máte starší verzi Excelu, můžete pomocí listu, který jste vytvořili dříve, spustit experiment a zjistit, kdy dojde k chybám zaokrouhlování. Přidání kladné konstanty ke každému pozorování v B2:B7 by nemělo mít vliv na hodnotu SLOPE. Pokud vykreslíte dvojice x,y s x na vodorovné ose a y na svislé ose a pak ke každé hodnotě x přidáte kladnou konstantu, data se jednoduše posunou doprava. Regresní přímka, která nejlépe vyhovuje, má stále stejný sklon. Posunutá data ale mají jiný průsečík.
Při výchozí hodnotě 0 v D3 je slope v A9 0,775280899. Buňka A10 zobrazuje hodnotu INTERCEPT a buňka A11 zobrazuje hodnotu výrazu, který se vyhodnotí při výpočtu FUNKCE INTERCEPT:
AVERAGE(known_y) – SKLON(known_y, known_x) * PRŮMĚR(known_x)
Hodnoty v buňkách A9 a A10 se vždy shodují, protože hodnota v buně A10 je přesně to, co funkce INTERCEPT vrací. Sklon by se neměl lišit, protože do known_x přidáte různé kladné konstanty. Buňka A11 zobrazuje průměr(known_y) – 0,775280899 * PRŮMĚR(known_x). Vzhledem k tomu, že hodnota SLOPE by se neměla měnit a hodnota SLOPE je 0,775280899, když D3 = 0, měly by hodnoty tohoto výrazu v buničce A11 také souhlasit s hodnotami v buňkách A9 a A10.
Pokud zvýšíte hodnotu v D3, přidáte do B2:B7 větší konstantu. Pokud D3 <= 7, pak se na prvních 6 desetinných místech funkce SLOPE nezobrazí žádné chyby zaokrouhlování. Pokud ale zkusíte 7,25, 7,5, 7,75 a 8, sklon v A9 se změní. V důsledku toho se hodnoty v buňkách A11 (které souhlasí s A10) a A12 liší. Hodnoty v A11 (nebo A10) a A12 by ale měly být stejné, protože přidání konstanty do known_x by nemělo mít vliv na hodnotu SLOPE.
D7:D13 zobrazí hodnoty, které funkce INTERCEPT vrátí, a hodnoty, které by funkce INTERCEPT měla vrátit, pokud se hodnota SLOPE nezměnila. Tyto dvojice hodnot se zobrazí v případech, kdy D3 = 7,5 a 8. Chyby zaokrouhlit se staly tak závažné, že k dělení 0 dojde, když D3 = 8.
Dřívější verze Excelu v těchto případech poskytují nesprávné odpovědi, protože účinky chyb zaokrouhlování jsou větší s výpočetním vzorcem, který tyto verze používají. Přesto tento experiment ukazuje, že případy, kdy k chybám dochází, jsou extrémní.
Pokud máte Excel 2003 nebo novější verzi Excelu, je mezi společnými hodnotami v A10 a A11 a hodnotou v A12 při pokusu o experiment malý nebo žádný rozdíl. Buňky D7:D13 ale zobrazují chyby zaokrouhlování, které získáte ve starších verzích Excelu.
Výsledky v dřívějších verzích Excelu
Článek o funkci SLOPE popisuje méně číselně robustní vzorec, který používají starší verze. Vzorec vyžaduje pouze jedno předání dat. Pouze nedostatky SLOPE v těchto verzích způsobují, že INTERCEPT v extrémních případech způsobuje chyby zaokrouhlování.
Výsledky v Excelu 2003 a novějších verzích Excelu
Excel 2003 a novější verze excelu používá vylepšený postup pro výpočet sklonu. Výsledkem je zlepšení výkonu interceptu. Vylepšený postup vyžaduje dvě průchody daty. Zlepšení opět popisuje následující článek o slope.
Další informace o vylepšeních funkce SLOPE pro aplikaci Excel 2003 a novější verze aplikace Excel naleznete v následujícím článku znalostní báze Microsoft Knowledge Base:
828142 statistické funkce Excelu: SLOPE
Závěry
Vzhledem k tomu, že Excel 2003 a novější verze Excelu nahrazují přístup s jedním průchodem dvěma průchody, je číselný výkon funkce SLOPE v excelu 2003 a novějších verzích aplikace Excel lepší než ve starších verzích aplikace Excel. Proto je číselný výkon INTERCEPT lepší. Výsledky v Excelu 2003 a novějších verzích excelu nebudou nikdy méně přesné než výsledky v dřívějších verzích Excelu.
Obvykle není rozdíl mezi výsledky v Excelu 2003 a novějších verzích excelu a výsledky v dřívějších verzích excelu, protože data se často nechovají neobvyklým způsobem, který tento experiment ilustruje. Číselná nestabilita se s největší pravděpodobností objeví v dřívějších verzích aplikace Excel, když data obsahují mnoho významných číslic a malé odchylky mezi datovými hodnotami.
Následující postup zjistí součet druhých odchylek o střední hodnotě vzorku:
- Vyhledání ukázkové střední hodnoty
- Vypočítejte každou druhou odchylku.
- Součet druhých odchylek
Tento postup je přesnější než následující alternativní postup (známý také jako "vzorec kalkulačky", protože byl vhodný pro použití na kalkulačce pro malý počet datových bodů):
- Zjistí součet druhých mocnin všech pozorování, velikost vzorku a součet všech pozorování.
- Vypočítejte součet druhých mocnin všech pozorování minus ((součet všech pozorování)^2)/velikost vzorku).
Nahrazením této poslední procedury jedním průchodem procedurou dvou průchodů, která najde střední hodnotu vzorku při prvním průchodu a vypočítá součet kvadraických odchylek při druhém průchodu, excel 2003 a novější verze aplikace Excel vylepšují mnoho dalších funkcí. Krátký seznam takových funkcí zahrnuje VAR, VARP, STDEV, STDEVP, DVAR, DVAR, DVARP, DSTDEV, DSTDEVP, FORECAST, SLOPE, INTERCEPT, PEARSON, RSQ a STEYX. Společnost Microsoft provedla podobná vylepšení v každém ze tří nástrojů analýza odchylek v doplňku Analytické nástroje.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro