Analīzes rīku komplekta izmantošana salikto datu analīzes vajadzībām

Attiecas uz

Excel pakalpojumam Microsoft 365 Excel pakalpojumam Microsoft 365 darbam ar Mac Excel 2024 Excel 2024 darbam ar Mac Excel 2021 Excel 2019 Excel 2016

Ja jāizstrādā kompleksā statistiskā vai tehniskā analīze, izmantojot analīzes rīku komplektu, var samazināt veicamo darbību skaitu un laiku. Jūs nodrošināt datus un parametrus katrai analīzei un rīks izmanto atbilstīgas statistiskās vai tehniskās makro funkcijas, lai aprēķinātu un rādītu rezultātus izvades tabulā. Daži rīki papildus izvades tabulām ģenerē diagrammas.

Datu analīzes funkcijas var vienlaikus izmantot tikai vienā darblapā. Veicot datu analīzi grupētās darblapās, rezultāti tiek rādīti pirmajā darblapā un pārējās darblapās tiek rādītas tukšas formatētas tabulas. Lai veiktu datu analīzi pārējās darblapās, pārrēķiniet analīzes rīku katrā darblapā.

Analīzes rīku komplektā ir iekļauti tālāk esošajās sadaļās aprakstītie rīki. Lai piekļūtu šiem rīkiem, cilnē Dati atlasiet Datu analīze. Ja komanda Datu analīze nav pieejama, jāielādē un jāaktivizē analīzes rīku komplekta pievienojumprogramma.

Analīzes rīku komplekta ielāde un aktivizēšana

Lai ielādētu un aktivizētu analīzes rīku komplektu:

Programmā Excel darbam ar Mac failu izvēlnē dodieties uz Rīki>Excel pievienojumprogrammas.

Programmā Excel darbam ar Windows:
1. Atlasiet Fails, Opcijas un pēc tam atlasiet Pievienojumprogrammas.
2. Lodziņā Pārvaldīt atlasiet Excel pievienojumprogrammas un pēc tam atlasiet Aiziet!
Lodziņā Pievienojumprogrammas atzīmējiet izvēles rūtiņu Analīzes rīku komplekts un pēc tam atlasiet Labi.
- Ja lodziņā Pieejamās pievienojumprogrammas nav norādīta opcija Analīzes rīku komplekts, noklikšķiniet uz Pārlūkot, lai to atrastu.
- Ja tiek parādīta uzvedne, kas informē par to, ka analīzes rīku komplekts nav instalēts datorā, atlasiet Jā , lai to instalētu.

Piezīme

Lai analīzes rīku komplektā iekļautu programmu Visual Basic for Application (VBA), var ielādēt analīzes rīku komplekta - VBA pievienojumprogrammu tādā pašā veidā, kā ielādējot analīzes rīku komplektu. Lodziņā Pieejamās pievienojumprogrammas atzīmējiet izvēles rūtiņu Analīzes rīku komplekts - VBA.

Anova

Anova analīzes rīki piedāvā dažādus dispersijas analīzes tipus. Izmantojamie rīki ir atkarīgi no daudziem faktoriem un paraugu skaita, kurus ieguvis no populācijas, kuru vēlaties testēt.

Anova: vienfaktors

Šis rīks veic vienkāršu datu dispersijas analīzi diviem vai vairākiem paraugiem. Analīze pārbauda hipotēzi, ka katra izlase ir izvilkta no vienas un tās pašas pamatā esošās varbūtības sadalījuma attiecībā pret alternatīvo hipotēzi, ka pamatā esošie varbūtības sadalījumi nav vienādi visām izlasēm. Ja ir tikai divi paraugi, varat izmantot darblapas funkciju T.TEST. Ar vairāk nekā diviem paraugiem nav ērta T.TEST vispārināšana, un tā vietā var izmantot viena faktora Anova modeli.

Anova: divfaktors ar replicēšanu

Šis analīzes rīks ir noderīgs, kad datus var klasificēt divās dažādās dimensijās. Piemēram, augu garumu mērīšanas eksperimentā augiem var dot dažādu veidu mēslojumu (piemēram, A, B, C) un tos var turēt arī dažādās temperatūrās (piemēram, zemā, augstā). Katram no sešiem iespējamiem pāriem {mēslojums, temperatūra} ir vienāds augu garuma novērojumu skaits. Izmantojot šo Anova rīku, var pārbaudīt:

Vai augu garumi dažādu veidu mēslojumiem tiek izvilkti no tās pašas pamatā esošās populācijas. Šai analīzei temperatūra tiek ignorēta.
Vai arī augu garumi dažādos temperatūras līmeņos tiek izvilkti no tās pašas pamatā esošās populācijas. Šai analīzei mēslojumu veidi tiek ignorēti.

Aprēķinot atšķirību efektu starp mēslojumu veidiem, kas atrodamas pirmajā punktā ar aizzīmi, un atšķirības pēc temperatūras, kas atrodamas otrajā punktā ar aizzīmēm, seši paraugi, kas pārstāv visus vērtību {mēslojums, temperatūra} pārus, tiek izvilkti no tās pašas populācijas. Alternatīvā hipotēze ir tāda, ka efekti rodas atbilstīgi konkrētiem pāriem {mēslojums, temperatūra} pāri un virs atšķirībām, kas pamatotas tikai uz mēslojumu vai tikai uz temperatūru.

Ievades diapazona iestatījums Anova rīkam

Anova: divfaktors bez replicēšanas

Šis analīzes rīks ir noderīgs, ja dati tiek klasificēti divās dažādās dimensijās kā divu faktoru gadījumā ar replicēšanu. Tomēr šim rīkam ir pieņemts, ka katram pārim ir tikai viens novērojums (piemēram, katrs pāris {mēslojums, temperatūra} iepriekšējā piemērā).

Korelācija

Darblapas funkcija CORREL un PEARSON aprēķina korelācijas koeficientu starp diviem mērījuma mainīgajiem, ja katra mainīgā mērījumi tiek novēroti katrai no N tēmām. (Jebkurš trūkstošais novērojums jebkuram priekšmetam liek ignorēt šo tēmu analīzē.) Korelācijas analīzes rīks ir īpaši noderīgs, ja katrai no N tēmām ir vairāk nekā divi mērīšanas mainīgie. Tas nodrošina izvades tabulu, korelācijas matricu, kas parāda CORREL (vai PEARSON) vērtību, ko lieto katram iespējamam mērījuma mainīgo pārim.

Korelācijas koeficients līdzīgi kovariācijai ir apjoma mērījums, kurā divi mērījuma mainīgie tiek "variēti kopā". Atšķirībā no kovariācijas korelācijas koeficients ir mērogots tā, lai tā vērtība nebūtu atkarīga no vienībām, kurās izteikti mērījuma mainīgie. (Piemēram, divi mērījuma mainīgie ir svars un augstums, korelācijas koeficienta vērtība ir nemainīta, ja svars tiek konvertēts no mārciņām uz kilogramiem.) Katra korelācijas koeficienta vērtībai ir jābūt no -1 līdz +1 (ieskaitot).

Korelācijas analīzes rīku var izmantot, lai pārbaudītu katru mērījuma mainīgo pāri un noteiktu, vai abiem mērījuma mainīgajiem ir tendence pārvietoties kopā — tas ir, viena mainīgā lielajām vērtībām ir tendence būt saistītām ar otra lielajām vērtībām (pozitīvā korelācija), vai viena mainīgā mazajām vērtībām ir tendence būt saistītām ar otra lielajām vērtībām (negatīvā korelācija) vai arī abu mainīgo vērtībām ir tendence būt nesaistītām (korelācija pie 0 (nulle)).

Kovariācija

Ja ir N dažādi mērījumu mainīgie, kas novēroti personu kopā, korelācijas un kovariācijas rīkus var izmantot vienā iestatījumā. Korelācijas un kovariācijas rīki dod izvades tabulu, matricu, kas rāda korelācijas koeficientu vai kovariāciju atbilstīgi starp katru mērījuma mainīgo pāri. Atšķirība ir tāda, ka korelācijas koeficienti ir mērogoti atrasties starp -1 un +1 ieskaitot. Atbilstīgās kovariācijas netiek mērogotas. Gan korelācijas koeficients, gan kovariācija ir mērījumi, kurā divi mainīgie "variējas kopā".

Rīks Kovariācija aprēķina darblapas funkcijas COVARIANCE vērtību. P katram mērījuma mainīgo pārim. (Tieša kovariācijas izmantošana. P, nevis kovariācijas rīks ir saprātīga alternatīva, ja ir tikai divi mērīšanas mainīgie, t.i., N=2.) Ieraksts kovariācijas rīka izvades tabulas diagonālē i rindā i kolonnā ir i-tā mērījuma mainīgā kovariācija ar sevi. Tā ir tikai šī mainīgā populācijas dispersija, ko aprēķina darblapas funkcija VAR.P.

Varat izmantot kovariācijas rīku, lai pārbaudītu katru lieluma mainīgo pāri un noteiktu, vai divi lieluma mainīgie tiecas sastapties — tas ir, vai viena mainīgā lielās vērtības var tikt saistītas ar otra mainīgā lielajām vērtībām (pozitīvā kovariācija), vai viena mainīgā mazās vērtības var tikt saistītas ar otra mainīgā lielajām vērtībām (negatīvā kovariācija), vai, iespējams, abu mainīgo vērtības nevar tikt saistītas (kovariācija tuva 0 (nullei)).

Aprakstošā statistika

Aprakstošās statistikas analīzes rīks ģenerē nemainītās statistikas atskaiti datiem ievades diapazonā, sniedzot informāciju par centrālo tendenci un datu mainīgumu.

Eksponenciālā nogludināšana

Eksponenciālās nogludināšanas analīzes rīks prognozē vērtību, pamatojoties uz iepriekšējā perioda analīzi, kurš ir pielāgots kļūdai šajā iepriekšējā prognozē. Rīks izmanto nogludināšanas konstanti a, kuras lielums nosaka, cik lielā mērā prognozes atbilst kļūdām iepriekšējā prognozē.

Piezīme

Piemērota nogludināšanas konstantes vērtība ir no 0,2 līdz 0,3. Šīs vērtības norāda, ka pašreizējo prognozi vajadzētu pielāgot par 20-30 procentiem kļūdai iepriekšējā prognozē. Lielākas konstantes izveido ātrāku atbildi, bet var izveidot neparastas projekcijas. Mazākas konstantes var izveidot ilgus kavējumus prognozes vērtībām.

F testa divparaugs dispersijām

F testa divparauga dispersiju analīzes rīks veic divparaugu F testu, lai salīdzinātu divas populācijas dispersijas.

Piemēram, var izmantot F testa rīku laiku paraugos peldēšanas sacensībām katrai no divām komandām. Rīks sniedz nulles hipotēzes testa rezultātu, ka šie divi paraugi nāk no vienādu dispersiju sadalījuma attiecībā pret alternatīvu, ka dispersijas nav vienādas ar spēkā esošajiem sadalījumiem.

Šis rīks aprēķina F statistikas (vai F attiecības) vērtību f. F vērtība, kas ir tuvu 1, pierāda, ka pamatā esošās populācijas dispersijas ir vienādas. Izvades tabulā, ja f < 1 "P(F <= f) viena zara" sniedz varbūtību novērot F statistikas vērtību, kas ir mazāka par f, ja populācijas dispersijas ir vienādas, un "F kritiskais viensekojums" dod kritisko vērtību, kas ir mazāka par 1 izvēlētajam būtiskuma līmenim Alfa. Ja f > 1, tad "P(F <= f) viensekojums" sniedz iespējamību novērot F statistikas vērtību, kas ir lielāka par f, ja populācijas dispersijas ir vienādas, un "F kritiskais viensekojums" dod kritisko vērtību, kas ir lielāka par 1 alfai.

Fourier analīze

Fourier analīzes rīks risina problēmas lineārās sistēmās un analizē periodiskos datus, datu transformēšanai izmantojot ātrās Fourier transformēšanas (FFT) metodi. Šis rīks atbalsta arī inversās transformācijas, kurās transformēto datu inverss tiek atgriezts uz sākotnējiem datiem.

Ievades un izvades diapazoni Fourier analīzei

Histogramma

Histogrammas analīzes rīks aprēķina atsevišķos un kumulatīvos sastopamības biežumus šūnas datu diapazonam un datu nodalījumiem. Šis rīks ģenerē datus vērtības gadījumu skaitam datu kopā.

Piemēram, klasē, kurā ir 20 audzēkņi, var noteikt rezultātu izplatību burtu kategorijās. Histogrammas tabula attēlo burtu kategorijas robežas un rezultātu skaitu starp zemāko robežu un pašreizējo robežu. Atsevišķs visbiežākais rezultāts ir datu režīms.

Padoms

Programmā Excel 2016 tagad var izveidot histogrammas vai Pareto diagrammu.

Mainīgs vidējais

Mainīgā vidējā analīzes rīks projektē vērtības prognozes periodā, pamatojoties uz mainīgā vidējo vērtību konkrētā iepriekšējo periodu skaitā. Vidējais mainīgais sniedz tendences informāciju, ko maskētu visu vēsturisko datu vienkāršs vidējais. Lietojiet šo rīku, lai prognozētu pārdošanu, krājumus vai citas tendences. Katras budžeta vērtības pamatā it tālāk norādītā formula.

Formula mainīgo vidējo aprēķināšanai

kur:

N ir iepriekšējo periodu skaits, kas jāiekļauj vidējā mainīgajā
Aj ir faktiskā vērtība laikā j
Fj ir prognozētā vērtība laikā j

Dažādu skaitļu ģenerēšana

Dažādu skaitļu ģenerēšanas analīzes rīks aizpilda diapazonu ar neatkarīgiem dažādiem skaitļiem, kas ir izvilkti no vienas no vairākām izplatībām. Tēmas populācijā var raksturot ar varbūtības sadalījumu. Piemēram, var izmantot parastu izplatību, lai raksturotu personu garumu populāciju, vai arī var izmantot divu iespējamo iznākumu Bernulli sadalījumu, lai raksturotu apgriezto rezultātu populāciju.

Rangs un procentile

Ranga un procentiļu analīzes rīks izveido tabulu, kurā ir katras datu kopas vērtības kārtas un procentuālais rangs. Var analizēt vērtību relatīvo novietojumu datu kopā. Šis rīks izmanto darblapas funkcijas RANK. EQ un PERCENTRANK. INC. Ja vēlaties uzskaitīt salīdzinātās vērtības, izmantojiet RANK. Funkcija EQ , kas saistītas vērtības apstrādā kā tādas, kurām ir vienāds rangs, vai izmanto RANK. AVG funkcija, kas atgriež vidējo rangu saistītajām vērtībām.

Regresija

Regresijas analīzes rīks veic lineārās regresijas analīzi, lietojot "mazāko kvadrātu" metodi, lai caur novērojumu kopu iekļautos līnijā. Var analizēt, kā vienu atkarīgo mainīgo ietekmē vienu vai vairāku neatkarīgo mainīgo vērtības. Piemēram, var analizēt, kā sportista veiktspēju ietekmē tādi faktori kā vecums, garums un svars. Var piešķirt koplietojumus veiktspējas mērvienībā katram no šiem trim faktoriem, pamatojoties uz veiktspējas datu kopu, un pēc tam izmantot rezultātus, lai paredzētu jauna, nepārbaudīta sportista veiktspēju.

Regresijas rīks izmanto darblapas funkciju LINEST.

Iztveršana

Iztveršanas analīzes rīks izveido paraugu no populācijas, apstrādājot ievades diapazonu kā populāciju. Ja populācija ir pārāk liela apstrādei vai diagrammai, varat izmantot attēlojošu paraugu. Var izveidot arī paraugu, kurā ir tikai vērtības no konkrētas cikla daļas, ja uzskatāt, ka ievades dati ir periodiski. Piemēram, ja ievades diapazons satur ceturkšņa pārdošanas skaitļus, iztveršana notiek ar periodisku četru vietu pārraides ātrumu vērtībām no tā paša ceturkšņa izvades diapazonā.

T tests

Divu paraugu T testa analīzes rīku pārbaude populācijas vienādībai nozīmē, kas ir zem katra parauga. Trīs rīki izmanto dažādus pieņēmumus: ka populācijas dispersijas ir vienādas, ka populācijas dispersijas nav vienādas un ka divi paraugi attēlo pirmsapstrādes un pēcapstrādes novērojumus tām pašām tēmām.

Visiem trim tālāk norādītajiem rīkiem tiek aprēķināta t statistikas vērtība t, kas izvades tabulās tiek parādīta kā "t stat". Atkarībā no datiem šī vērtība t var būt negatīva vai nenegatīva. Pieņemot, ka pamatā esošā populācija ir vienāda, ja t < 0, tad "P(T <= t) viena zara" dod varbūtību, ka t-statistikas vērtība ir negatīvāka par t. Ja t >=0, tad "P(T <= t) viensekojums" sniedz iespējamību, ka t-statistikas vērtību var novērot pozitīvāku par t. "t kritiskais viensekojums" sniedz starpības vērtību, tādējādi varbūtība, ka t-statistikas vērtība būs lielāka vai vienāda ar "t kritisko viensekojumu", ir alfa.

"P(T <= t) divsekojums" sniedz iespējamību, ka t-statistikas vērtību var novērot lielāku vai vienādu ar t. "P kritiskais divsekojums" sniedz starpības vērtību, tādējādi novērotās t-statistikas iespējamība absolūtajā vērtībā, kas lielāka par "P kritisko divsekojumu", ir alfa.

T tests: divi pāra paraugi vidējiem

Var izmantot pāra testu, ja paraugos ir dabiski novērojumu pāri, piemēram, divreiz testējot paraugu grupu — pirms un pēc eksperimenta. Šis analīzes rīks un tā formula veic divparaugu pāru studenta T testu, lai noteiktu, vai novērojumi, kas tika veikti pirms apstrādes, un novērojumi, kas tika veikti pēc apstrādes, ir nākuši no izplatībām ar vienādiem populācijas vidējiem. Šī T testa forma nepieņem, ka abu populāciju dispersijas ir vienādas.

Piezīme

Starp šī rīka ģenerētajiem rezultātiem ir pūlotā dispersija, uzkrātais datu izplatības mērījums par vidējo, kas iegūts no šīs formulas.

Formula pūlotās dispersijas aprēķināšanai

T tests: divu izlašu pieņemšana vienādās dispersijās

Šis analīzes rīks veic divu izlašu studenta T testu. Šī T testa forma pieņem, ka divas datu kopas nāk no sadalījumiem ar vienādām dispersijām. Uz to atsaucas kā uz homoskedastisku T testu. Šo T testu var izmantot, lai noteiktu, cik liela ir iespējamība, ka abi piemēri ir nākuši no sadalījumiem ar vienādiem populācijas vidējiem.

T tests: divu izlašu pieņemšana nevienādās dispersijās

Šis analīzes rīks veic divu izlašu studenta T testu. Šī T testa forma pieņem, ka divas datu kopas nāk no sadalījumiem ar nevienādām dispersijām. Uz to atsaucas kā uz heteroscedastisko T testu. Tāpat kā iepriekšējā vienādo dispersiju gadījumā šo T testu var izmantot, lai noteiktu, vai abi piemēri, kā liekas, ir nākuši no sadalījumiem ar vienādiem populācijas vidējiem. Izmantojiet šo testu, ja abos paraugos ir atšķirīgas tēmas. Izmantojiet pāru testu, kas aprakstīts šajā piemērā, ja ir atsevišķa tēmu kopa un divi paraugi attēlo mērījumus katrai tēmai pirms un pēc apstrādes.

Lai noteiktu statistisko vērtību t, izmanto tālāk norādīto formulu.

Formula vērtības t aprēķināšanai

Lai aprēķinātu brīvības pakāpes df, izmanto tālāk norādīto formulu. Tā kā aprēķina rezultāts parasti nav vesels skaitlis, df vērtība tiek noapaļota līdz tuvākajam veselajam skaitlim, lai iegūtu kritisko vērtību no tabulas t. Excel darblapas funkcija T.TEST izmanto aprēķināto df vērtību bez noapaļošanas, jo T.TEST vērtību var izskaitļot ar neveselu skaitli df. Tā kā brīvības pakāpju noteikšanai ir atšķirīgas pieejas, T.TEST un šī T testa rīka rezultāti atšķirsies nevienlīdzīgu dispersiju gadījumā.

Formula brīvības pakāpju saskaņošanai

Z tests

Z tests: divi paraugi vidējiem analīzes rīks veic divu paraugu z testu vidējiem ar zināmām dispersijām. Šis rīks tiek izmantots, lai pārbaudītu nulles hipotēzi, ka nav atšķirības starp diviem populācijas vidējiem un attiecībā pret vienpusējām vai divpusējām alternatīvām hipotēzēm. Ja dispersijas nav zināmas, tās vietā jāizmanto darblapas funkcija Z.TEST .

Izmantojot Z testa rīku, uzmanieties, lai pareizi izprastu izvadi. "P(Z <= z) viena aste" patiesībā ir P(Z >= ABS(z)), z vērtības varbūtība tālāk no 0 tajā pašā virzienā kā novērotā z vērtība, ja nav atšķirības starp populācijas līdzekļiem. "P(Z <= z) two-tail" patiesībā ir P(Z >= ABS(z) vai Z <= -ABS(z)), z vērtības varbūtība tālāk no 0 jebkurā virzienā nekā novērotā z vērtība, ja nav atšķirības starp populācijas līdzekļiem. Divsekojumu rezultāts ir vienkārši viensekojuma rezultāts, kas reizināts ar 2. Z testa rīku var arī izmantot gadījumam, kur nulles hipotēze ir tā, ka nav konkrētas vērtības, kas nav nulle atšķirībai starp diviem populācijas vidējiem. Piemēram, šo testu var izmantot, lai noteiktu atšķirības starp divu automašīnu modeļu veiktspēju.