1. UddannelseMathStatistics Oprettelse af et tillidsinterval for forskellen mellem to midler med kendte standardafvigelser
Statistics For Dummies, 2. udgave

Af Deborah J. Rumsey

Hvis du kender standardafvigelserne for to populationsprøver, kan du finde et konfidensinterval (CI) for forskellen mellem deres middel eller gennemsnit. Målet med mange statistiske undersøgelser og undersøgelser er at sammenligne to populationer, såsom mænd kontra kvinder, familier med lav indkomst mod høj indkomst og republikanere mod demokrater. Når den karakteristik, der sammenlignes, er numerisk (for eksempel højde, vægt eller indkomst), er genstanden for interesse størrelsen af ​​forskellen i middel (gennemsnit) for de to populationer.

For eksempel vil du måske sammenligne forskellen i gennemsnitsalder for republikanere versus demokrater eller forskellen i gennemsnitlige indkomster for mænd versus kvinder. Du estimerer forskellen mellem to befolkningsmidler,

image0.png

ved at udtage en prøve fra hver population (f.eks. prøve 1 og prøve 2) og bruge forskellen mellem de to prøvemidler

image1.png

plus eller minus en fejlmargin. Resultatet er et tillidsinterval for forskellen mellem to befolkningsmidler,

image2.png

Hvis begge populationsstandardafvigelser er kendte, er formlen for en CI for forskellen mellem to populationsmidler (gennemsnit)

image3.png

er middelværdien og størrelsen på den første prøve, og den første populations standardafvigelse,

image4.png

gives (kendt);

image5.png

og n2 er middelværdien og størrelsen på den anden prøve og den anden populations standardafvigelse,

image6.png

er givet (kendt). Her er z * den passende værdi fra den normale normalfordeling for dit ønskede konfidensniveau. (Se følgende tabel for værdier af z * for visse konfidensniveauer.)

For at beregne en CI for forskellen mellem to populationsmidler med kendte standardafvigelser, gør følgende:

image7.png

Antag, at du med 95% tillid ønsker at estimere forskellen mellem den gennemsnitlige (gennemsnitlige) længde på kolberne i to sorter af majs (så de kan vokse det samme antal dage under de samme betingelser). Kald de to sorter Corn-e-stats og Stats-o-sweet. Antag ved forudgående undersøgelse, at populationsstandardafvigelserne for Corn-e-stats og Stats-o-sweet er henholdsvis 0,35 inches og 0,45 inches.

image15.png

Fristelsen er at sige, ”Nå, jeg vidste, at corn-e-stats majs var længere, fordi dets gennemsnitlige prøve var 8,5 inches og Stat-o-sweet var kun 7,5 inches i gennemsnit. Hvorfor har jeg endda brug for et tillidsinterval? ”Alle disse to numre fortæller dig, er noget ved disse 210 ører af stikprøven af ​​majs. Du er også nødt til at faktorere i variation ved hjælp af fejlmargen for at være i stand til at sige noget om hele populationerne af majs.

Bemærk, at du kan få en negativ værdi for

image19.png

For eksempel, hvis du havde skiftet de to sorter af majs, ville du have fået –1 til denne forskel. Du vil sige, at Stats-o-sweet i gennemsnit var en tomme kortere end Corn-e-stats i prøven (den samme konklusion anførte anderledes).

Hvis du vil undgå negative værdier for forskellen i prøveeksempler, skal du altid gøre gruppen med den større prøve til din første gruppe - alle dine forskelle vil være positive.

Selv hvis gruppen med det større prøvemiddelværdi fungerer som den første gruppe, får du nogle gange stadig negative værdier i konfidensintervallet. Antag i ovenstående eksempel, at eksempeldelen af ​​Corn-e-stats var 7,6 inches. Forskellen i prøveindretningen er således 0,1, og den øverste ende af konfidensintervallet er 0,1 + 0,1085 = 0,2085, mens den nedre ende er 0,1 - 0,1085 = –0,0085. Dette betyder, at den sande forskel med rimelighed er overalt fra Corn-e-stats, der er så meget som 0,205 inches længere til Stat-o-sweet, der er 0,0085 inches længere. Det er for tæt på at sige med sikkerhed, hvilken sort der i gennemsnit er længere.