1. UddannelseMathStatistikStandardafvigelse i R
Statistisk analyse med R For Dummies

Af Joseph Schmuller

Når du har beregnet variansen af ​​et sæt numre, har du en værdi, hvis enheder er forskellige fra dine originale målinger. For eksempel, hvis dine originale målinger er i tommer, er deres varians i kvadratmeter. Dette skyldes, at du kvadratierer afvigelserne, før du gennemsnit dem. Så variansen i populationen med fem score i det foregående eksempel er 6,8 kvadratmeter.

Det kan være svært at forstå, hvad det betyder. Ofte er det mere intuitivt, hvis variationstatistikken er i de samme enheder som de originale målinger. Det er let at omdanne varians til den slags statistik. Alt hvad du skal gøre er at tage kvadratroten af ​​variansen.

Ligesom variansen er denne firkantede rod så vigtig, at den har et specielt navn: standardafvigelse.

Befolkningsstandardafvigelse

Standardafvigelsen for en befolkning er kvadratroten af ​​befolkningsvariansen. Symbolet for populationsstandardafvigelsen er Σ (sigma). Dens formel er

eq05006

For denne populationsgrad på 5 mål (i tommer):

50, 47, 52, 46 og 45

befolkningsvariansen er 6,8 kvadrat inches, og befolkningens standardafvigelse er 2,61 inches (afrundet).

Prøve standardafvigelse

Standardafvigelsen for en prøve - et estimat af standardafvigelsen for en population - er kvadratroten af ​​prøvevariansen. Dets symbol er s og dens formel er

eq05007

For denne prøve af målinger (i tommer):

50, 47, 52, 46 og 45

den estimerede befolkningsvarians er 8,4 kvadrat inches, og den estimerede befolkningsstandardafvigelse er 2,92 inches (afrundet).

Brug af R til at beregne standardafvigelse

Som det er tilfældet med varians, er det let at bruge R til at beregne standardafvigelsen: Du bruger funktionen sd (). Og ligesom dens varians modstykke, beregner sd () s, ikke Σ:

> sd (højder)

[1] 2.915476

For Σ - at behandle de fem tal som en selvstændig bestand, med andre ord - skal du multiplicere sd () -resultatet med kvadratroten af ​​(N-1) / N:

> sd (højder) * (sqrt ((længde (højder) -1) / længde (højder)))

[1] 2.607681

Igen, hvis du ofte bruger denne, er det en god ide at definere en funktion:

sd.p = function (x) {sd (x) * sqrt ((længde (x) -1) / længde (x))}

Og her bruger du denne funktion:

> sd.p (højder)

[1] 2.607681