Non-Parametric Estimering og Testprosedyrer

Non-Parametric Estimering og Testprosedyrer

Non-Parametric Estimering og Testprosedyrer

Non-parametriske estimerings- og testprosedyrer er ofte brukt innen statistikk. I motsetning til parametriske metoder krever disse ikke en spesifisert fordeling av datasettet. I stedet fokuserer de på å estimere eller teste hypoteser ved å bruke informasjonen i datasettet. I denne artikkelen diskuterer vi de vanligste non-parametriske estimerings- og testprosedyrene og deres bruksområder.

Estimering av median

Den mest kjente non-parametriske estimeringsprosedyren er å estimere medianen. Medianen kan defineres som den midterste verdien i datasettet når det er sortert. For eksempel vil medianen av datasettet 1,2,3,4,5,6,7,8,9 være 5. Hvis datasettet har et odde antall verdier vil medianen være den midterste verdien, mens hvis datasettet har et partall av verdier vil medianen være gjennomsnittet av de to midterste verdiene.

Det er flere måter å estimere medianen på. En enkel metode er å sortere datasettet og velge den midterste verdien. Hvis datasettet har et odde antall verdier vil denne verdien være medianen, mens hvis datasettet har et partall av verdier kan du ta gjennomsnittet av de to midterste verdiene. Det er også mulig å bruke percentile tilnærminger, som involverer å finne det som er nede på k- og (100-k)-te prosentilen.

Det er viktig å merke seg at estimering av median ikke nødvendigvis gir en bedre estimering enn å bruke gjennomsnittet. Medianen gir ingen informasjon om variasjon eller spredning i datasettet. Hvis du vil ha informasjon om spredningen kan det derfor være lurt å bruke andre non-parametriske estimeringsprosedyrer.

Estimering av gjennomsnitt

En annen non-parametrisk estimeringsprosedyre er å estimere gjennomsnittet. Gjennomsnittet kan defineres som summen av verdiene i datasettet delt på antall datapunkter. For eksempel vil gjennomsnittet av datasettet 1,2,3,4,5,6,7,8,9 være 5.

Hvis datasettet ikke er normalfordelt kan det være lurt å bruke en non-parametrisk estimeringsprosedyre for gjennomsnittet. En slik metode er Wilcoxon-Mann-Whitney (WMW) testen. WMW testen er en metode som tester om to datasett kommer fra samme fordeling eller ikke.

Testprosedyrer for ikke-parametriske data

Når du har non-parametriske data er det viktig å bruke non-parametriske testprosedyrer. En non-parametrisk testprosedyre tar ikke hensyn til forutsetninger om normalfordeling eller homogenitet i varians. Derfor kan disse testene brukes når klassiske testprosedyrer ikke kan brukes.

The Kruskal-Wallis test er en av de mest kjente non-parametriske testene. Denne testen tester hypotesen om at medianverdiene i to eller flere grupper er de samme. For eksempel kan du bruke Kruskal-Wallis testen for å teste om det er signifikante forskjeller i høyde mellom personer fra forskjellige land.

En annen non-parametriske testprosedyre er Mann-Whitney U-testen. Denne testen tester hypotesen om at to uavhengige datasett kommer fra samme fordeling eller ikke. For eksempel kan du bruke Mann-Whitney testen for å teste om det er en forskjell i høyde mellom menn og kvinner.

Konklusjon

Non-parametriske estimerings- og testprosedyrer er viktige i statistikk. De kan brukes når klassiske testprosedyrer ikke kan brukes, eller når datasettet ikke er normalfordelt eller homogen i varians. Estimeringsprosedyren kan brukes for å estimere størrelser som median og gjennomsnitt, mens testprosedyrene kan brukes til å teste hypoteser. De vanligste non-parametriske testprosedyrene er Kruskal-Wallis testen og Mann-Whitney U-testen.