Estimering og hypotesetesting
I vitenskapelige studier er estimering og hypotesetesting viktige verktøy for å kunne trekke konklusjoner basert på et datasett. Estimering handler om å estimere en populasjonsparameter basert på et utvalg fra populasjonen, mens hypotesetesting handler om å teste om en påstand om populasjonen holder vann basert på et utvalg fra denne populasjonen. I denne artikkelen vil vi utdype hva estimering og hypotesetesting er, hvordan de utføres, og hvorfor de er viktige verktøy for vitenskapelige studier.
Estimering
Estimering handler om å beregne en populasjonsparameter basert på et utvalg fra denne populasjonen. Populasjonsparameteren kan være for eksempel gjennomsnittet, standardavviket, medianen eller en annen parameter som karakteriserer populasjonen. Estimeringen gjøres ved å beregne et estimat basert på utvalget. Det kan være for eksempel gjennomsnittet, medianen eller en annen statistisk verdi som karakteriserer utvalget. Estimatet vil i de fleste tilfeller avvike fra populasjonsparameteren, og avviket må tas hensyn til når man tolker resultatene fra estimatet.
Det finnes forskjellige måter å estimere en populasjonsparameter på, og den metoden man velger avhenger av hvilken parameter man ønsker å estimere, og hvilke forutsetninger man gjør om populasjonen. Den vanligste metoden for å estimere en populasjonsparameter er å beregne et punktestimat. Punkt estimatet estimerer populasjonsparameteren til å være lik et tall, som er beregnet fra utvalget. For eksempel kan man estimere gjennomsnittet i populasjonen til å være lik gjennomsnittet i utvalget. Punkt estimatet vil i de fleste tilfeller avvike fra populasjonsparameteren, og avviket må tas hensyn til når man tolker resultatene fra estimatet.
En bedre metode for å estimere en populasjonsparameter er å beregne et intervall estimat. Intervall estimatet angir en nedre og en øvre grense for hva man tror populasjonsparameteren kan være, basert på utvalget. For eksempel kan man estimere gjennomsnittet i populasjonen til å være mellom 8 og 12 når gjennomsnittet i utvalget er 10. Intervall estimatet gir mer informasjon enn punktestimatet fordi man får en følelse av hvor usikker man er på estimatet.
En annen metode for å estimere en populasjonsparameter er å beregne et prediksjonsintervall. Prediksjonsintervallet angir en nedre og en øvre grense for hva man tror en observasjon fra populasjonen vil være, basert på utvalget. For eksempel kan man estimere at en ny observasjon vil være mellom 5 og 15 når gjennomsnittet i utvalget er 10. Prediksjonsintervall gis ofte sammen med intervall estimatet, og gir mer informasjon om hva man kan forvente fra populasjonen.
Hypotesetesting
Hypotesetesting handler om å teste en påstand om populasjonen basert på et utvalg fra denne populasjonen. Påstanden kan være for eksempel at gjennomsnittet i populasjonen er lik 5 eller at andelen som støtter en politisk kandidat er over 50%. Hypotesetestingen gjøres ved å formulere en nullhypotese og en alternativ hypotese, og deretter teste nullhypotesen ved å beregne en teststatistikk.
Nullhypotesen er påstanden som man ønsker å teste. Den er ofte satt til å være den antatte sannheten eller den hypotesen man ønsker å falsifisere. Alternativ hypotese er påstanden som man ønsker å teste hvis nullhypotesen avvises. For eksempel kan man formulere nullhypotesen til å være at gjennomsnittet i populasjonen er lik 5 og alternativ hypotese til å være at gjennomsnittet i populasjonen er forskjellig fra 5.
Teststatistikken er en statistisk verdi som beregnes fra utvalget og som brukes til å teste nullhypotesen. Teststatistikken har en kjent sannsynlighetsfordeling når nullhypotesen er sann. Man beregner derfor en p-verdi, som er sannsynligheten for å få en teststatistikk som er like ekstrem eller mer ekstrem enn den man observerte, under antagelsen om at nullhypotesen er sann. Hvis p-verdien er lavere enn et gitt signifikansnivå (typisk satt til 5%), avviser man nullhypotesen og konkluderer med at alternativ hypotese er mer sannsynlig. Hvis p-verdien er høyere enn signifikansnivået, kan man ikke avvise nullhypotesen, men det betyr ikke nødvendigvis at nullhypotesen er sann, bare at man ikke har tilstrekkelig bevis for å kunne avvise den.
Konklusjon
Estimering og hypotesetesting er viktige verktøy for å kunne trekke konklusjoner basert på et datasett. Estimering handler om å estimere en populasjonsparameter basert på et utvalg fra denne populasjonen, mens hypotesetesting handler om å teste en påstand om populasjonen basert på et utvalg fra denne populasjonen. Begge verktøyene er viktige for vitenskapelige studier fordi de gir oss muligheten til å trekke konklusjoner om populasjonen basert på et utvalg fra denne populasjonen. Med riktig bruk av disse verktøyene kan man gjøre sikre generaliseringer om populasjonen basert på et utvalg fra denne populasjonen.