Har du märkt att väderpresentatörerna på tv betraktar dig som en idiot? Trots att du gått flera år i skolan? Det är självklart för alla (utom för tv-presentatören) att ett intervall presenteras enligt ’min’ till ’max’. På tv kastar man i stället om detta och skriver ”-5 till -10” när vinterkylan slår till, alltså temperaturintervallets högsta gräns först.
Dags för intervallträning?
Ingemar räknar
Tv:s väderpresentatörer behandlar tittarna som idioter, skriver Ingemar Sjöström och menar att lite intervallträning vore på sin plats.
Och så delar han med sig av en tumregel som kommer att göra dig till kung!
Någonting är fel
Läs vidare – starta din prenumeration
Du har säkert sett att man får problem med temperaturer runt 0. Man skriver inte ”-3 till 3” utan löser detta (elegant tycker de nog) som ”omkr 0”. Vad är det för fel på att använda det som alla en gång lärt sig?
Intervall för vad?
Vi omges av många intervalluppgifter – ’max 12 personer i hissen’, ’max 65 personer i bussen’, etcetera. Dessa intervall (0 till 12 respektive 0 till 65) är lätta att förstå men hur är det med följande – ”max 90 dagars kölängd” (0 till 90 dagar)? Gäller detta varje enskild observation (alltså varje enskild person) så att vid dag 91 händer det något? (I exemplet med hissen skulle på samma sätt en person vara tvungen att kliva ur hissen om 13 personer skulle klivit in.)
Eller gäller ’90 dagar’ processens medelvärde? Det finns alltså flera tolkningar till ett luddigt intervall (kanske detta är meningen…).
På nyheterna läser man ibland upp utsagor såsom ’…upp till 45 procent av alla män kan ha…’. Då har man fått tag på ett (konfidens)intervall från någon utredning. Jag ska återkomma till dylika utsagor.
Konfidensintervall
Innan vi diskuterar vad ett konfidensintervall är och hur det inte ska missbrukas, ska vi titta på ett annat exempel att använda i diskussionen.
Anta att polisen utreder en kriminell händelse (X) och vill veta mer exakt platsangivelse. Anta också att vi har två bilförare som kört enligt skissen och bägge är till 99 procent säkra på att de sett händelsen från bilfönstret. Naturligtvis drar polisen slutsatsen att händelsen ägt rum i det vägintervall som sammanfaller. Kanske finns det fler vittnen så att en ännu bättre platsangivelse kan härledas.
Antag att ni har samlat in mätningar av någon variabel (felkvot, tider, etcetera) från en eller flera källor och beräknar medelvärde och standardavvikelse (alltså läges- och spridningsmått). Nu vill ni säga något om processens sanna medelvärde. Varje program som kan knåda data kan också beräkna ett konfidensintervall som är ett numeriskt intervall som med en viss konfidens (typ 95 procent, 99 procent) omfattar/innefattar/omfamnar processens sanna medelvärde (detta värde är ju inte känt, ty i så fall behöver man inte mäta).
Tolkning
Intervallets läge och utbredning på talaxeln bestäms av den tillgängliga data som är ett stickprov från processen. Intervallets läge och utbredning påverkas alltså av variationen i data samt antal mätningar. (Ett nytt stickprov ger ett annat intervall.)
En utsaga såsom ’…upp till 45 procent’ är mest för att blåsa upp en nyhet eller en förhoppning. I ett sådant läge skulle det då vara bättre med en mindre undersökning ty ett mindre stickprov ger ett längre osäkerhetsintervall (kanske det vore bättre om litteraturen kallade det för osäkerhetsintervall eller felmarginal…), och då kan det bli en ännu större rubrik i tv-nyheterna!
Man kan heller inte använda resonemanget som polisen gjorde ovan. Anta att du ber två personer ta var sitt stickprov ur processen och sedan redovisa var sitt 99-procentigt intervall. Dessa två intervall kommer antagligen att överlappa varandra men tolkningen kan inte bli att processens sanna medelvärde ligger i den gemensamma delen.
Om man resonerade så skulle det betyda att man kan trolla med datamängden, få ut mer information än som är möjligt! (Antagligen vore det bättre att slå ihop all data till en datamängd.)
Konfidensintervall är i första hand inte ett deskriptivt mått utan ska användas för analys i kvalitetsarbetet, till exempel vid jämförelser mellan lösningar, metoder, maskiner, modeller etcetera.
Notera att konfidensintervall bör beräknas för många olika saker såsom felkvoter, ökningskoefficienter, korrelationskoefficienter och skillnad mellan processer. Avsikten är hela tiden att ta med osäkerheten i analys och resonemang och att förhindra tvärsäkra slutsatser som inte vilar på solid grund.
Ett specialfall
Att hitta noll felaktiga i en undersökning är ju oftast glädjande. Men vad kan man likväl säga om felkvoten? Följande resonemang hittar du inte i ’Six Sigma’-utbildningar så lyssna noga…:
Det är ju meningslöst att räkna ut felkvoten p=0/n som alltså blir noll. Visst, det kan vara så att processen inte har någon felkvot, fast det tvivlar du nog på, annars skulle ni inte utföra ett stickprov. Det finns dock en utomordentlig tumregel (”3/n”) som ger dig övre gränsen till ett 95-procentigt konfidensintervall. För beräkningen behöver du bara två värden: ’0’ och ’n’ och kanske en kalkylator! (Se simulering [27] och dess hänvisning till dokumentet ’A fairytale…’)
Några simuleringar
Grafer och animeringar brukar underlätta förståelsen av komplicerade situationer (även ’TV-vädret’!). Jag bifogar därför länkar till några sådana:
http://ovn.ing-stat.se och övningarna [13], [14], [27]. [13] handlar om resonemanget ovan om konfidensintervall för medelvärden medan [27] handlar om tumregeln. [14] gäller också konfidensintervall för felkvoter men kräver en mer noggrann läsning. (Se dock Exercise 3 – a small p-value under knappen [Exercises].) Se dessutom länken ’A fairytale.doc’ på övning [27].
Avslutning
Nästa gång du tar del av en statistisk redovisning bör du fråga efter ett konfidensintervall. (Låt dig inte luras av att man skriver ”medelvärde +/- tre standardavvikelser” som en beskrivning av de enskilda datavärdena, ett konfidensintervall är för medelvärdet eller något annat som skattas.). Om det saknas ett intervall är det kanske på grund av okunnighet eller att man har något att dölja…
Och du, lär dig älska tumregeln, den gör dig till kung!