Är du enögd, lille vän? Nej, naturligtvis är du inte enögd, inte ens skelögd, vindögd eller blåögd. Du är snarare vidsynt, har helikoptervy, allsidigt synsätt, etcetera. Jag vill ändå ta upp något multidimensionellt problem som lätt kan få en endimensionell analys.
Ingemar Sjöström: Så undviker du förenklade analyser
Analys Ingemar Sjöström räknar vidare. Den här gången vill han få oss att inte slentrianmässigt använda verktyg som kan ge för förenklade analyser.

Någonting är fel
Läs vidare – starta din prenumeration
Obs! I dessa tider varnas det ofta för desinformation från olika håll, kanske inte alltid medveten. Lite då och då kan du i kvalitetsammanhang få råd om hur man bör mäta, räkna, rita och förklara. Inte sällan kommer dessa från någon som inte smutsat ner sig med data, svett och tårar och råden består av infantila uppmaningar och hänvisning till enkla verktyg. ”Men är det inte bra att börja någonstans?”, frågar du. Jo, men inte där. Varje problem bör tas på allvar och på något slags ingenjörsnivå. Du ropar ju inte ”börja med gångertabellen!” till ekonomiavdelningen då det drar ihop sig till bokslut.
Anta att du har ett mätvärde som du kalla Y och som du vill analysera. Anta också att du ritat följande två diagram, Y mot X1 och Y mot X2:
Visserligen kan du se två avvikande värden (felmätningar?) cirka 50 och 60 men det verkar ganska uppenbart att sambandet mellan Y och de två X-variablerna verkar vara mycket svagt, om det överhuvudtaget existerar. Det är lätt att ’bevisa’ detta med en enkel regressionsanalys (”anpassa en rät linje till data”), något som lärs ut redan i gymnasiet och på andra enklare statistikkurser. Data visas i tabellen nedan.
Här bör du dock koppla in ditt allsidiga synsätt: ”tänk om Y är beroende av X1 och X2, samtidigt!”. Plocka fram din kalkylator och beräkna Y med modellen Y=8-5*X1+12*X2:
Du ser plötsligt att det finns ett perfekt samband mellan Y och X1 och X2 och dessutom inget utrymme för ytterligare variabler. Du ser också att Y minskar med 5 enheter för varje enhets ökning i X1 och att Y ökar med 12 enheter för varje ökning av X2. Om du vill att Y ska öka så vet du nu hur du ska styra! (Modellen är ett resultat från en multiregressionsananlys.)
I mer komplicerade fall där du har många X-variabler till förfogande och kanske sambandet är krökt har du ingen chans utan skarpa verktyg…
Så kallat t-test. Inte sällan vill man jämföra utfallet från två processer. ”Ett t-test”, ropar Bill, ”ett t-test vill vi ha”, svarar Bull. Metoden ’t-test’ lärs snabbt ut på kvalitetskursen men är också ett skarpt verktyg som lätt kan användas felaktigt eller slentrianmässigt. Ett exempel:
Vi har mätningar från två processer och vill analysera om deras medelvärde skiljer sig åt eller kan betraktas som likvärdiga processer, skillnad i medelvärde är då bara ett slumpmässigt utfall.
De två trianglarna anger processernas medelvärden (övriga data visas inte här) men analysen visar att hypotesen för att processerna skiljer sig åt måste förkastas. Man hittar alltså ingen skillnad.
Men om analysen ser lite längre, öppnar sig en helt annan situation. Här är det återigen en flerdimensionerell situation:
Genom en analys får vi fram följande modell:
Y=11.7+2.9*X1+5.4*X2 där X1 visas på X-axeln och X2 kan ta två värden, antingen röda eller svarta (X2 är alltså en så kallad faktor typ Maskin A, Maskin B eller dylikt).
Analysen visar vad som syns tydligt i diagrammet: det finns en tydlig skillnad mellan de två medelvärdena och den är 5.4 enheter, alltså ett helt annat analysresultat!
Så kallat samspel. De två exemplen ovan visar att ett ensidigt synsätt kan vara en missad chans till förbättringar. Som lök på laxen har du ofta samspel i dina data. Titta på diagrammet ovan och anta att linjerna inte varit parallella. Då skulle du ha sett en ökande variation åt höger, vilket skulle gett dig gråa hår om du inte tagit med detta som en term i din modell. (Och du, du har alltid samspel i dina data… gäller att hitta det…)
En simulering: På länken http://ovn.ing-stat.se referens [15] hittar de ett verkligt exempel baserat på ett problem hos ett stort svenskt vitvaruföretag. Problemet innehöll ett antal olika förklaringsvariabler. De vanligaste datorprogrammen har ungefär samma utskrift vid analys och i [15] listas några typiska resultat.
I referens [42] hittar du vår ’3-step maturity model’ där vi sammanfattat några årtiondens erfarenhet av att knåda data. Kanske modellen vara till din hjälp.
Avslutning: Som alltid, skaffa dig några bra rådgivare i ämnet. (Men testa dem först: be dem förklara binomialfördelningen, Poissonfördelningen och centralagränsvärdessatsen så att du förstår varför de är viktiga kunskaper.)
Ingemar Sjöström