Bäste kvalitetsarbetare, säkert har du någon tidig regnig novembermorgon känt sängvärmen mer frestande än skolan. Visst har du i strupen känt en begynnande hosta och efter lite träning kan du få fram trovärdiga hostattacker (det är ju svårare att skapa feber i all hast).
Lär dig simulera för bättre kvalitetsarbete
Ingemar räknar Din mor genomskådar din simulering med ”…du låtsas bara, upp med dig!”. Men all simulering behöver inte sluta med nederlag. Simulering är ett bra verktyg i kvalitetsarbetet.

Någonting är fel
Läs vidare – starta din prenumeration
Med svag röst ropar du på mor men som snart genomskådar din simulering med ”…du låtsas bara, upp med dig!”.
Men all simulering behöver inte sluta med nederlag och jag tänkte att vi skall titta på användningen av simulering i ditt kvalitetsarbete. Jag har tidigare tagit upp detta som verktyg och allmänt sett är det en möjlighet att pröva olika idéer, påståenden, hypoteser eller helt enkelt en nyfikenhet (slutar man vara nyfiken slutar man att vara en bra kvalitetsarbetare…)
Inom kvalitetsarbetet brottas vi med variation i resultaten, antingen det är tider eller dimensioner eller annat, och vi strävar efter att förstå och begränsa variationen som kan mätas på olika sätt. Till vårt förfogande har vi också så kallade statistiska modeller som ska ge dig stöd i tankearbetet. Dessa modeller är härledda ur praktiska situationer och inte något matematiskt skrytbygge.
Jag vill ta det till synes enkla fallet då man i ett stickprov bedömer resultaten som ’OK/ej OK’ och betraktar dessa som oberoende och med en felkvot som inte ändras. Detta leder ofelbart till den så kallade binomialfördelningen. Om dina resultat, till exempel medelvärde, variation, grafer, etcetera avviker från denna modell, ja, då har du inte en stabil process och du behöver starta ditt detektivarbete.
(Se https://ovn.ing-stat.se/ och övning 51 för formler o.d.)

En quiz. En stor svensk dagstidning (Dagens Nyheter) hade under våren en quiz som bestod av n = 12 frågor vars svar bedömdes som ’OK/ ej OK’. Denna quiz besvarades av cirka 19000 personer och en graf (histogram) visar följande fördelning (vi skulle ju också kunna betrakta utfallet som batcher om 12 komponenter som provats):
Det finns några trivial slutsatser vi kan dra, exempelvis att minimum är 0 och maximum är 12 rätt och att svarskvoten/felkvoten (p) är något under 1. Ur data kan vi beräkna medelvärde och standardavvikelsen för ”Antal rätt svar bland 12 frågor”. En fråga är om data, inklusive graf, döljer något för oss. Är till exempel variationen för stor eller för liten? Är kvoten (p) konstant? Om vi studerat komponenter kanske vi misstänker att de kommer från olika processer, olika leverantörer, olika material, etcetera och kanske därmed olika kvoter. Hur kan vi resonera vidare?
En simulering. Den statistiska modellen (binomialfördelningen) som används här har två numeriska parametrar – n och p. n är sampelstorlek (här 12) och p är rättkvoten. Vi känner inte värdet på p och vi behöver skatta detta ur datamängden och därmed kan vi skatta spridningsmåttet standardavvikelsen (sigma). (Jag kallar den skattade kvoten för ’p-hat’ och den skattade standardavvikelsen för ’sigma-hat’.)
Ur datamängden beräknade jag p-hat = 0.82 och då borde sigma-hat bli 1.34 med binomialfördelningens formler (se ovan). Men om jag beräknar standardavvikelsen ur data på vanligt sätt får jag värden 1.86. ”Men vaddå, 1.86 är visserligen större än 1.34 men det kan väl vara slumpen, det betyder väl inte att det är något skumt med data??”.

Men antag att vi ett antal gånger (5000) simulerar datamängden, det vill säga låter 19000 personer svara på quizen igen och med p-skattningen 0.86. Då får vi ju fler värden på standardavvikelsen och kanske en bättre referens?
Histogrammet i bild 1 visar 5000 simuleringar, var och en av dem är 19000 svar. Som synes blir medelvärdet cirka 1.34 alltså det teoretiska sigma det borde bli om datamängden är slumpmässig med konstan p. Men naturligtvis blir det en viss variation i skattningen av sigma.

Bild 2 visar samma simulerade datamängd men också det beräknade standardavvikelsevärdet i Quiz-data (röd linje till höger). Som synes avviker detta dramatiskt vilket alltså visar att variationen i Quiz-data är för hög, orsakad av varierande svarskvot. (Detta är kanske inte så konstigt ty bland de 19000 svarande är säkert kunskapsnivån olika. )
Detektivarbete. Naturligtvis vill du veta varför en process inte är stabil, dvs variationer skall enbart vara slumpmässiga. Om du har ytterligare variabler typ maskin, material, tid, etcetera etcetera kan du nu börja ett intressant arbete. Antagligen börjar det med att formulera hypoteser att testa genom t.ex. att skapa en mängd grafer där kanske bara ett fåtal ger intressanta resultat. (Detta arbete går under begreppet EDA, Explorative Data Analysis).
Ett alternativt sätt är att göra mer formella analyser, kanske någon form av regressionsanalys som dock kräver lite mer kunskap.
Andra exempel:
25. ”Simulering av kvarvarande felrapporter”. Visar hur man bör planera för att kunna minska en kö till ett uppsatt mål.
26. ”Obalans i en krets”. Visar hur olika kvalitet på ingående komponenter påverkar den elektroniska kretsens obalans.
33. ”Kvalitetsförbättring – simulering och animering”. Simulerar en ständig förbättring från nuvarande felkvot till ett mål.
49. ”Confidence intervals for p”. Visar olika konfidensintervall för p formas med olika värden på n och p.
Men ärligt talat…
…ingår detta i vad en kvalitetsorganisation förväntas kunna eller göra? Räcker det inte att vi får en fil med data, skapar några histogram, tvingar på en normalfördelning, beräknar medelvärde och standardavvikelse med sex decimaler och sedan lägger det på intranätet?
Nej, det räcker inte. Idag finns det så mycket hjälpmedel i form av gratis datorprogram och med ett oändligt stöd på nätet. (Simuleringen och graferna ovan har jag gjort med ett gratisprogram. Jag har på https://ovn.ing-stat.se/ skapat många övningar som innehåller programmering som kan kopieras och köras på den egna datorn. Titta efter ”Visa/dölj R-koder” e.d.)
Avslutningsvis. Men för att bli flyhänt gäller det att öva simulering och smutsa ned händerna med analys av data. Varför inte ta med dina kompisar på en pubrunda och där skapa en simjunta? Efter några möten kan du antagligen simulera trovärdigt, även inför mor!