Ofte når der laves statistisk overblik over performance af processer, ses der på hvordan processen performer i gennemsnit.
Det giver et overordnet overblik over hvordan processen performer og hvor der er flaskehalse, men der skjules vigtig information, hvis der ses på gennemsnit, uden at der ses på hvilke tal, der ligger til grund for gennemsnittet.
Man kan let blive snydt og dermed komme til at konkludere på et forkert grundlag.
Hvis vi antager at data grundlaget er renset for faldgruber, såsom cases der ligger udenfor vinduet, ikke-komplette cases, ikke-repræsentativt grundlag etc. er der stadig to vigtige forhold, der skal belyses for ikke at blive vildledt at gennemsnitstallene for processens performance:
- Outliers
- Gennemsnittet relativt set
Outliers, eller ekstremer som vi også kan kalde dem, er cases der er så store/ekstreme at de forstyrrer gennemsnittet. På nedenstående graf over distributionen af cases er der nogle cases, der tager enormt lang tid. Læg mærke til at varigheden af alle cases i gennemsnit er 25,9 dage:
Nedenfor ses samme oversigt men hvor de ekstreme cases er blevet fjernet. Læg mærke til at den gennemsnitlige varighed nu er 21,5 dage, hvilket er betydeligt lavere end gennemsnittet, der var påvirket af de ekstreme cases:
Læg i øvrigt også mærke til at medianen er den samme i begge diagrammer. Medianen repræsenterer den værdi, der ligger i midten af datasettet og dermed med lige mange cases på hver side af værdien. Medianen er ofte et bedre fikspunkt end gennemsnittet, da medianen ikke påvirkes af ekstreme cases. Jo større forskel der er på medianen og gennemsnittet jo større ekstremer er der.
Det skal dog også nævnes, at ekstremerne bør undersøges inden de blot ses bort fra. Er de korrekte nok og skal de dermed blive som del af analysen? Nogen gange er ekstremer opstået som følge af registreringsfejl i data, men det bør undersøges hvad der ligger til grund.
Udover outliers er det også vigtigt at se på gennemsnittet relativt set. Gennemsnittet alene er ikke et godt målepunkt. Det er altid interessant at se tallet hold op imod noget andet - Gennemsnittet er 7%, Ja, men hvad var det sidste år? 7% af hvad? spørgsmål som disse er vigtige at overveje.
Gennemsnit er fantastiske formidlere af information på en hurtig og forståelig måde. Men man skal også passe på for gennemsnit vildleder også, fordi de skjuler en fordeling af tal der liggen nedenunder, og hvis ikke man har kendskab til denne talfordeling kan gennemsnittet, især når det står alene, være vildledende.