Når man skal igang med process mining, er det en god ide at se på de proceskandidater der er og vælge en proces, der skal mines udfra nogle objektive kriterier.
Hvis det er første gang, der skal igangsættes process mining initiativer, er det en god ide at betragte process mining opgaven som et pilot projekt og vælge en proces ud, udfra følgende 7 kriterier:
- Afgrænset proces
- Understøttet af ét IT system
- Data logget
- Data i høj kvalitet
- Dataudtræk let tilgængeligt
- Værdifuld proces
- Kendte proces udfordringer
Afgrænset proces
Processen skal være afgrænset således, at det er kendt hvad der er starten af processen, og hvad der er slutningen af processen. Desuden skal processen være en selvstændig proces, der kan eksistere på egen hånd. Et eksempel kunne være en indkøbsproces. En indkøbsproces kan eksistere selvstændigt og det er velkendt hvad der er starten og slutningen af processen. IT Governance processen er til gengæld ikke en god kandidat, da den ikke er tilstrækkeligt afgrænset. Det er for eksempel ikke entydigt, hvor den starter eller slutter, desuden er den muligvis ikke afgrænset til kun et forretningsdomæne – er for eksempel Organisational Change Management og Risk Management processerne en del af processen?
Kriteriet for at processen er afgrænset er, at den knytter sig til en enkelt disciplin og at det er åbenlyst, hvad der starter og afslutter processen.
Understøttet af ét IT system
Processen skal være understøttet af et og kun et IT system. Det skal med andre ord være muligt at trække alle data ud fra kun et IT system. Hvis processen er understøttet af flere IT systemer, er det nødvendigt at trække data ud fra flere systemer og flette disse sammen, og det øger kompleksiteten og fejlmulighederne.
Bemærk dog, at processen stadig er understøttet af kun et IT system selvom processen involverer eksterne parter. Man kunne forestille sig følgende proces trin:
- Send faktura til kunde
- Modtag betaling fra kunde
Mellem trin 1 og trin 2 sker der selvfølgelig noget i kundens proces. Det kan for eksempel være, at faktura bliver sendt til godkendelse hvorefter den frigives til betaling og endelig betales. Men disse proces trin hos kunden er irrelevante for processen, og det er derfor tilstrækkeligt at trin 1 og trin 2 er understøttet af et IT system.
Data logget
Data skal være logget. Det vil sige, at procestrinnene skal være stemplet i IT systemet. Der er to faktorer, der afgør i hvor høj grad man kan sige, at data er logget:
- Antallet af procestrin der er logget i IT systemet – er det hele processen eller for eksempel kun 10% af procestrinnene?
- Hvilke informationer er logget om processen – Er procestrin navn + dato + tidspunkt logget eller er det kun dele af de oplysninger der er logget.
Data i høj kvalitet
Data skal være i god kvalitet. Det nytter ikke meget, hvis data er logget, men at det er i en meget dårlig kvalitet. Dårlig kvalitet kan måles på disse tre parametre:
- Mangelfuldhed
- Uens formater
- Pålidelighed
Mangelfuldhed
Med mangelfuldhed menes der manglende data. Det kan være at en bestemt data attribut kun er tilstede i få procent af tilfældene. For eksempel kunne det være at tid/dato stempel mangler i over halvdelen af tilfældene. I sådanne tilfælde kan det blive vanskeligt at foretage process mining på et repræsentativt udsnit af data.
Uens formater
En velkendt problematik er, at dato formater er gemt i forskellige formater i de forskellige IT systemer. For eksempel kan dato være gemt som US formater mm/dd/yyyy og US tidsformat 12.00PM i et system, mens det i et andet IT system er gemt som europæisk format yyyy-mm-dd eller dd.mm.yyyy. Forskellige dato- og tidsformater kan konverteres til at være sammenlignelige, hvis de er logget konsistent, selvom det naturligvis øger kompleksiteten.
Værre er det hvis data ikke er logget konsistent. Hvis der for eksempel i samme IT system er logget dato- og/eller tidsformater med forskellige formater, kan det vise sig at være umuligt at konvertere dem til ensartede pålidelige data.
Pålidelighed
Pålideligheden af data er det springende punkt. Hvis data ikke er tilstrækkeligt pålidelige, kan de ikke bruges til process mining, da man risikerer at drage konklusioner på et forkert grundlag.
Eksempler på upålidelige data kan for eksempel være:
- Status kan være (”Startet”, ”I gang”, ”Afsluttet”). Hvis angivelsen af status er en manuel handling, kan der være risiko for at brugerne glemmer at angive status eller, at nogle altid undlader at sætte status ”Startet” og andre altid først sætter status til ”Afsluttet”. Desuden, hvis det er et fritekst felt, kan nogle måske skrive ”Påbegyndt” i stedet for ”Startet” etc.
- Angivelse af størrelser på tøj kunne være angivet som ”S”, ”M”, ”L” men alt efter om det er en amerikaner, dansker eller franskmand kan det betyde forskellige faktiske størrelser.
- Snyd med KPIer. Hvis brugerne skal angive en status på for eksempel håndteringen af sager, og de bliver målt på hvor hurtigt de bliver løst, kunne de snyde ved at sætte status til en værdi, der sætter målingen på pause – for eksempel ”Venter på kundens svar” selvom det ikke er den rigtige status.
Dataudtræk let tilgængeligt
Det har selvfølgelig en betydning, hvor let tilgængeligt data udtrækket er. Skal der bruges flere uger på at udtrække meningsfulde data fra systemerne med dertilhørende konvertering og datavask, eller kan data udtrækkes let med et simpelt SQL udtryk lavet på få minutter?
Værdifuld proces
Processen, der ønskes analyseret, bør være værdifuld. Jo mere værdi en proces genererer eller jo mere omkostningstung den er og jo oftere den udføres, jo mere interessant er det at behandle den med process mining og analysere den for optimeringsmuligheder.
Det er selvsagt mere interessant at behandle R&D processen end processen for bestilling af mødeforplejning.
Kendte proces udfordringer
Det er en fordel at tilgå process mining analysen med et sæt af hypoteser, der skal efterprøves. Derfor er det en fordel, hvis der kan udvælges en proces, hvor der er kendte udfordringer. Det er bedre at vælge en proces, hvor det for eksempel på forhånd er kendt, at processen er for langsom, at den generer mange fejl eller lignende, i stedet for at vælge en proces, der tilsyneladende fungerer fint, for derefter at undersøge eksplorativt, om der er noget, der skinner i øjnene.
Comments
You can follow this conversation by subscribing to the comment feed for this post.