Innovatie

Big Data en Process Mining: schatgraven in procesgegevens

0

Managementinformatie? Je hebt stapels gegevens over hoe vaak de klant jouw website bezoekt, hoe lang de klant erover doet iets te bestellen, hoeveel tijd de helpdeskmedewerker aan de telefoon hangt en hoe lang een reparatie duurt. Maar wie heeft er een echt zinvol beeld van waarom het zo eigenlijk lang duurde en, nog belangrijker, wat je moet doen om die tijd te verkorten en de klant echt van dienst te zijn. Je wilt toch eigenlijk weten hoe je echt hebt gewerkt?

We barsten van de managementinformatie uit onze ‘data warehouses’. Lekker ‘minen’ in je data-warehouse en je hebt weer de strakste statistiekjes en grafiekjes; ‘how to lie with statistics?’. Een nieuwe trend om managementinformatie te verzamelen is process mining. Wat is process mining en wat biedt het aan nieuwe inzichten?

Process mining

De Indiase student Jagadeesh Chandra Bose van de Technische Universiteit Eindhoven (TU/e) is onlangs gepromoveerd op zijn proefschrift ‘Process Mining in the Large‘. Hij heeft nieuwe mogelijkheden gerealiseerd voor het analyseren van de gigantische logboeken, die complexe systemen tegenwoordig bijhouden over hun handelen.

Computable meldt erover: “Complexe systemen zoals wafersteppers en röntgenapparaten houden in groot detail digitale logboeken bij van alles wat ze doen. Het gaat om tienduizenden stappen per dag, die worden geregistreerd per apparaat. Een apparatenproducent die deze ‘event logs’ van zijn apparaten bijhoudt, komt al snel aan miljoenen events per dag. Analyse achteraf van deze databergen geeft inzicht in hoe de processen precies verlopen, waar fouten optreden of waar verbetermogelijkheden zijn. Het succesvol analyseren van grote event logs is een van de grote uitdagingen van het vakgebied.”

Audit track

Workflowmanagementsystemen, maar ook Enterprise Resource Planning (ERP) en Customer Relationship Management systemen (CRM) pompen werk rond uitgaande van een blauwdruk van het proces. Vaak wijkt die vooraf bedachte blauwdruk in de praktijk af van het feitelijke proces of is het feitelijke proces verre van optimaal. Om dit te doorbreken, is het nodig de zaak om te draaien en uit de feitelijke gebeurtenissen af te leiden wat nu het werkelijke proces is. Het resultaat is veel te late leveringen, onnodige wachtrijen of verlies aan kostbare productiecapaciteit.

Bedrijfsprocessen laten ‘digitale sporen’ na in ICT-systemen. Deze sporen worden audit trails genoemd. Een audit trail is een chronologische opeenvolging van events, die het resultaat zijn van het uitvoeren van onderdelen van het bedrijfsproces. Uit deze audit trails kan waardevolle bedrijfskennis afgeleid worden door naar structuren te zoeken in die achtergelaten sporen. Dat is dus process mining.

Onderzoek

De Technische Universiteit in Eindhoven doet al enkele jaren naar business process mining. Tot op heden werd de informatie, opgesloten in audit trails, nauwelijks gebruikt om bedrijfsprocessen te analyseren. Dat is jammer, omdat je daarmee nuttige informatie laat liggen. Loopt bijvoorbeeld het klantproces ook echt zoals je dat bedacht hebt?

Klik op de afbeelding voor een vergroting

Het onderzoek van Jagadeesh Chandra Bose heeft efficiënte nieuwe algoritmes opgeleverd, die uit de databrij van ‘Big Data’ structuren kunnen extraheren. Hij doet dat onder meer door herkenning van kleine substructuren, zoals een set events die optreedt wanneer iemand een knop induwt op een apparaat. Ook is hij erin geslaagd gelijksoortige processen te herkennen, te groeperen, te vergelijken en om bovenstaande zaken inzichtelijk te visualiseren in diagrammen en heeft hij een manier bedacht om in de data veranderingen in de processen zelf te vinden en om prestatie-indicatoren te koppelen aan de analyse van de big data. Daarmee komt de praktische toepassing van process mining steeds dichterbij.

Event en workflow logs

Process mining kent dus technieken om uit informatie, de enorme hoeveelheid aan big data, die vastligt in ICT-systemen (op basis van event logs of workflow logs) procesmodellen af te leiden. Deze modellen kunnen worden gebruikt om systemen te configureren, processen te verbeteren en afwijkingen tussen het ontworpen proces en de werkelijkheid vast te stellen. Het gaat dan niet alleen om sequentiële processen, maar juist om die processen waarbij parallelle verwerking plaatsvindt. Denk aan de lastige processen bij telecombedrijven als Ziggo en KPN Telecom, ingewikkelde transportnetwerken, complexe onderhoudsprocessen bij Shell, producten configureren bij Dell en complexe dropshipment bij Bol.com.

Het onderzoek van de TU/e is leerzaam. Gooi het data warehouse de deur uit en ga schatgraven in de procesdata. Denk eens na over wat het je oplevert, als je straks precies weet hoe het proces echt is gelopen!