Big Data: denk groot, begin klein

on september 19, 2016 Financiële dienstverleners, Inspiratiesessie, Publiek Domein, technisch, Transport en logistiek with 0 comments

 

Big Data is een thema dat veel genoemd wordt. We merken dat het in de praktijk veel vragen oproept en er worden vergelijkbare terminologieën door elkaar heen gebruikt. We kunnen ons deze verwarring goed voorstellen. Ondanks dat Big Data een redelijk duidelijke definitie heeft, staat het voor veel mensen synoniem met een nieuw tijdperk, een digitale revolutie. Door Big Data te voorzien van een kader, hoop ik dat organisaties meer gericht op zoek gaan naar nieuwe oplossingen met data & analytics die een positieve business case kennen.

aaeaaqaaaaaaaai1aaaajdc3yzc2ywq2lwvmotatndi3os04zmm1lwnjotbjzgnkzty1oa

Figuur 1. Een datacentrum met servers.

Men spreekt van Big Data als in die data de volgende drie aspecten gelijktijdig voorkomen: grote omvang (volume), veel verscheidenheid (variety) en hoge snelheid (velocity). De bekendste toepassingen van Big Data zien we terugkomen bij Google en Facebook. De financiële kernactiviteit van deze bedrijven is het leveren van op maat gesneden reclame-uitingen op de computer, telefoon en tablet van gebruikers. Aan de hand van de business van Google en Facebook wordt Big Data hiertoegelicht.

Big Data bij Google en Facebook

Google en Facebook zijn, anders dan hun status als technologiereus suggereert, online advertentiebedrijven. Ze halen er 99% van hun omzet mee binnen. Stel iemand wil het laatste nieuws zien en surft naar nu.nl. Nog voordat deze website wordt geladen, gebeurt het volgende. De website van nu.nl haalt het elektronische adres van de gebruiker op (onder andere het IP-adres en het type device zoals tablet, computer, telefoon). Er wordt zoveel mogelijk informatie van de eigenaar gezocht om een profiel samen te stellen: de leeftijd, het geslacht, de bezochte websites, enzovoorts. Op basis daarvan wordt een veiling gestart. Verschillende aanbieders van reclame doen biedingen bij opbod. De hoogste bieder wint en daarvan wordt de reclame getoond. Dit alles gebeurt in enkele tienden van seconden. Dus nogmaals, dit gebeurt allemaal héél snel en vóórdat de website wordt geladen en jij rustig het nieuws wilt bekijken! En natuurlijk niet alleen voor nu.nl, maar alle sites die reclames tonen en voor alle gebruikers die surfen op het web. Voor meer details verwijs ik naar dit artikel van de Correspondent. Daarin staat in meer detail beschreven hoe dit werkt.

Figuur 2. Google campus

Laten we terugkomen op eerdergenoemde aspecten van Big Data. Volume betekent dat onwaarschijnlijk veel data worden opgeslagen op servers. Google beschikt naar verluidt over circa 900.000 servers in de wereld, Facebook over meer dan 600.000. Op deze servers liggen foto’s, likes, video’s van meer dan een miljard mensen vast. Variety betekent dat naast gestructureerde data ook ongestructureerde data zoals teksten en beeldmateriaal wordt opgeslagen. Facebook probeert bijvoorbeeld met gezichtsherkenning en herkenning van logo’s op foto’s te achterhalen wie in welke producten geïnteresseerd is. Google probeert via spraakherkenning gesproken tekst om te zetten in geschreven tekst en met tekstanalyse de kern uit informatie te halen. Velocity betekent dat de data realtime in grote aantallen gegenereerd wordt. Miljarden mensen kijken dagelijks naar hun Facebook tijdlijn en gebruiken de diensten van Google. Al deze data wordt realtime opgeslagen. Juist de combinatie van deze drie maakt dat er sprake is van Big Data en is technisch zeer complex, wat heeft geleid tot allerlei nieuwe technologische technieken.

De technische hoogstandjes rondom Big Data zijn fenomenaal. Big Data vereist een specifieke infrastructuur en veel dure kennis.

Big Data bij de organisaties in Nederland: data is ondersteunend

En hier komt de crux: de meeste Nederlandse organisaties komen volume, variety en velocity niet tegen zoals hierboven beschreven is: het gaat om veel minder data, de data is vaak wel goed gestructureerd en er hoeven geen real-time beslissingen mee te worden genomen.

In tegenstelling tot het voorbeeld van de reclame-veiling, wordt bij de meeste organisaties een operationele beslissing bewust niet alleen aan een computer overgelaten. Het is vaak beter om klanten, leveranciers of medewerkers een paar vragen te stellen alvorens hen iets aan te bieden. Een computer kan immers moeilijk vaststellen wat iemands échte wil is of intenties zijn. Daarbij spelen de volgende punten een rol:

  • Wettelijke eisen, waaronder ook de eisen van vertrouwelijkheid en privacy.
  • Risico op imagoschade, geldende normen en waarden of simpelweg timing.
  • Mogelijkheid tot ingrijpen door een mens, als zich een bijzondere of niet-voorziene situatie voordoet.
  • Noodzaak tot vastlegging van gemaakte keuzes inclusief de staat van informatie op het moment van beslissen zodat verantwoording achteraf mogelijk is.
  • Organisaties “leven” en veranderen en in de loop van de tijd. Met die veranderingen moet de besluitvorming op de juiste manier meebewegen.

 

De vraagstukken die de meeste organisaties in Nederland tegenkomen hebben dus een ander karakter dan Big Data. Ze vragen daarom ook om een andere aanpak en om andere tools. Voor veel vraagstukken kan met MS Excel of MS Access en wat programmeerwerk een prima eerste prototype worden gemaakt. Als de pilot-oplossing succesvol of kansrijk is, kan naar meer geavanceerde tools worden opgeschaald.

Veel organisaties kunnen dus vandaag al beginnen met datagedreven besluitvorming.

 

Add comment

CAPTCHA * Time limit is exhausted. Please reload CAPTCHA.

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.

Decisive Facts
Right Menu Icon