DATA & AIARTIFICIAL INTELLIGENCEDATA MANAGEMENTMACHINE LEARNINGDATA
31/07/2019 • Stijn Van den Enden

Is jouw data klaar voor Artificial Intelligence?

Je bedrijf wordt in de nabije toekomst dankzij Artificial Intelligence (AI) naar het volgende niveau getild. Dit levert voordelen op voor productiviteit, gebruik van resources, onderhoudbaarheid, verbeterde personeelsbezetting en nog veel meer. Om dat te bereiken, moet je echter eerst data verzamelen en voldoende voorbeelden aanleveren om je AI-algoritmes te trainen. Ongeacht of je bedrijf actief is in de financiële of de medische sector, of zich bezighoudt met opslag of afvalverwerking, elk bedrijf heeft een gemeenschappelijke noemer: er is al een stroom van data binnen de organisatie.

Deze blog wil je bewustmaken van het belang van datainzameling als opmaat naar Artificial Intelligence. Je kunt alleen profiteren van de positieve kansen die de huidige wereld biedt en betere zakelijke beslissingen nemen als data zichtbaar en nauwkeurig zijn, worden aangevuld met externe data en representatief zijn voor jouw doelgroep.

Grafiek die de jaarlijkse omvang van de Global Datasphere weergeeft

Wat is Artificial Intelligence?

Artificial Intelligence (AI) is simpel gezegd de nabootsing van menselijke intelligentie door een machine. Het stelt programma's in andere woorden in staat om menselijke beslissingen en afwegingen te maken. Een bekend subdomein van Artificial Intelligence is Machine Learning. In plaats van expliciet regels te programmeren, maken Machine Learning-applicaties gebruik van voorbeelden om patronen te ontdekken en te 'leren' hoe dingen werken.

Maak je data zichtbaar

Toegankelijke data kunnen nuttig worden toegepast. Er is vast wel iemand die weet hoeveel mensen er in je bedrijf werken, hoe groot de voorraad is, hoeveel goederen er de afgelopen maanden zijn verplaatst, en hoe je fabriek presteert op het gebied van efficiëntie en productiviteit. Maar wat gebeurt er na het inzamelen met deze data? Een mooie presentatie op het bord? Worden deze cijfers ergens in de cloud opgeslagen? Of zijn ze beschikbaar in een centrale database? Of erger nog, worden ze opgeslagen in een Excel-bestand dat op een of andere privé-drive stof ligt te verzamelen?

Data worden opgeslagen in informatiesilo's

In veel bedrijven heeft slechts een beperkt aantal mensen toegang tot bepaalde assets. Dit betekent dat data worden geïsoleerd van de rest van de organisatie, in zogenaamde informatiesilo's. Dit zorgt niet alleen voor wantrouwen binnen de organisatie, het team of de applicatie die de gegevens verwerkt wordt hierdoor ook beperkt. Teams kunnen gegevens op uiteenlopende wijze interpreteren, of overeenkomsten tussen functies blijven verborgen doordat gegevens over diverse silo's worden verdeeld.

Het levert een groot voordeel op als data standaard algemeen beschikbaar zijn. Je kunt niet alleen vertrouwen op de betrouwbaarheid van de bron, je kunt ook een minimale kwaliteit en volledigheid garanderen. Begin vandaag nog met het opbouwen van een bedrijf dat draait om data die op uniforme wijze worden verzameld en je Artificial Intelligence plukt er morgen de vruchten van.

Leg niet alleen JOUW data vast

Het voorspellen van de toekomst biedt geen garanties, maar je kunt verrassingen voorkomen door externe factoren mee te wegen. Een hogere olieprijs kan bijvoorbeeld een positief effect hebben op de verkoop van elektrische voertuigen. Als het beleid van de overheid wordt aangepast dan kan het tegenovergestelde het geval zijn. Je personeel heeft bij een hittegolf wellicht vaker behoefte aan pauzes en dit heeft gevolgen voor hun productiviteit. Zelfs het vastleggen van data over bedrijfsinitiatieven kan voordelig uitpakken: marketingcampagnes leveren (hopelijk) meer inzichten op over de organisatie en mogelijke oplossingen en dit heeft een positief effect op de omzet.

Dat is waarom je de cijfers van je organisatie moet opslaan samen met externe feiten en data die van invloed zijn op de processen die van betekenis zijn voor je bedrijf.

een machine learning algoritme

Machine Learning-algoritmes kunnen deze extra parameters eenvoudig benutten om overeenkomsten te ontdekken tussen diverse sets met data. Er kan onderscheid worden gemaakt tussen seizoenseffecten, de effecten van klimatologische omstandigheden en een omzet die over het geheel genomen groeit.

Het is belangrijk om beslissingen over bedrijfsgegevens te centraliseren, maar externe gegevens zijn minstens zo belangrijk: de wereld om ons heen is voortdurend in beweging. Wees bereid om VEEL gegevens te verzamelen.

Kijk uit voor data met een bias in

volledige weergave van uw voorraad of klantenbestand is essentieel voor de impact van data-analyse

Er zijn talloze voorbeelden waarbij tijdens dataverwerking onterecht het belang van een bepaalde inputfunctie is overschat. Een compleet overzicht van je inventaris of klantenbestand is van groot belang voor het effect van gegevensanalyse. Normalisatie van input kan bovendien voorkomen dat je model zich ooit bewust wordt van ongewenste kenmerken. Een neuraal netwerk dat werd ontwikkeld om huidkanker te identificeren, ontdekte bij het analyseren van foto’s een verband met de aanwezigheid van een liniaal in de nabijheid van een tumor. In een poging om wolven en husky's te classificeren, selecteerden wetenschappers bewust afbeeldingen met een bepaalde achtergrond om hun algoritme te trainen. Waarna het algoritme husky’s zonder sneeuw op de achtergrond niet als husky kon herkennen. Hieruit kan worden geconcludeerd dat data met een bias in een onnauwkeurig Machine Learning-model opleveren. Dit is een probleem waarmee ook ervaren datawetenschappers worden geconfronteerd. Geen wonder dat experts zeggen dat ze meer tijd kwijt zijn aan het voorbereiden van data dan aan het ontwerpen en trainen van modellen ...

Het is logischer om je zorgen te maken over gegevens en je minder druk te maken over welk algoritme je moet toepassen.

– Artificial Intelligence: A Modern Approach (S. Russell en P. Norvig)

Verzamelde data zijn weliswaar bijzonder waardevol voor je bedrijf, maar je hebt ze vast niet verzameld om ze te gebruiken voor AI-applicaties. De kans is dan ook groot dat de data verstorende functies bevatten die het leerproces beïnvloeden.

Het is essentieel om voortaan je data verzameling te beoordelen en monitoren als voorbereiding voor gebruik in AI-applicaties.

Raket Takeaway

Steeds meer bedrijven kiezen voor een datagestuurde aanpak om te profiteren van een concurrentievoordeel. Het is belangrijk om hoogwaardige data te verzamelen om inzicht te krijgen in hoe bepaalde aspecten je productiviteit beïnvloeden. Je kunt zakelijke beslissingen ondersteunen met betrouwbare resources en een geschikte applicatie die nuttige patronen inzichtelijk maakt.

Het verzamelen van data is niet langer het lastigste onderdeel. Er zijn voldoende tools die je daarmee uitstekend kunnen helpen. De echte uitdaging is het structureren en vastleggen van de juiste data. Het is geen eenvoudige taak om een oplossing te vinden die voor jouw specifieke doel geschikt is. Je kunt echter beginnen met het opzetten van een database of een dataopslag. Bedenk ondertussen hoe je de data wilt structureren en toepassen. Klik hier en neem contact met ons op als je hulp nodig hebt of een vraag wilt stellen!

Ga hier vandaag nog mee aan de slag, want het vereist tijd en oefening om dit te realiseren. Bereid je bedrijf voor op een datagestuurde cultuur en verdiep je in Machine Learning om optimaal te profiteren van je data.

Stijn Van den Enden