Een robot die factsheets maakt - hoe werkt het?
Belangrijkste inzichten
- Vorige week lanceerden wij ons nieuwste product: een robot die op ieder gewenst moment de meest recente data over de arbeidsmarkt, het onderwijs, en andere thema's ophaalt, visualiseert, beschrijft en verwerkt in een handige factsheet.
- Wat wij een "robot" noemen, is een algoritme (een reeks code in programmeertaal) waar de computer doorheen wordt geloodst.
- Om de infrastructuur van deze code, het ophalen en verwerken van de data, en het vormgeven van de factsheet mogelijk te maken, wordt de techniek van drie programmeertalen met elkaar gecombineerd: GO, R en LaTeX, respectievelijk.
- Het bouwen van deze robot is gebeurd in een samenwerking tussen software developers, data scientisten en arbeidsmarktexperts.
- Ga naar arbeidsmarktinzicht.nl/content/data, selecteer je gemeente, en ontvang 28 pagina's aan data en informatie over jouw gemeente!
Wie is die robot?
WAT DOET DE ROBOT?
De robot is speciaal gebouwd voor gemeenteambtenaren, maar kan (gratis) worden gebruikt door iedereen die geïnteresseerd is in uitgebreide informatie over thema's zoals coronacrisis, arbeidsmarkt, onderwijs, etc. De robot is uniek, want het kan op ieder gewenst moment door iedereen aan het werk gezet worden. Het gaat dan meteen de meest recente data van de gemeente ophalen, er grafieken van maken, er teksten over schrijven, en het in een mooie factsheet gieten. De robot kan dit voor bijna alle -bij arbeidsmarktinzicht aangesloten- gemeenten doen. De waddeneilanden Ameland, Schiermonnikoog en Vlieland zijn helaas nog een uitzondering. Door het lage inwoneraantal ontbreekt er dusdanig veel data dat de robot er niet mee vooruit kan. Om de robot zelf aan het werk te zetten, ga naar arbeidsmarktinzicht.nl/content/data, selecteer je gemeente, en ontvang 28 pagina's aan data en informatie over jouw gemeente.
Hoe bepaalt de robot wat er in de factsheet te zien is?
De robot is met veel zorg in elkaar gezet door een samenwerking tussen software developers, data scientisten en arbeidsmarktexperts. Waar de software developers over de technische infrastructuur gaan, en de data scientisten over de verwerking van de data, waren de arbeidsmarktexperts verantwoordelijk voor de inhoud van de factsheet. Zij hebben ook contact gehad met een klein groepje gemeenteambtenaren, om erachter te komen welke informatie precies relevant is voor de doelgroep. De inhoud is dus met veel zorg samengesteld door (menselijke) experts, en niet door de robot zelf.
HOE WERKT DE ROBOT?
Onze "robot" is geen metalen apparaat die door ons kantoorpand huppelt, maar een algoritme. Een algoritme is een reeks aan code in programmeertaal, waar de computer doorheen wordt geleid. Wij gebruiken de term "robot", omdat deze meer tot de verbeelding spreekt dan woorden als "algoritme", "code" of "script". Voor de mensen die geïnteresseerd zijn in de technische aspecten, zullen we wat dieper in gaan op de techniek van dit algoritme. De techniek bestaat uit verschillende onderdelen:
- Een Docker. Dit is een stukje server, een soort virtuele kamer, waar alle stukjes code en de informatie die de code nodig heeft bij elkaar worden gezet. Op het moment dat je een factsheet aanvraagt, wordt allereerst zo'n kamer ingericht. Zo heeft de robot direct alles ter beschikking en kan het meteen aan de slag.
- Data science functies. Dit is een script, ofwel een stukje software, die de meest recente data van onze databronnen (CBS, UWV, Textkernel, Etil, etc.) ophaalt, de relevante informatie eruit haalt en de data visualiseert in grafieken. Dit onderdeel is geschreven in de programmeertaal R, waarbij gebruikt wordt gemaakt van de package ggplot2.
- Natural Language Generation (NLG) functies. Dit is een script, ofwel een stukje software, waarin alle instructies en regels voor de computer staan die van data taal maken. De functies variëren van relatief eenvoudig tot relatief complex. Je kunt hier bijvoorbeeld denken aan een functie die van de data afleest of een datapunt (bijvoorbeeld, het aantal WW-uitkeringen) hoger of lager is dan hetzelfde datapunt van een jaar eerder. Een complexere functie is bijvoorbeeld een functie die kijkt of de verandering wel relevant is voor de lezer: een toename van 0.005% wordt niet gekenmerkt als "is toegenomen", maar wordt beschreven als: "is vergelijkbaar met". Naast functies die naar de data kijken en hier beschrijvingen bij zoeken, zijn er ook functies die puur kijken naar spelling en grammatica. Zo is er bijvoorbeeld een functie om te kijken of het lidwoord van een woord "de" of "het" is, en een functie die een grammaticaal correcte opsomming maakt. Alle NLG functies zijn geschreven in de programmeertaal R.
- Documentpreparatiesysteem. Dit is een script, ofwel een stukje software, die beschrijft hoe het document (in dit geval een PDF) eruit moet komen te zien. Elk herhalend element (bijvoorbeeld het blokje "thema" bovenaan iedere pagina) hoeft maar één keer te worden beschreven. Vervolgens kan steeds, bijvoorbeeld bij iedere pagina, deze beschrijving worden aangeroepen. Voor dit onderdeel wordt gebruik gemaakt van LaTeX, dat gebaseerd is op de programmeertaal TeX. Omdat bij de vormgeving van het document zowel de paginaonderdelen (LaTeX), als ook de grafieken en tekst (R) met elkaar moeten worden geïntegreerd, wordt gebruik gemaakt van R Markdown. Met deze techniek kunnen alle verzamelde onderdelen tot één document worden "gebreid" ("knit" is de term die wordt gebruikt in R Markdown).
Doordat alles in de code opgebouwd is uit bouwblokken, kan relatief snel en eenvoudig een nieuwe robot in elkaar worden gezet, die een soortgelijke factsheet maakt over compleet andere informatie, of voor een andere doelgroep. Binnenkort lanceren wij alweer de tweede robot, die een factsheet maakt over flexwerkers in gemeenten.
IS DE ROBOT INTELLIGENT?
De huidige versie van de robot verricht complexe werkzaamheden, maar heeft geen intelligentie. Er zit geen vorm van machine learning of artificial intelligence in. De techniek wordt echter continu doorontwikkeld, en zal op den duur mogelijk zelflerend worden, en daarmee intelligent.
HOE KAN IK MEER TE WETEN KOMEN OVER DE ROBOT?
Er zijn een aantal manieren om meer informatie te krijgen over dit product:
- Voor meer informatie over de inhoud van het product, lees dit (korte) artikel: https://arbeidsmarktinzicht.nl/beter-zicht-op-arbeidsmarktinformatie-voor-nederlandse-gemeenten.
- Bij vragen of opmerkingen over het product, stuur een e-mail naar arbeidsmarktinzicht@etil.nl.
- Heb je een vraag over de techniek? Stuur dan een e-mail naar s.goffin@etil.nl.
- Wil je meer weten over de dienstverlening van Etil Research Group, ArbeidsmarktInZicht en/of GemeentenInZicht? Neem dan vrijblijvend contact op met Marcel Wijngaard (Senior Adviseur): m.wijngaard@etil.nl.
- Wil je weten hoe een factsheet eruit ziet? Zie de onderstaande afbeelding. Beter nog: zet zelf de robot aan het werk! Ga naar arbeidsmarktinzicht.nl/content/data, selecteer je gemeente en klik op "Download Factsheet".