Naar hoofdinhoud gaan

Overzicht

Het uploaden van een cv is de snelste manier om een kandidaat aan Recruitier toe te voegen. Wanneer u een bestand uploadt, leest de AI van het platform het volledige document, extraheert gestructureerde gegevens — naam, functietitel, locatie, vaardigheden met betrouwbaarheidsscores, ervaringsniveau, jaren ervaring, opleiding — en maakt een kandidaatprofiel aan dat u kunt controleren en bevestigen. Het volledige proces, van het uploaden van het bestand tot een volledig ingevuld profiel, duurt doorgaans minder dan 10 seconden. De extractie wordt aangedreven door Gemini 3 Flash Preview, die tot 50.000 tekens cv-tekst (ongeveer 12.500 tokens) in een enkele doorloop verwerkt, waarbij de context over het hele document wordt begrepen in plaats van alleen te scannen op trefwoordlabels.

Ondersteunde bestandsformaten

Recruitier accepteert de volgende cv-bestandsformaten, elk verwerkt door een gespecialiseerde tekstextractie-engine:
FormaatExtensieExtractie-engineOpmerkingen
PDF.pdfPyMuPDF (fitz)Meest gangbare formaat. Werkt met tekstgebaseerde en opgemaakte PDF’s. Extraheert tekst van alle pagina’s met behoud van de leesvolgorde. Met wachtwoord beveiligde PDF’s worden niet ondersteund.
Word-document.docxpython-docxMicrosoft Word-formaat. Tekst wordt geextraheerd uit zowel alinea’s als tabellen, zodat koptekstopmaak waarbij de kandidaatnaam in een tabelcel staat volledig wordt ondersteund.
Platte tekst.txtDirecte uitlezingEenvoudige tekstbestanden. Handig voor het plakken van ruwe cv-inhoud wanneer andere formaten niet beschikbaar zijn.
Gescande PDF’s die alleen afbeeldingen bevatten (geen selecteerbare tekst) kunnen niet worden verwerkt. De tekstextractie-engine heeft daadwerkelijke tekstinhoud in het bestand nodig — OCR (optische tekenherkenning) wordt niet uitgevoerd. Als het cv van een kandidaat een gescand document is, kunt u overwegen hen om een digitale versie te vragen, het te converteren naar een tekstgebaseerde PDF met een OCR-tool, of in plaats daarvan de LinkedIn-importoptie te gebruiken.
Het .doc-formaat (verouderd Word) wordt als ondersteund vermeld, maar .docx heeft sterk de voorkeur. Als u extractieproblemen ondervindt met oudere .doc-bestanden, vraag de kandidaat dan om een .docx- of PDF-versie.

De uploadwizard: stap voor stap

De uploadwizard heeft vier stappen. Na het voltooien van de laatste stap start de AI-vacaturematching automatisch.
1

Stap 1: CV uploaden

Ga naar de sectie Kandidaten en klik op de knop CV uploaden rechtsboven. Er verschijnt een wizarddialoogvenster met twee tabbladen bovenaan: CV uploaden en LinkedIn URL.Om een cv te uploaden, zorg er dan voor dat het tabblad CV uploaden is geselecteerd. U kunt een bestand naar het uploadgebied slepen en neerzetten of klikken om op uw computer te bladeren. De maximale bestandsgrootte is configureerbaar maar is doorgaans ingesteld op 10 MB — ruim voldoende voor elk standaard cv.Zodra het bestand is geupload, verwerkt de AI van Recruitier het automatisch: tekst uit het document extraheren, analyseren met Gemini, de locatie geocoderen en vaardigheden extraheren met betrouwbaarheidsscores. Dit duurt doorgaans minder dan 10 seconden. De wizard gaat vervolgens door naar de volgende stap.
U kunt vanuit dezelfde wizard ook een kandidaat vanuit LinkedIn importeren door over te schakelen naar het tabblad LinkedIn URL. Zie Importeren vanuit LinkedIn voor meer informatie.
2

Stap 2: Profiel controleren

Na de extractie krijgt u de naam en functietitel van de kandidaat ter beoordeling. Beide velden zijn vooraf ingevuld op basis van de AI-extractie, maar volledig bewerkbaar.De wizard controleert op dubbele namen in uw account. Als er al een kandidaat met dezelfde naam bestaat, ontvangt u een melding en kunt u de naam aanpassen voordat u doorgaat.
Neem even de tijd om de naam en functietitel van de kandidaat te verifiëren. Deze velden zijn direct van invloed op de matchingkwaliteit, omdat de functietitel de titelvectorembedding beinvloedt (35% van het semantische zoekgewicht) en de AI helpt het functieniveau en de senioriteit van de kandidaat te begrijpen. Een functietitel als “Senior Python Developer” levert heel andere matchresultaten op dan “Software Engineer”.
3

Stap 3: Vaardigheden controleren

De AI extraheert vaardigheden uit het cv met betrouwbaarheidsscores die aangeven hoe zeker het is over elke vaardigheid. Vaardigheden worden weergegeven als interactieve chips die u kunt in- of uitschakelen. Een kleurgecodeerde betrouwbaarheidsindicator toont hoge (groen), gemiddelde (accentkleur) en lage (rood) betrouwbaarheidsniveaus.In deze fase kunt u:
  • Vaardigheden in- of uitschakelen door erop te klikken (bevestigde vaardigheden tonen een vinkje)
  • Vaardigheden verwijderen door op de X-knop van elke vaardigheidsschip te klikken
  • Ontbrekende vaardigheden toevoegen door in het invoerveld te typen en op Enter te drukken of op de toevoegknop te klikken
Een teller onderaan toont hoeveel vaardigheden zijn geselecteerd van het totaal geextraheerde. U kunt deze stap ook overslaan en direct naar locatie gaan.
Bevestiging van vaardigheden is de kritieke poort voor de matchkwaliteit. Vaardigheden dragen 45% van het vectorzoekgewicht — meer dan enige andere factor. Een investering van 30 seconden in het beoordelen van vaardigheden heeft een groot positief effect op de matchrelevantie.
Zie Vaardigheden en expertise voor een gedetailleerde handleiding over het effectief beheren van vaardigheden.
4

Stap 4: Locatie instellen

Configureer de locatie en zoekradius van de kandidaat:
  • Locatie met automatisch aanvullen voor precieze geocodeerde coordinaten (breedte-/lengtegraad). Begin met typen om suggesties te zien.
  • Zoekradius-schuifregelaar in kilometers (standaard 40 km, instelbaar van 5 km tot 200 km)
Zodra u op Matching starten klikt, is de wizard voltooid en wordt u doorgestuurd naar de kandidaatdetailpagina. AI-vacaturematching start automatisch op de achtergrond. Een realtime voortgangsindicator op de kandidaatpagina toont elke matchingfase terwijl deze wordt uitgevoerd (Analyseren, Zoeken, Verwerken, Scoren). U hoeft niet te wachten — u kunt doorwerken terwijl de matching op de achtergrond verloopt.
Aanvullende voorkeuren zoals salarisverwachtingen, functietype en flexibiliteit kunnen later worden geconfigureerd via het profielbewerkinsdialoogvenster van de kandidaat. De wizard richt zich op de essentiële velden die nodig zijn om matching te starten.
Zie Locatie en voorkeuren voor details over elke instelling en hoe deze matching beinvloeden.

Wat er achter de schermen gebeurt

Wanneer een cv wordt geupload, wordt de volgende verwerkingsketen in volgorde uitgevoerd:
1

Tekstextractie

Het bestand wordt geparsed met behulp van de juiste bibliotheek:
  • PDF: PyMuPDF (fitz) extraheert tekst van alle pagina’s, bewaart de leesvolgorde en verwerkt meerkolomsindelingen
  • DOCX: python-docx extraheert tekst uit zowel paragraph-elementen als table-cellen, zodat cv-indelingen met op tabellen gebaseerde kopteksten volledig worden vastgelegd
  • TXT: Directe bestandsuitlezing met detectie van de codering
Tekstextractie uit tabellen is bijzonder belangrijk voor Word-documenten. Veel professionele cv-sjablonen plaatsen de naam, contactgegevens en essentiële informatie van de kandidaat in tabelcellen die het koptekstgebied vormen. Zonder tabelextractie zouden deze cruciale gegevens verloren gaan.
2

AI-profielextractie

De geextraheerde tekst (indien nodig afgekapt tot 50.000 tekens) wordt samen met een gestructureerde extractieprompt naar Gemini 3 Flash Preview gestuurd. De prompt instrueert de AI om gegevens te identificeren en te retourneren in een specifiek JSON-formaat dat alle ondersteunde velden omvat.De AI gebruikt contextueel begrip om gegevens te extraheren die verder gaan dan eenvoudige patroonherkenning:
  • Een vermelding van “5 jaar leiding geven aan ontwikkelteams” informeert zowel de berekening van jaren ervaring als de toewijzing van het ervaringsniveau
  • Een certificering zoals “AWS Certified Solutions Architect” wordt vastgelegd als zowel een vaardigheid als opleidings-/certificeringsgegevens
  • Locatiestrings zoals “regio Amsterdam” of “Randstad” worden herkend als geografische verwijzingen
3

Vaardigheidsextractie met betrouwbaarheid

De AI identificeert vaardigheden door het hele cv en kent aan elke vaardigheid een betrouwbaarheidsscore toe tussen 0 en 1. De score weerspiegelt hoe expliciet en prominent de vaardigheid verschijnt:
  • Een vaardigheid die in een speciale sectie “Vaardigheden” met nadruk wordt vermeld, krijgt 0,95+
  • Een vaardigheid die in de context van een functiebeschrijving wordt vermeld, krijgt 0,75-0,89
  • Een vaardigheid die wordt afgeleid van een gerelateerde technologie of functie krijgt 0,60-0,74
4

Vaardigheidsnormalisatie

Geextraheerde vaardigheden worden toegewezen aan canonieke vormen met behulp van de SKILL_ALIASES-taxonomie. Deze taxonomie bevat meer dan 1.000 toewijzingen van gangbare variaties naar gestandaardiseerde vaardigheidsnamen:
  • “JS”, “Javascript”, “JavaScript”, “JavaScript Programming” worden allemaal toegewezen aan “javascript”
  • “React.js”, “ReactJS”, “React” worden allemaal toegewezen aan “react”
  • “Amazon Web Services”, “AWS” worden beiden toegewezen aan “aws”
  • “PostgreSQL”, “Postgres”, “psql” worden allemaal toegewezen aan “postgresql”
Deze normalisatie voorkomt dubbele vaardigheden en zorgt ervoor dat matching correct werkt, ongeacht hoe een vaardigheid in het cv is geschreven versus hoe deze in vacatures verschijnt. Het onderzoek dat aan deze aanpak ten grondslag ligt (IBM AAAI) toonde een verbetering van 29% in Mean Reciprocal Rank bij gebruik van vaardigheidstaxonomienormalisatie.
5

Locatiegeocodering

Als er een locatiestring in het cv wordt gevonden, wordt deze geocodeerd via een meerstappenproces:
  1. Controle in de Nederlandse stedenlijst — De locatie wordt eerst vergeleken met een uitgebreide lijst van Nederlandse steden voor snelle, nauwkeurige resolutie
  2. Fallback naar Nominatim API — Als de locatie niet in de Nederlandse database wordt gevonden, wordt deze naar de Nominatim-geocodeer-API gestuurd
  3. AI-normalisatie — Voor onduidelijke of niet-standaard locatiestrings wordt AI-gebaseerde normalisatie gebruikt om de locatie op te lossen
Het geocodeerresultaat omvat breedegraad, lengtegraad en een genormaliseerde locatieweergavenaam. Deze coordinaten zijn essentieel voor de afstandsgebaseerde scoring in de matchingpipeline.
6

Profiel aanmaken en opschonen

Het kandidaatprofiel wordt in de database aangemaakt met alle geextraheerde gegevens. Voordat het profiel wordt aangemaakt, worden eventueel eerder verlaten onvolledige kandidaatprofielen (van onderbroken uploadwizards) automatisch opgeschoond.Het originele cv-bestand wordt als binaire bijlage naast het kandidaatprofiel opgeslagen, zodat u het op elk moment kunt downloaden vanaf de kandidaatdetailpagina.
Het originele cv-bestand wordt naast het kandidaatprofiel opgeslagen in de database als een binair veld (LargeBinary). U kunt het op elk moment downloaden vanaf de kandidaatdetailpagina in het originele formaat (PDF, DOCX of TXT).

Omgaan met randgevallen

Als de geextraheerde tekst minder dan 50 tekens bevat, geeft het systeem een fout. Dit duidt doorgaans op:
  • Een gescande PDF zonder OCR (alleen afbeeldingsinhoud)
  • Een beschadigd bestand
  • Een bestand dat eigenlijk geen cv is (bijv. een leeg sjabloon)
Oplossing: Probeer het bestand naar een ander formaat te converteren, sla de PDF opnieuw op vanuit de oorspronkelijke toepassing of vraag de kandidaat om een tekstgebaseerde versie. Als het cv van de kandidaat daadwerkelijk een gescand document is, gebruik dan in plaats daarvan de LinkedIn-importoptie.
De naam van de kandidaat is het enige strikt vereiste veld. Als de AI geen naam kan bepalen uit de cv-inhoud, mislukt de upload met een toelichting. Dit kan voorkomen bij:
  • Sterk opgemaakte cv’s waarbij de naam is ingesloten in een afbeelding
  • Cv’s in niet-standaard indelingen waarbij de naam niet prominent is geplaatst
  • Geanonimiseerde cv’s waarbij de naam opzettelijk is verwijderd
Oplossing: Als de naamextractie mislukt, kunt u proberen het bestand in een ander formaat opnieuw te uploaden, of de naam van de kandidaat handmatig invoeren als het platform dat ondersteunt.
Recruitier controleert op dubbele kandidaatnamen binnen uw account. Als u al een kandidaat met dezelfde naam heeft, ontvangt u een conflictmelding.Oplossing: Hernoem de nieuwe kandidaat met een onderscheidend detail (bijv. “Jan de Vries (Amsterdam)” vs. “Jan de Vries (Rotterdam)”), of werk het bestaande profiel bij met de nieuwe cv-gegevens.
Bestanden die de maximale grootte overschrijden (doorgaans 10 MB) worden afgewezen voordat de verwerking begint. Standaard cv’s vallen ruim binnen deze limiet, maar cv’s met ingesloten hoge-resolutieafbeeldingen, portfoliosamples of ingesloten video’s kunnen deze overschrijden.Oplossing: Verwijder grote afbeeldingen of ingesloten media voordat u uploadt. Noteer voor kandidaten met een portfoliorijk cv de portfoliosectie in de kandidaatsamenvatting in plaats van deze in te sluiten.
Hoewel de AI een breed scala aan cv-formaten verwerkt, kunnen extreem creatieve indelingen (infographics, sterk ontworpen PDF’s met niet-standaard tekstflow) leiden tot extractions van mindere kwaliteit. De tekstextractie volgt de leesvolgorde van het document, wat in sterk ontworpen PDF’s mogelijk niet overeenkomt met de visuele indeling.Oplossing: Als een creatief cv slechte extractieresultaten oplevert, vraag de kandidaat dan om een versie in platte tekst of standaard Word-formaat. U kunt het creatieve cv altijd opslaan als referentie terwijl u de standaardversie voor AI-extractie gebruikt.
Accounts met een gratis abonnement zijn beperkt tot 3 actieve kandidaten. Als u deze limiet al heeft bereikt, wordt de upload geblokkeerd totdat u upgradet naar een betaald abonnement (Pro of Agency) of bestaande kandidaten deactiveert.Oplossing: Upgrade naar Pro of Agency voor onbeperkte kandidaten, of verwijder kandidaten waarmee u niet meer actief werkt.

Tips voor de beste resultaten

Gebruik tekstgebaseerde PDF's

Cv’s die rechtstreeks zijn geexporteerd vanuit Word, Google Docs of een teksteditor leveren de beste extractieresultaten. De AI kan de volledige inhoud analyseren en gegevens met hoge betrouwbaarheid extraheren. Gescande documenten met alleen afbeeldingsinhoud kunnen helemaal niet worden verwerkt.

Standaardindelingen werken het beste

Hoewel de AI een breed scala aan formaten verwerkt, leveren traditionele cv-indelingen met duidelijke sectiekoppen (Ervaring, Opleiding, Vaardigheden) de meest nauwkeurige extracties. De AI kan vaardigheden uit elk deel van het cv identificeren, maar duidelijk gelabelde secties verhogen de betrouwbaarheidsscores.

Beoordeel vaardigheden altijd

De AI is goed maar niet perfect. Een snelle beoordeling van 30 seconden van geextraheerde vaardigheden zorgt ervoor dat uw kandidaat wordt gematcht met de juiste kansen. Omdat vaardigheden 45% van het vectorzoekgewicht dragen, heeft deze kleine investering een buitenproportioneel groot effect op de matchkwaliteit.

Verifieer functietitel en ervaringsniveau

De functietitel van de kandidaat beinvloedt de titelvector (35% van het zoekgewicht) en het ervaringsniveau is van invloed op welke vacatures worden weergegeven. Het nauwkeurig instellen van deze gegevens is de op een na hoogst prioritaire actie na het bevestigen van vaardigheden.

Geavanceerd

De volledige extractiepipeline in detail

De cv-uploadpipeline is een zorgvuldig georkestreerde reeks die snelheid en grondigheid in balans brengt. Dit is wat er op elke laag gebeurt: Bestandsverwerkingslaag: Het systeem identificeert eerst het bestandstype op extensie en stuurt het naar de juiste extractie-engine. Voor PDF’s verwerkt PyMuPDF elke pagina opeenvolgend, extraheert tekstblokken en herordent deze in leesvolgorde. Voor DOCX-bestanden itereert python-docx door zowel alinea-elementen als tabelcellen — deze dubbele iteratie is cruciaal omdat veel professionele cv-sjablonen tabellen gebruiken voor de indeling, waarbij de naam en contactgegevens van de kandidaat in tabelkoppen worden geplaatst. AI-verwerkingslaag: De geextraheerde tekst wordt naar Gemini 3 Flash Preview gestuurd met een zorgvuldig ontwikkelde prompt die de exacte JSON-structuur specificeert die als retourwaarde wordt verwacht. De prompt bevat instructies voor het omgaan met randgevallen zoals:
  • Meerdere namen (kies de meest prominente)
  • Meerdere locaties (geef de voorkeur aan de huidige/meest recente)
  • Onduidelijke ervaringsniveaus (gebruik de heuristiek voor jaren ervaring: 0-2=junior, 3-5=medior, 6-10=senior, 11+=lead)
  • Vaardigheden vermeld in verschillende talen (normaliseer naar Engelstalige canonieke vormen)
Nabewerking: Nadat de AI gestructureerde gegevens retourneert, worden diverse normalisatiestappen uitgevoerd:
  1. Vaardigheden worden genormaliseerd via de SKILL_ALIASES-taxonomie (1.000+ toewijzingen)
  2. Locatie wordt geocodeerd via de GeocodingService (Nederlandse stedenlijst, Nominatim API, AI-normalisatie)
  3. Ervaringsniveau wordt gevalideerd aan de hand van jaren ervaring
  4. Dubbele of bijna-dubbele vaardigheden worden verwijderd

Hoe cv-tekst later wordt gebruikt bij matching

De cv-tekst die op het kandidaatprofiel is opgeslagen, dient niet alleen voor weergave. Het speelt een actieve rol in de matchingpipeline:
  • Genereren van embeddings: De cv-tekst (samen met de functietitel en vaardigheden van de kandidaat) wordt gebruikt om de Ervaringsvector te genereren — een van de drie vectoren die worden gebruikt voor semantisch zoeken. Deze vector legt bredere professionele context, domeinkennis en werkstijl vast die vaardigheden en functietitels alleen niet kunnen vertegenwoordigen.
  • AI-scoring: Tijdens fase 5 van de matchingpipeline worden tot 8.000 tekens cv-tekst naar de AI gestuurd naast de beschrijving van elke gematchte vacature (tot 6.000 tekens). De AI gebruikt dit om functiefit, vaardigheidsfit, ervaringsfit en secundaire fit te evalueren met specifiek bewijs uit het cv.
De limiet van 50.000 tekens voor cv-tekstopslag is ruim genoeg voor elk standaard cv (de meeste cv’s zijn 2.000-5.000 tekens). Voor AI-scoring worden echter alleen de eerste 8.000 tekens gebruikt. Dit betekent dat de meest belangrijke informatie vroeg in het cv moet staan. Gelukkig volgen de meeste cv’s al deze conventie, met naam, functietitel, samenvatting en recente ervaring die als eerste verschijnen.

Verbinding met andere functies

  • Vaardighedenstroom: Vaardigheden die tijdens cv-upload worden geextraheerd, vloeien direct door naar de workflow voor vaardigheidsbevestiging. Eenmaal bevestigd, sturen ze de Vaardigheidsvector aan (45% gewicht) bij matching.
  • Locatiestroom: De geocodeerde locatie vloeit door naar het systeem voor Locatie en voorkeuren. Als de kandidaat een specifiek adres opgeeft, kan dit later worden verfijnd met de Google Maps-keuzelijst met automatisch aanvullen.
  • LinkedIn-verrijking: Als u later een LinkedIn-URL toevoegt aan een via cv geuploadde kandidaat, kan het systeem het profiel aanvullen met aanvullende gegevens. Een nieuwe import overschrijft echter geen cv-geextraheerde gegevens — het is een aanvulling.
  • Cv opnieuw uploaden: U kunt het cv van een kandidaat bijwerken door een nieuw bestand te uploaden. Dit start herextractie en kan vaardigheden, functietitel en andere velden bijwerken. Als vaardigheden zijn gewijzigd, detecteert het systeem dit en kan het hermatching activeren.

Tips voor gevorderde gebruikers

Verwerk cv’s in batches. Hoewel u niet meerdere cv’s tegelijkertijd kunt uploaden, kunt u uw workflow optimaliseren door een cv te uploaden, snel de naam en functietitel te bevestigen (sla andere velden voor nu over), meteen vaardigheden te bevestigen, basislocatievoorkeuren in te stellen en dan door te gaan naar de volgende kandidaat terwijl de matching op de achtergrond wordt uitgevoerd. Keer later terug om individuele profielen te verfijnen.
Gebruik het samenvattingsveld strategisch. De AI extraheert de eigen professionele samenvatting van de kandidaat, maar u kunt dit veld bewerken om recruitercontext toe te voegen: “Zoekt alleen senior backend-functies, beschikbaar vanaf maart 2026, geeft de voorkeur aan scale-ups boven grote ondernemingen.” Deze context helpt u kandidaatvoorkeuren te onthouden die de AI niet uit het cv kan afleiden.
Voor meertalige cv’s verwerkt de AI Nederlandse, Engelse en Duitse cv’s goed. Vaardigheden worden echter altijd genormaliseerd naar Engelse canonieke vormen. Als een cv in het Nederlands is en “Projectmanagement” vermeldt, wordt dit genormaliseerd naar “project management” in de vaardighedenlijst.

Gerelateerd