Overzicht
Het uploaden van een cv is de snelste manier om een kandidaat aan Recruitier toe te voegen. Wanneer u een bestand uploadt, leest de AI van het platform het volledige document, extraheert gestructureerde gegevens — naam, functietitel, locatie, vaardigheden met betrouwbaarheidsscores, ervaringsniveau, jaren ervaring, opleiding — en maakt een kandidaatprofiel aan dat u kunt controleren en bevestigen. Het volledige proces, van het uploaden van het bestand tot een volledig ingevuld profiel, duurt doorgaans minder dan 10 seconden. De extractie wordt aangedreven door Gemini 3 Flash Preview, die tot 50.000 tekens cv-tekst (ongeveer 12.500 tokens) in een enkele doorloop verwerkt, waarbij de context over het hele document wordt begrepen in plaats van alleen te scannen op trefwoordlabels.Ondersteunde bestandsformaten
Recruitier accepteert de volgende cv-bestandsformaten, elk verwerkt door een gespecialiseerde tekstextractie-engine:| Formaat | Extensie | Extractie-engine | Opmerkingen |
|---|---|---|---|
.pdf | PyMuPDF (fitz) | Meest gangbare formaat. Werkt met tekstgebaseerde en opgemaakte PDF’s. Extraheert tekst van alle pagina’s met behoud van de leesvolgorde. Met wachtwoord beveiligde PDF’s worden niet ondersteund. | |
| Word-document | .docx | python-docx | Microsoft Word-formaat. Tekst wordt geextraheerd uit zowel alinea’s als tabellen, zodat koptekstopmaak waarbij de kandidaatnaam in een tabelcel staat volledig wordt ondersteund. |
| Platte tekst | .txt | Directe uitlezing | Eenvoudige tekstbestanden. Handig voor het plakken van ruwe cv-inhoud wanneer andere formaten niet beschikbaar zijn. |
Het
.doc-formaat (verouderd Word) wordt als ondersteund vermeld, maar .docx heeft sterk de voorkeur. Als u extractieproblemen ondervindt met oudere .doc-bestanden, vraag de kandidaat dan om een .docx- of PDF-versie.De uploadwizard: stap voor stap
De uploadwizard heeft vier stappen. Na het voltooien van de laatste stap start de AI-vacaturematching automatisch.Stap 1: CV uploaden
Ga naar de sectie Kandidaten en klik op de knop CV uploaden rechtsboven. Er verschijnt een wizarddialoogvenster met twee tabbladen bovenaan: CV uploaden en LinkedIn URL.Om een cv te uploaden, zorg er dan voor dat het tabblad CV uploaden is geselecteerd. U kunt een bestand naar het uploadgebied slepen en neerzetten of klikken om op uw computer te bladeren. De maximale bestandsgrootte is configureerbaar maar is doorgaans ingesteld op 10 MB — ruim voldoende voor elk standaard cv.Zodra het bestand is geupload, verwerkt de AI van Recruitier het automatisch: tekst uit het document extraheren, analyseren met Gemini, de locatie geocoderen en vaardigheden extraheren met betrouwbaarheidsscores. Dit duurt doorgaans minder dan 10 seconden. De wizard gaat vervolgens door naar de volgende stap.
Stap 2: Profiel controleren
Na de extractie krijgt u de naam en functietitel van de kandidaat ter beoordeling. Beide velden zijn vooraf ingevuld op basis van de AI-extractie, maar volledig bewerkbaar.De wizard controleert op dubbele namen in uw account. Als er al een kandidaat met dezelfde naam bestaat, ontvangt u een melding en kunt u de naam aanpassen voordat u doorgaat.
Stap 3: Vaardigheden controleren
De AI extraheert vaardigheden uit het cv met betrouwbaarheidsscores die aangeven hoe zeker het is over elke vaardigheid. Vaardigheden worden weergegeven als interactieve chips die u kunt in- of uitschakelen. Een kleurgecodeerde betrouwbaarheidsindicator toont hoge (groen), gemiddelde (accentkleur) en lage (rood) betrouwbaarheidsniveaus.In deze fase kunt u:
- Vaardigheden in- of uitschakelen door erop te klikken (bevestigde vaardigheden tonen een vinkje)
- Vaardigheden verwijderen door op de X-knop van elke vaardigheidsschip te klikken
- Ontbrekende vaardigheden toevoegen door in het invoerveld te typen en op Enter te drukken of op de toevoegknop te klikken
Stap 4: Locatie instellen
Configureer de locatie en zoekradius van de kandidaat:Zie Locatie en voorkeuren voor details over elke instelling en hoe deze matching beinvloeden.
- Locatie met automatisch aanvullen voor precieze geocodeerde coordinaten (breedte-/lengtegraad). Begin met typen om suggesties te zien.
- Zoekradius-schuifregelaar in kilometers (standaard 40 km, instelbaar van 5 km tot 200 km)
Aanvullende voorkeuren zoals salarisverwachtingen, functietype en flexibiliteit kunnen later worden geconfigureerd via het profielbewerkinsdialoogvenster van de kandidaat. De wizard richt zich op de essentiële velden die nodig zijn om matching te starten.
Wat er achter de schermen gebeurt
Wanneer een cv wordt geupload, wordt de volgende verwerkingsketen in volgorde uitgevoerd:Tekstextractie
Het bestand wordt geparsed met behulp van de juiste bibliotheek:
- PDF: PyMuPDF (fitz) extraheert tekst van alle pagina’s, bewaart de leesvolgorde en verwerkt meerkolomsindelingen
- DOCX: python-docx extraheert tekst uit zowel
paragraph-elementen alstable-cellen, zodat cv-indelingen met op tabellen gebaseerde kopteksten volledig worden vastgelegd - TXT: Directe bestandsuitlezing met detectie van de codering
AI-profielextractie
De geextraheerde tekst (indien nodig afgekapt tot 50.000 tekens) wordt samen met een gestructureerde extractieprompt naar Gemini 3 Flash Preview gestuurd. De prompt instrueert de AI om gegevens te identificeren en te retourneren in een specifiek JSON-formaat dat alle ondersteunde velden omvat.De AI gebruikt contextueel begrip om gegevens te extraheren die verder gaan dan eenvoudige patroonherkenning:
- Een vermelding van “5 jaar leiding geven aan ontwikkelteams” informeert zowel de berekening van jaren ervaring als de toewijzing van het ervaringsniveau
- Een certificering zoals “AWS Certified Solutions Architect” wordt vastgelegd als zowel een vaardigheid als opleidings-/certificeringsgegevens
- Locatiestrings zoals “regio Amsterdam” of “Randstad” worden herkend als geografische verwijzingen
Vaardigheidsextractie met betrouwbaarheid
De AI identificeert vaardigheden door het hele cv en kent aan elke vaardigheid een betrouwbaarheidsscore toe tussen 0 en 1. De score weerspiegelt hoe expliciet en prominent de vaardigheid verschijnt:
- Een vaardigheid die in een speciale sectie “Vaardigheden” met nadruk wordt vermeld, krijgt 0,95+
- Een vaardigheid die in de context van een functiebeschrijving wordt vermeld, krijgt 0,75-0,89
- Een vaardigheid die wordt afgeleid van een gerelateerde technologie of functie krijgt 0,60-0,74
Vaardigheidsnormalisatie
Geextraheerde vaardigheden worden toegewezen aan canonieke vormen met behulp van de SKILL_ALIASES-taxonomie. Deze taxonomie bevat meer dan 1.000 toewijzingen van gangbare variaties naar gestandaardiseerde vaardigheidsnamen:
- “JS”, “Javascript”, “JavaScript”, “JavaScript Programming” worden allemaal toegewezen aan “javascript”
- “React.js”, “ReactJS”, “React” worden allemaal toegewezen aan “react”
- “Amazon Web Services”, “AWS” worden beiden toegewezen aan “aws”
- “PostgreSQL”, “Postgres”, “psql” worden allemaal toegewezen aan “postgresql”
Locatiegeocodering
Als er een locatiestring in het cv wordt gevonden, wordt deze geocodeerd via een meerstappenproces:
- Controle in de Nederlandse stedenlijst — De locatie wordt eerst vergeleken met een uitgebreide lijst van Nederlandse steden voor snelle, nauwkeurige resolutie
- Fallback naar Nominatim API — Als de locatie niet in de Nederlandse database wordt gevonden, wordt deze naar de Nominatim-geocodeer-API gestuurd
- AI-normalisatie — Voor onduidelijke of niet-standaard locatiestrings wordt AI-gebaseerde normalisatie gebruikt om de locatie op te lossen
Profiel aanmaken en opschonen
Het kandidaatprofiel wordt in de database aangemaakt met alle geextraheerde gegevens. Voordat het profiel wordt aangemaakt, worden eventueel eerder verlaten onvolledige kandidaatprofielen (van onderbroken uploadwizards) automatisch opgeschoond.Het originele cv-bestand wordt als binaire bijlage naast het kandidaatprofiel opgeslagen, zodat u het op elk moment kunt downloaden vanaf de kandidaatdetailpagina.
Het originele cv-bestand wordt naast het kandidaatprofiel opgeslagen in de database als een binair veld (LargeBinary). U kunt het op elk moment downloaden vanaf de kandidaatdetailpagina in het originele formaat (PDF, DOCX of TXT).
Omgaan met randgevallen
CV-tekst te kort
CV-tekst te kort
Als de geextraheerde tekst minder dan 50 tekens bevat, geeft het systeem een fout. Dit duidt doorgaans op:
- Een gescande PDF zonder OCR (alleen afbeeldingsinhoud)
- Een beschadigd bestand
- Een bestand dat eigenlijk geen cv is (bijv. een leeg sjabloon)
Naam kon niet worden geextraheerd
Naam kon niet worden geextraheerd
De naam van de kandidaat is het enige strikt vereiste veld. Als de AI geen naam kan bepalen uit de cv-inhoud, mislukt de upload met een toelichting. Dit kan voorkomen bij:
- Sterk opgemaakte cv’s waarbij de naam is ingesloten in een afbeelding
- Cv’s in niet-standaard indelingen waarbij de naam niet prominent is geplaatst
- Geanonimiseerde cv’s waarbij de naam opzettelijk is verwijderd
Dubbele kandidaatnamen
Dubbele kandidaatnamen
Recruitier controleert op dubbele kandidaatnamen binnen uw account. Als u al een kandidaat met dezelfde naam heeft, ontvangt u een conflictmelding.Oplossing: Hernoem de nieuwe kandidaat met een onderscheidend detail (bijv. “Jan de Vries (Amsterdam)” vs. “Jan de Vries (Rotterdam)”), of werk het bestaande profiel bij met de nieuwe cv-gegevens.
Bestandsgroottelimieten
Bestandsgroottelimieten
Bestanden die de maximale grootte overschrijden (doorgaans 10 MB) worden afgewezen voordat de verwerking begint. Standaard cv’s vallen ruim binnen deze limiet, maar cv’s met ingesloten hoge-resolutieafbeeldingen, portfoliosamples of ingesloten video’s kunnen deze overschrijden.Oplossing: Verwijder grote afbeeldingen of ingesloten media voordat u uploadt. Noteer voor kandidaten met een portfoliorijk cv de portfoliosectie in de kandidaatsamenvatting in plaats van deze in te sluiten.
Niet-standaard cv-indelingen
Niet-standaard cv-indelingen
Hoewel de AI een breed scala aan cv-formaten verwerkt, kunnen extreem creatieve indelingen (infographics, sterk ontworpen PDF’s met niet-standaard tekstflow) leiden tot extractions van mindere kwaliteit. De tekstextractie volgt de leesvolgorde van het document, wat in sterk ontworpen PDF’s mogelijk niet overeenkomt met de visuele indeling.Oplossing: Als een creatief cv slechte extractieresultaten oplevert, vraag de kandidaat dan om een versie in platte tekst of standaard Word-formaat. U kunt het creatieve cv altijd opslaan als referentie terwijl u de standaardversie voor AI-extractie gebruikt.
Kandidaatlimiet gratis abonnement
Kandidaatlimiet gratis abonnement
Accounts met een gratis abonnement zijn beperkt tot 3 actieve kandidaten. Als u deze limiet al heeft bereikt, wordt de upload geblokkeerd totdat u upgradet naar een betaald abonnement (Pro of Agency) of bestaande kandidaten deactiveert.Oplossing: Upgrade naar Pro of Agency voor onbeperkte kandidaten, of verwijder kandidaten waarmee u niet meer actief werkt.
Tips voor de beste resultaten
Gebruik tekstgebaseerde PDF's
Cv’s die rechtstreeks zijn geexporteerd vanuit Word, Google Docs of een teksteditor leveren de beste extractieresultaten. De AI kan de volledige inhoud analyseren en gegevens met hoge betrouwbaarheid extraheren. Gescande documenten met alleen afbeeldingsinhoud kunnen helemaal niet worden verwerkt.
Standaardindelingen werken het beste
Hoewel de AI een breed scala aan formaten verwerkt, leveren traditionele cv-indelingen met duidelijke sectiekoppen (Ervaring, Opleiding, Vaardigheden) de meest nauwkeurige extracties. De AI kan vaardigheden uit elk deel van het cv identificeren, maar duidelijk gelabelde secties verhogen de betrouwbaarheidsscores.
Beoordeel vaardigheden altijd
De AI is goed maar niet perfect. Een snelle beoordeling van 30 seconden van geextraheerde vaardigheden zorgt ervoor dat uw kandidaat wordt gematcht met de juiste kansen. Omdat vaardigheden 45% van het vectorzoekgewicht dragen, heeft deze kleine investering een buitenproportioneel groot effect op de matchkwaliteit.
Verifieer functietitel en ervaringsniveau
De functietitel van de kandidaat beinvloedt de titelvector (35% van het zoekgewicht) en het ervaringsniveau is van invloed op welke vacatures worden weergegeven. Het nauwkeurig instellen van deze gegevens is de op een na hoogst prioritaire actie na het bevestigen van vaardigheden.
Geavanceerd
De volledige extractiepipeline in detail
De cv-uploadpipeline is een zorgvuldig georkestreerde reeks die snelheid en grondigheid in balans brengt. Dit is wat er op elke laag gebeurt: Bestandsverwerkingslaag: Het systeem identificeert eerst het bestandstype op extensie en stuurt het naar de juiste extractie-engine. Voor PDF’s verwerkt PyMuPDF elke pagina opeenvolgend, extraheert tekstblokken en herordent deze in leesvolgorde. Voor DOCX-bestanden itereert python-docx door zowel alinea-elementen als tabelcellen — deze dubbele iteratie is cruciaal omdat veel professionele cv-sjablonen tabellen gebruiken voor de indeling, waarbij de naam en contactgegevens van de kandidaat in tabelkoppen worden geplaatst. AI-verwerkingslaag: De geextraheerde tekst wordt naar Gemini 3 Flash Preview gestuurd met een zorgvuldig ontwikkelde prompt die de exacte JSON-structuur specificeert die als retourwaarde wordt verwacht. De prompt bevat instructies voor het omgaan met randgevallen zoals:- Meerdere namen (kies de meest prominente)
- Meerdere locaties (geef de voorkeur aan de huidige/meest recente)
- Onduidelijke ervaringsniveaus (gebruik de heuristiek voor jaren ervaring: 0-2=junior, 3-5=medior, 6-10=senior, 11+=lead)
- Vaardigheden vermeld in verschillende talen (normaliseer naar Engelstalige canonieke vormen)
- Vaardigheden worden genormaliseerd via de SKILL_ALIASES-taxonomie (1.000+ toewijzingen)
- Locatie wordt geocodeerd via de GeocodingService (Nederlandse stedenlijst, Nominatim API, AI-normalisatie)
- Ervaringsniveau wordt gevalideerd aan de hand van jaren ervaring
- Dubbele of bijna-dubbele vaardigheden worden verwijderd
Hoe cv-tekst later wordt gebruikt bij matching
De cv-tekst die op het kandidaatprofiel is opgeslagen, dient niet alleen voor weergave. Het speelt een actieve rol in de matchingpipeline:- Genereren van embeddings: De cv-tekst (samen met de functietitel en vaardigheden van de kandidaat) wordt gebruikt om de Ervaringsvector te genereren — een van de drie vectoren die worden gebruikt voor semantisch zoeken. Deze vector legt bredere professionele context, domeinkennis en werkstijl vast die vaardigheden en functietitels alleen niet kunnen vertegenwoordigen.
- AI-scoring: Tijdens fase 5 van de matchingpipeline worden tot 8.000 tekens cv-tekst naar de AI gestuurd naast de beschrijving van elke gematchte vacature (tot 6.000 tekens). De AI gebruikt dit om functiefit, vaardigheidsfit, ervaringsfit en secundaire fit te evalueren met specifiek bewijs uit het cv.
De limiet van 50.000 tekens voor cv-tekstopslag is ruim genoeg voor elk standaard cv (de meeste cv’s zijn 2.000-5.000 tekens). Voor AI-scoring worden echter alleen de eerste 8.000 tekens gebruikt. Dit betekent dat de meest belangrijke informatie vroeg in het cv moet staan. Gelukkig volgen de meeste cv’s al deze conventie, met naam, functietitel, samenvatting en recente ervaring die als eerste verschijnen.
Verbinding met andere functies
- Vaardighedenstroom: Vaardigheden die tijdens cv-upload worden geextraheerd, vloeien direct door naar de workflow voor vaardigheidsbevestiging. Eenmaal bevestigd, sturen ze de Vaardigheidsvector aan (45% gewicht) bij matching.
- Locatiestroom: De geocodeerde locatie vloeit door naar het systeem voor Locatie en voorkeuren. Als de kandidaat een specifiek adres opgeeft, kan dit later worden verfijnd met de Google Maps-keuzelijst met automatisch aanvullen.
- LinkedIn-verrijking: Als u later een LinkedIn-URL toevoegt aan een via cv geuploadde kandidaat, kan het systeem het profiel aanvullen met aanvullende gegevens. Een nieuwe import overschrijft echter geen cv-geextraheerde gegevens — het is een aanvulling.
- Cv opnieuw uploaden: U kunt het cv van een kandidaat bijwerken door een nieuw bestand te uploaden. Dit start herextractie en kan vaardigheden, functietitel en andere velden bijwerken. Als vaardigheden zijn gewijzigd, detecteert het systeem dit en kan het hermatching activeren.
Tips voor gevorderde gebruikers
Gerelateerd
- Vaardigheden en expertise bevestigen voor nauwkeurige matching
- Locatie en voorkeuren instellen om de juiste vacatures te targeten
- Begrijpen hoe matching werkt om het meeste uit de AI-pipeline te halen
- Importeren vanuit LinkedIn als alternatief voor cv-upload

