Nieuwe evaluatiescores: meer inzicht in de prestaties van jouw AI

Goed nieuws! We hebben onze evaluatiescores een flinke upgrade gegeven. Je krijgt nu véél beter inzicht in hoe jouw AI presteert en waar mogelijk wat aandacht nodig is.

Lisette Vredenburg

Product owner

Wat is er veranderd?

Van 0-1 naar 0-100

Evaluatiescores worden nu weergegeven als percentages (0-100) in plaats van decimalen (0-1). Dit maakt scores in één oogopslag duidelijker. Een score van 85 spreekt gewoon direct aan, terwijl je bij 0.85 toch even moet nadenken.

Judges afgestemd op Vragen.ai

We zijn gestart met ARES als basis voor onze evaluaties, maar Vragen.ai is enorm gegroeid. Daarom hebben we onze AI-as-judge systemen speciaal afgestemd op de unieke vereisten van Vragen.ai. Het resultaat van deze welverdiende liefde? Evaluaties die beter aansluiten, zodat je meteen ziet welke vragen aandacht vragen. Daarmee verbeter je gericht je content of AI-configuratie voor betere antwoorden.

Transparante onderbouwing

Dit is misschien wel het gaafste (de letterlijke woorden van Joris): elke score komt nu met een gedetailleerde onderbouwing. Geen giswerk meer over waarom een antwoord een bepaalde score krijgt. Je ziet precies wat de AI-judge heeft gezien en waarom die tot deze conclusie kwam.

Hoe werkt het?

Nieuwsgierig naar de details achter een score? Klik gewoon op een evaluatiescore bij een antwoord in je dashboard en je krijgt meteen een uitleg te zien. Je ziet wat de evaluatie nu meet, en belangrijker nog: waarom de AI-judge tot deze specifieke score is gekomen (de onderbouwing).

Neem bijvoorbeeld de betrouwbaarheid score van 100 die je in het screenshot hierboven ziet. Als je daarop klikt, zie je dat het antwoord goed onderbouwd is met relevante brondata en dat alle claims geverifieerd kunnen worden. Geen vaag gevoel meer over waar de score vandaan komt – gewoon kristalhelder inzicht.

Waarom is dit belangrijk?

Goede evaluaties zijn cruciaal voor het continue verbeteren van je AI-assistent. Met deze vernieuwde scores kun je:

Snel problemen identificeren: zie in één oogopslag welke antwoorden aandacht nodig hebben
Gericht optimaliseren: begrijp precies wát er verbeterd moet worden
Vertrouwen opbouwen: laat stakeholders zien dat jullie AI-kwaliteit serieus nemen

Aan de slag

De nieuwe evaluatiescores zijn nu live voor alle gebruikers. Je hoeft niks te doen, alle nieuwe antwoorden worden automatisch geëvalueerd met het vernieuwde systeem.

Benieuwd wat jouw AI-scores zijn? Check je dashboard en klik op een score om de onderbouwing te bekijken. We zijn benieuwd naar je feedback!

Vorige artikel

Nog sneller zien wat er speelt: de nieuwe Analyse-functie

Volgende artikel

Vragen.ai met agent modus: één vraag, meerdere denkstappen, beter antwoord

Privacy statement

vragen.ai is een product van