ChatGPT Claude Gemini fiscaal – welk AI-model wint
ChatGPT Claude Gemini fiscaal vergelijken: welk model wint?
ChatGPT, Claude en Gemini fiscaal vergelijken: welk model geeft het beste advies voor jouw casus? In dit artikel test ik alle drie met dezelfde prompt en deel ik de resultaten.
ChatGPT, Claude en Gemini zijn alledrie bruikbaar voor fiscaal werk maar welk model presteert het best op jouw casus? Dat ontdek je alleen door ze naast elkaar te leggen. In dit artikel geef ik je de prompt waarmee je ChatGPT, Claude en Gemini fiscaal kunt vergelijken op jouw eigen dossiers.
Vorige week vroeg een collega me na een cursus: “Ron, welk model moet ik gebruiken?”
Mijn antwoord: “Alle drie. En dan vergelijken.”
Hij keek me aan alsof ik hem vroeg om drie verschillende auto’s te kopen om te kijken welke het beste rijdt. Maar dat is precies wat ik bedoel. Niet drie auto’s kopen — drie proefritten maken. Dat kost je een uurtje. En het levert je iets op wat geen enkele review, benchmark of marketingpresentatie je kan geven: eigen ervaring met jouw type werk.
ChatGPT, Claude en Gemini worden fiscaal steeds bruikbaarder
In april 2026 zijn er twee grote releases geweest die je als fiscalist of accountant moet kennen.
Claude Opus 4.7 (Anthropic, 16 april) maakt dertien procent minder fouten bij complexe, meerstapstaken. Dat klinkt bescheiden. Maar bedenk wat “complexe meerstapstaken” zijn in onze context: een belastingberekening waarbij het model eerst de feiten moet identificeren, dan de relevante wetgeving, dan de berekening moet uitvoeren, dan de uitkomst moet controleren. Bij elke stap kan het misgaan. Dertien procent minder fouten bij die ketens betekent aanzienlijk betrouwbaardere output.
Daarnaast leest het model nu gescande documenten in hogere resolutie. Ik heb het zelf getest met een matig gescande jaarrekening — het type dat je krijgt van cliënten die hun administratie doen op een scanner uit 2014. Waar het oude model €142.000 las waar er €142.800 stond, pakte het nieuwe model het correct op.
GPT-5.4 (OpenAI, 5 maart, sinds kort breed beschikbaar) maakt drieëndertig procent minder feitelijke fouten dan zijn voorganger. En de context window is opgerekt naar één miljoen tokens — zo’n duizend pagina’s tekst. Een compleet jaardossier van een mkb-cliënt past erin. De volledige wettekst van de Wet IB 2001 past erin. De hele correspondentie met de inspecteur over de afgelopen drie jaar past erin.
Dat verandert fundamenteel wat je aan een model kunt vragen. Niet meer: “Analyseer dit ene document.” Maar: “Hier is het complete dossier. Hier is de wetgeving. Hier zijn de eerdere adviezen. Geef me een integraal beeld.”
De prompt om ChatGPT, Claude en Gemini fiscaal te vergelijken
Bij mijn cursussen zeg ik altijd: probeer minstens drie AI-modellen voordat je er eentje kiest. Geef ze dezelfde casus. Vergelijk de output. En kies dan — niet op basis van de naam of de marketing, maar op basis van wat je ziet.
Hier is de prompt die ik daarvoor gebruik:
“Ik heb de volgende fiscale casus (peiljaar [jaar]): [beschrijf de casus in 3-5 zinnen, inclusief de vennootschapsstructuur: holding/werkmaatschappij/persoonlijk]. Geef een analyse van de fiscale gevolgen, inclusief: (1) de relevante wetsartikelen met vindplaats, (2) relevante beleidsbesluiten van de Staatssecretaris, (3) eventuele relevante jurisprudentie met ECLI-nummers, (4) een berekening van de belastingdruk onder twee scenario’s, (5) drie risico’s die ik aan mijn cliënt moet melden. Geef bij elke bewering aan hoe zeker je bent en waar ik extra moet verifiëren.”
Voer deze prompt in bij ChatGPT, Claude én Gemini. Met dezelfde casus. Je schrikt van de verschillen.
Wat je waarschijnlijk ziet: het ene model is sterker in het vinden van relevante jurisprudentie, het andere in de berekening, het derde in het signaleren van risico’s. Geen van de drie is foutloos. Alle drie leveren waarde.
Dat is geen academische oefening. Dat is professionele due diligence.
Mijn voorlopige indruk als belastingadviseur
Ik gebruik dagelijks alle drie de modellen. Dit is mijn ervaring — geen wetenschappelijke studie, maar patronen die ik zie in mijn eigen fiscale praktijk:
- Copilot is briljant als je al in het Microsoft-ecosysteem zit en integratie belangrijk vindt. Maar let op: sinds 15 april is Copilot in Word, Excel en PowerPoint alleen nog beschikbaar met een Premium-licentie. Controleer je licenties.
- Claude is sterk in lange, complexe analyses. Het houdt beter context vast over grote hoeveelheden tekst en heeft de beste instructie-opvolging die ik ken. Voor het vergelijken van uitgebreide dossiers is Claude op dit moment mijn eerste keuze.
- GPT-5.4 is de beste allrounder, met name voor taken die veel context vereisen. De context window van één miljoen tokens maakt het mogelijk om een compleet jaardossier in één keer te analyseren.
- Gemini heeft een sterke integratie met Google Workspace en is verrassend goed in het samenvatten van grote hoeveelheden tekst. Voor het snel doorploegen van correspondentie een serieuze optie.
De kunst is niet om het “beste” model te kiezen. De kunst is om het juiste model te kiezen voor de juiste taak. En dat vereist dat je ChatGPT, Claude en Gemini fiscaal vergelijkt — op jouw eigen casussen, niet op basis van benchmarks of marketingpraatjes.
De Autopilot-paradox: waarom beter niet veiliger betekent
En hier moet ik eerlijk zijn over iets. De modellen worden beter. Dat is objectief waar. Maar beter is niet foutloos.
Ik noem dit de Autopilot-paradox. Hoe beter het systeem, hoe minder aandachtig de mens. Hoe minder aandachtig de mens, hoe groter de impact van de fout die het systeem wél maakt. Het is een bekend fenomeen in de luchtvaart. En het geldt precies zo voor ons vak.
De verleiding is groot om te denken: het model is goed genoeg, ik hoef minder te controleren. Die verleiding is precies het risico. Een advocaat in Oregon betaalde onlangs $110.000 boete omdat hij AI-gegenereerde bronnen niet controleerde. Die bronnen bestonden niet. De rechter was niet mild.
De oplossing? Dezelfde als in de luchtvaart. Checklists. Procedures. Verplichte controles op vaste momenten. Niet omdat je dom bent. Maar omdat het systeem zo goed is dat je zonder procedures vergeet te controleren.
Meer hierover in De Fiscale Vuurtoren
Dit blogartikel is een ingekorte versie van artikel 5 uit De Fiscale Vuurtoren van deze week. In de volledige editie lees je ook:
- Hoe die advocaat in Oregon $110.000 boete betaalde voor één AI-hallucinatie — en wat dat betekent voor jouw aansprakelijkheid als belastingadviseur
- Waarom de AFM nu naar jouw AI-tooling kijkt
- Het beveiligingslek waarmee cliëntgegevens via een prompt de deur uit wandelen
- Drie kant-en-klare prompts voor DGA-structuuradvies, IB-aangifte en jaarrekening-analyse
De Fiscale Vuurtoren verschijnt (bijna) wekelijks en wordt gelezen door meer dan 800 accountants, belastingadviseurs en juristen. Wil je erbij? Stuur een mail naar rm@blauwevrijdag.nl en je ontvangt de volgende editie.
Ron Meijer RB is Register Belastingadviseur, AI-trainer en auteur van ‘AI in de fiscale praktijk’. Hij geeft cursussen bij Blauwe Vrijdag, SRA en Sdu en is columnist bij Belastingzaken en Informanagement.
🟦 Denk blauw. Werk slimmer. Deel kennis.
Vragen?
Heeft u naar aanleiding van vorenstaande nog één of meerdere vragen? Geen punt! U kunt mij uw casus online voorleggen. Hiervoor heb ik de optie gratis sparren met Ron bedacht. Tijdens dit half uur kunt u mij uw vraag of vragen voorleggen. Misschien kan ik u zo verder helpen en bent u direct geholpen. Is het antwoord complex en vraagt het meer tijd dan kunnen we dit ook dan bespreken. Klik hier om een afspraak te maken.
DE APP
Vanaf nu alle fiscale informatie in de app Blauwe Vrijdag.
vertel mij meer...
Blij met mijn fiscale tip?
Wees sportief en gun mij een kop koffie 😉.
