Valt een auteur te herkennen aan zijn stijl? De meeste deskundigen zijn sceptisch, maar de Amsterdamse hoogleraar tekstwetenschap Teun A. van Dijk beweert met grote stelligheid dat hij de hand van de schrijver Gerrit Komrij herkent in een anti-islamitisch pamflet. Hoeveel vingerafdrukken laten schrijvers na in hun taalgebruik?

Je bent hoe je schrijft

Verraadt de stijl de auteur?

Marc van Oostendorp

Dit artikel verscheen in het tijdschrift Onze Taal (oktober 2003)

Wie de wet wil overtreden, moet eerst het Groene Boekje bestuderen. Dat ontdekte een jeugdige Antwerpse crimineel dit voorjaar. Hij had een politieagent een dreigbrief en een poederbrief gestuurd en in allebei geschreven dat de man 'uit mijn buirt' moest blijven. Nadat hij was opgepakt, liet de politie hem een dictee maken, waarin die uitdrukking ook voorkwam. Toen hij weer 'buirt' spelde was hij er gloeiend bij.

Een Nederlandse verzender van dreigementen had zich vorig jaar ook al laten kennen. Toen allerlei politici vorig jaar in de nasleep van de moord op Pim Fortuyn een kogelbrief ontvingen, kon de politie snel vaststellen dat het in de meeste gevallen om dezelfde afzender ging: iemand met een typemachine zonder hoofdletter R (die was steeds met de hand ingevuld) en een eigenzinnige liefde voor het woord garnalenhersens.

De spelling buirt, een ontbrekende hoofdletter R en het woord garnalenhersens hebben één ding gemeen: ze komen niet veel voor. Dat maakt ze geschikt als identificatiemiddel: vraag twee mensen een dreigbrief te schrijven en de kans dat ze allebei over de garnalenhersens van de geaddresseerde beginnen is uitermate klein.

Pseudoniem

Schrijvers verraden zich niet vaak zo door hun taalgebruik. De Nederlandse politie en justitie maken dan ook maar zelden gebruik van stijlanalyse. Het Nederlands Forensisch Instituut (NFI) in Rijswijk, dat wetenschappelijk onderzoek doet voor het ministerie van justitie, biedt wel een 'tekstmethode' aan, maar waarschuwt erbij dat het "zeer veel vaker niet dan wel" mogelijk is om "aan de hand van uitsluitend tekst-interne taalkundige informatie" vast te stellen wie iets geschreven heeft.

Ook literatuurwetenschappers proberen soms te achterhalen wie een tekst geschreven heeft. Zijn alle toneelstukken van Shakespeare echt door Shakespeare geschreven? Wie is de auteur van Vanden vos Reynaerde? Is Marek van der Jagt inderdaad een pseudoniem van Arnon Grunberg? Net als de medewerkers van het NFI zijn literatuurwetenschappers doorgaans voorzichtig met het gebruik van tekstanalyse als 'bewijs'. Je kunt hooguit aantonen dat er opvallende overeenkomsten zijn in de stijl van twee schrijvers.

In de boekwinkel verliezen zelfs de wetenschappers overigens hun reserve. "Als ik iets gelezen heb waarvan de stijl me beviel en ik zie in de winkel een roman liggen van dezelfde schrijver, koop ik dat nieuwe boek waarschijnlijk ook", zegt de Leidse hoogleraar Nederlandse taalkunde Arie Verhagen. Maar volgens hem wordt de voorkeur voor een bepaalde schrijver eerder bepaald door de wereld die zo'n schrijver schetst dan door zijn stijl. Bovendien kan een nieuw boek van een geliefde schrijver altijd tegenvallen, en een nieuw boek van een eerder minder gewaardeerd schrijver je juist enorm raken – niemand schrijft altijd op precies dezelfde manier.

Zwerfhond

Gegeven al deze voorzichtigheid is het opmerkelijk dat de Amsterdamse hoogleraar tekstwetenschap Teun van Dijk in 1990 in een brief aan het Nederlands Centrum voor Buitenlanders (NCB) opmerkte dat hij na een tekstanalyse "voor vijfennegentig procent" zeker wist dat een onder pseudoniem verschenen anti-islamitisch pamflet geschreven was door de bekende dichter en columnist Gerrit Komrij. Nog opmerkelijker is dat Van Dijk vorige maand, vele jaren later, nog eens op de zaak is teruggekomen. Hij publiceerde een boek waarin hij ondanks de scepsis van alle andere deskundigen aan zijn stelling blijft vasthouden. Volgens zijn collega's diskwalificeert Van Dijks stelligheid hem als wetenschapper.

De aanleiding voor alle geharrewar is het boekje De ondergang van Nederland. Land van naïeve dwazen, in 1990 verschenen bij het kleine uitgeverijtje Gerard Timmers Prods., dat in dezelfde tijd onder andere ook van zich deed spreken doordat het de memoires van de nationaal-socialistische weduwe Rost van Tonningen uitgaf. De auteur van De ondergang verschool zich achter het pseudoniem Mohammed Rasoel. Een uit Pakistan afkomstige variété-artiest, een zekere Zoka van A., werd later wegens aanzet tot haat veroordeeld als de auteur van het boekje.

De ondergang van Nederland zou net zo vergeten zijn als de memoires van Rost van Tonningen, als Teun van Dijk zich niet met de zaak had bemoeid. Zijn brief aan het NCB lekte uit en leidde tot een rel. Vanaf het begin werden Van Dijks argumenten belachelijk gemaakt, ook door Komrij zelf. Zo merkte Van Dijk op dat in het boekje De ondergang van Nederland het woord zwerfhond voorkwam en dat dit woord ook in het werk van Komrij kon worden aangetroffen – wat een reden voor Komrij was om een lijst met schrijvers te geven die het woord ook hadden gebruikt, en bovendien zijn opponent zelf te vergelijken met een zwerfhond.

Als twee druppels water

Teun van Dijk gaat dit jaar met vervroegd pensioen van de Universiteit van Amsterdam en wil zijn standpunt nog één keer duidelijk maken. Omdat geen enkele uitgever zich aan zijn boek De Rasoel-Komrij Affaire wilde wagen, heeft de hoogleraar het nu in eigen beheer uitgebracht. Hij zet er al zijn argumenten nog eens op het rijtje.

Zijn belangrijkste aanname is dat het onomstotelijk vaststaat dat De ondergang geschreven moet zijn door een literair auteur: dat betekent dat de Pakistaanse varieté-artiest onterecht veroordeeld is. Het zwaarste argument voor deze aanname is dat de auteur van het pamflet over een rijke woordenschat beschikt: Rasoel gebruikt ongebruikelijke woorden als aapmensen, indianenvolk en zeehondjesmoord. (Het probleem met dit argument is dat de tekst vertaald is door de literaire vertaler René Kurpershoek, die heel wel verantwoordelijk kan zijn geweest voor de woordkeus. Uit ditzelfde argument volgt overigens ook dat Komrij ook de kogelbrieven aan de mensen met garnalenhersens geschreven zou kunnen hebben.)

Een ander argument is dat Rasoel en Komrij allebei met beeldspraak werken. Van Dijk gebruikt hiervoor niet erg overtuigense voorbeelden: aan de ene kant 'spitten in achtergronden' en 'opgepotte grieven' uit het boekje van Rasoel, en aan de andere 'een sint-vitusdans van penissen op rappe pootjes' en 'de egalitaire mier' uit het werk van Komrij. Dat de eerste in vergelijking met de laatste nogal clichématig zijn, bespreekt Van Dijk niet.

Nog een argument van Van Dijk: Komrij heeft nooit bewezen dat hij Rasoel níét is, terwijl hij dat gemakkelijk had kunnen doen. Maar is het niet bijna onmogelijk om te bewijzen dat je iets níét geschreven hebt? "Ik denk dat Komrij inderdaad, als hij gewild had, een alibi had kunnen geven," laat Van Dijk in een e-mail weten. "Niet wat betreft stijl en inhoud, want die lijken als twee druppels water op zijn werk. Maar wel wat betreft de hele context -- bijvoorbeeld (...) dat hij in die periode (1989-1990) op reis was in India, weet ik veel."

De kern van het probleem

Op het moment dat ik hem spreek rust er nog een embargo op Van Dijks boek, maar de Leidse hoogleraar Verhagen verwacht weinig van het werk van zijn Amsterdamse collega: "Van Dijks argumenten waren indertijd al onder de maat en ik verwacht niet dat ze intussen beter geworden zijn." Verhagen zegt dat Van Dijk zich in deze kwestie gedraagt als een 'charlatan' en 'het vak geen dienst bewijst'.

Op Van Dijks website is bijvoorbeeld een 'Rasoel-Komrijtoets' te vinden, waarin een aantal korte citaten van Rasoel en Komrij over moslims door elkaar staan: het feit dat het moeilijk is alle citaten eenduidig aan een van beiden toe te schrijven is volgens Van Dijk een bewijs dat Rasoel en Komrij dezelfde persoon zijn. "Zo'n toets is methodologisch zo dubieus", zegt Verhagen, "dat ik niet begrijp hoe je er als wetenschapper mee durft aan te komen. Je zou toch eerst moeten laten zien dat mensen zo'n test voor twee andere auteurs die over hetzelfde onderwerp schrijven wél zouden kunnen uitvoeren."

Sinds 1990 lijkt de computeranalyse van teksten wel iets verbeterd. Zo werd vorig jaar de schrijver Arnon Grunberg door NRC Handelsblad 'ontmaskerd' als degene die achter het pseudoniem Marek van der Jagt school. De krant had hiervoor een aantal Italiaanse wiskundigen ingeschakeld die met de computer zouden hebben vastgesteld dat Grunberg en Van der Jagt precies dezelfde stijl hadden. Als ze dat konden bewijzen, zou het toch ook mogelijk moeten zijn om eventuele overeenkomsten in stijl tussen Rasoel en Komrij aan te tonen?

Compressie

De neerlandicus Joris van Zundert van het Nederlands Instituut voor Wetenschappelijke Informatievoorziening (NIWI-KNAW) kent het computerprogramma dat de Italiaanse wiskundigen indertijd gebruikt hebben. "De aanname is dat schrijvers zich kenmerken door bepaalde patronen in hun taalgebruik. Het is nog niet precies duidelijk wat deze patronen zijn: stilistische eigenschappen, idioom, eigenaardigheden in verbuigingen en vervoegingen, of voorliefdes voor bepaalde woordvolgordes", legt hij uit. "Waarschijnlijk is het een combinatie van dergelijke factoren."

Ook al begrijpen we de patronen nog niet precies, toch kunnen we ze wel gebruiken, zegt Van Zundert. Dat komt doordat zogenoemde compressieprogramma's (het bekendste is WinZip) gebruik maken van dit soort patronen. Om computerbestanden zo klein mogelijk te maken, zodat er bijvoorbeeld meer op één diskette passen of de verzending via internet zo snel mogelijk verloopt, proberen dit soort programma's zoveel mogelijk patronen te herkennen. Als bijvoorbeeld bepaalde woorden meerdere keren voorkomen in een tekst, hoeven ze maar een keer te worden bewaard in het bestand.

Als je twee teksten van (bijvoorbeeld) ieder tienduizend lettertekens van dezelfde auteur aanbiedt aan een compressieprogramma, blijken deze doorgaans tot een compacter resultaat in elkaar te drukken dan als je twee teksten van dezelfde lengte neemt van twee verschillende auteurs. Kennelijk zitten er in twee teksten van dezelfde auteur meer overeenkomsten dan in teksten van verschillende auteurs.

Manipuleren

Op verzoek van Onze Taal voert Van Zundert de 'Marek van der Jagt'-test uit op de teksten van Komrij en Rasoel. Ter vergelijking heeft hij de teksten nodig van nog zeven schrijvers (zie kader). Uit Van Zunderts onderzoekje blijkt geen overeenkomst tussen Komrij en Rasoel. De auteur die het meest op Rasoel lijkt – er moet er natuurlijk altijd één zijn die bovenaan komt te staan – is Hugo Brandt Corstius. Hoewel op de achterflap van De ondergang wordt verteld dat Het Parool indertijd vermoedde dat Piet Grijs (een pseudoniem van Brandt Corstius) achter Rasoel zou kunnen zitten, is het onwaarschijnlijk dat de, als fel anti-racistisch bekend staande, Brandt Corstius aan dit boekje heeft meegewerkt. Van Zundert: "Daaruit volgt dat ook Komrij niet de auteur kan zijn: zijn tekst vertoont in ieder geval behoorlijk wat minder overeenkomsten met het pamflet dan de tekst van Brandt Corstius." Dat Komrij desalniettemin hoog scoort is volgens Van Zundert weliswaar 'intrigerend' maar geeft op zijn best "mogelijk een verklaring waarom Van Dijk altijd zoveel overeenkomsten heeft gezien tussen Komrij en Rasoel: zij lijken inderdaad enigzins op elkaar".

Op het gebruikte Italiaanse computerprogramma – dat helemaal niet naar de inhoud van de teksten kijkt en alleen naar de vorm – hebben sommige wetenschappers overigens wel kritiek. Tijdens het onderzoekje voor Onze Taal bleek ook dat de uitkomst vrij makkelijk te manipuleren was. Als we van Komrij alleen teksten over de islam hadden gekozen en van andere auteurs teksten over heel andere onderwerpen, was het niet denkbeeldig (maar ook weinig informatief) dat Komrij alsnog als hoogste was geëindigd.

Dit zet overigens ook de uitkomsten van het oorspronkelijke Van der Jagt-onderzoek van NRC Handelsblad in een nieuw licht. Door de auteurs waarmee vergeleken wordt te manipuleren, kun je er vrij gemakkelijk voor zorgen dat iemand bovenaan komt te staan. Als Marek van der Jagt indertijd vergeleken is met Arnon Grunberg, P.C. Hooft en Joost van den Vondel (de namen van de auteurs uit de controlegroep zijn niet gepubliceerd) is het niet erg verrassend dat de eerste als de meest waarschijnlijke auteur is aangewezen. Het feit dat Grunberg, geconfronteerd met dit 'bewijs' heeft toegegeven dat hij de boeken van Van der Jagt geschreven had, was pas het echte bewijs. Een auteur alleen aan zijn stijl herkennen op een manier die boven alle twijfel verheven is, zolang die auteur het Groene Boekje kent, voorlopig niet mogelijk.

De Marek van der Jagt-toets

De uitkomst van de in dit artikel beschreven toets kan nooit 'bewijzen' dat twee teksten door dezelfde auteur geschreven zijn. Het kan hoogstens bewijzen dat twee teksten meer op elkaar lijken dan op een aantal controleteksten.

In het voor Onze Taal uitgevoerde onderzoek is het boekje De ondergang van Nederland vergeleken met willekeurig geselecteerde fragmenten uit het werk van een aantal schrijvers. De computer stelde vervolgens de volgende rangorde op van deze schrijvers (1= de meeste overeenkomst met De ondergang, 8=minste overeenkomst).

  1. Hugo Brandt Corstius
  2. Gerrit Komrij
  3. Salman Rushdie (vertaling: Rien Verhoef)
  4. Marc van Oostendorp
  5. Adriaan Venema
  6. Susan Sontag (vertaling: René Kurpershoek)
  7. Pim Fortuyn
  8. Teun A. van Dijk

Het rijtje is moeilijk te duiden; de eerste drie schrijvers zijn inderdaad literatoren, maar dat is Susan Sontag (op plaats zes) evenzeer. Wel interessant is dat de teksten van Pim Fortuyn (zijn inaugurele rede) en Teun A. van Dijk (een leerboek) de enige wetenschappelijke teksten waren in dit rijtje.

Meer informatie over het onderzoekje is te vinden op http://www.onzetaal.nl/2003/10/rasoel.html

Gerrit Komrij reageert

In een e-mail aan Onze Taal reageert Dichter des Vaderlands Gerrit Komrij kort ('ik heb het zwerfhondsdruk') op de herlevende affaire 'Rasoel/Komrij':

Over Teuns wetenschappelijkheid.

De grote duim is voor Teuntje altijd belangrijker geweest dan serieus onderzoek. Zijn voornaamste argument destijds was immers dat bij Rasoel het woord zwerfhond voorkwam. Zwerfhonden had je in Nederland niet. Waar wel? In Portugal. Nu dan.

Uit de database van Van Dale [ik denk dat dit strikt genomen moet zijn: de database van het INL, MvO] kwam een flink aantal zwerfhonden te voorschijn. Jan Cremer gebruikte het woord ook. Het interesseerde Teuntje niet. Hij beoefent dan ook geen wetenschap, hij hangt een ideologie aan. Wat niet in het beeld past, wordt genegeneerd.

Over Teuns hardnekkigheid.

Na de rechtszaak tegen Rasoel hanteerde hij als beleidslijn: als Komrij het niet heeft geschreven, zou hij het geschreven kunnen hebben. Voor dat doel plukte hij uiterst selectief alinea's en regels uit mijn werk, zonder ook maar enige rekening te houden met context, ironie, retorica, humor, overdrijving enz., laat staan met het karakter van de schrijver. Het zou kwaadaardig zijn als het niet zo volstrekt verknipt was.

Wat me stoort, als de aap uit de mouw moet, is dat de ijdeltuit Teun mij zijn hele betoog door voor net zo'n domkop houdt als hij zelf is. Zijn 'parallellen' met Rasoels tekst zoekt hij in alinea's die ik schreef over de uitwassen van het welzijnswerk en de antiracisme-industrie, alinea's waardoor hij zich blijkbaar voelt aangesproken. Alinea's waarin ik me kwaad maak over onverdraagzaamheid en domheid komen niet in aanmerking.

Over De ondergang van Nederland

Ik heb nog steeds geen trek gehad dat boekje te lezen, al heb ik het hier thuis wel ergens liggen. Er zijn in de loop der tijden verschillende vrienden en bekenden geweest die me vertelden dat het boekje van Rasoel, gezien de ferme en steeds fermer uitspraken in de politiek, van Bolkestein tot Fortuyn en van half links tot halfzacht links, achteraf toch wel een steeds bleker indruk begon te maken. Wat in dat boekje stond, bedoelden ze, was op het Binnenhof, bij de ambtenarij en in de pers inmiddels gemeengoed geworden waar geen mens meer van opkeek. Half Nederland rasoelde, alleen Teuntje bleef zich blind staren.