8. Het woordennetwerk

Marc van Oostendorp

Hoofdstuk uit het boekje Computers en taal, oorspronkelijk verschenen bij Sdu, Den Haag, 1999.

In een beschaafd land zorgt de overheid voor de openbare weg. Bedrijven willen graag een goede infrastructuur waarover hun vertegenwoordigers en hun vrachtwagens naar de klanten kunnen rijden en hun werknemers naar kantoor. Ook burgers vinden het prettig om van Amsterdam naar Brussel te kunnen rijden zonder door elkaar geschud te worden doordat de wegen vol zitten met hobbels en kuilen. Maar voor elk individu en elk bedrijf afzonderlijk zou het onderhoud van het wegennet te kostbaar zijn en te weinig profijtelijk. Privatiseer de zorg voor het wegennet en onmiddellijk verslonst het. Als we niet via onze overheid de handen ineengeslagen hadden, reden we nu misschien nog op modderige zandweggetjes.

Wat voor het wegennet geldt, geldt voor andersoortige netwerken net zo goed. Aan het eind van de negentiende eeuw was het interlokale telefoonverkeer in handen van één bedrijf. De toestand was daardoor rampzalig, want dat bedrijf wilde eigenlijk alleen degenen aansluiten die een abonnement hadden bij de eigen lokale afdeling. Lokale abonnementen bij andere bedrijven kregen geen voorrang. Het interlokale telefoonverkeer begon in Nederland dan ook pas vorm te krijgen toen de overheid aan het eind van de eeuw het heft in handen nam.

De parallellen met computers en Internet liggen voor het oprapen. Op allerlei plaatsen op de wereld wordt gebouwd aan een elektronische snelweg, een wereldwijd netwerk voor persoonlijke brieven, prijsopgaven, wetsvoorstellen, zakelijk nieuws, wetenschappelijke artikelen en andere soorten informatie. Heel veel van die informatie heeft de uiterlijke vorm van taal, van gesproken of geschreven zinnen. Het is al niet meer de vraag of een dergelijke wereldwijde infrastructuur er komt – de enige echte vraag is welke rol het Nederlands in deze ontwikkeling zal spelen. Komt een redelijk deel van alle informatie ook in onze taal beschikbaar? En zullen computers in de toekomst net zo gemakkelijk met onze taal kunnen werken als bijvoorbeeld met het Engels? Bedrijven hebben daar een duidelijk belang bij: een werknemer die zijn eigen taal kan gebruiken, werkt sneller en beter. Maar bij een goede vertegenwoordiging van het Nederlands in de elektronische wereld zijn uiteindelijk alle taalgebruikers gebaat. Ook in de informatiemaatschappij moeten en willen we onze eigen moedertaal kunnen blijven gebruiken. Niemand mag worden achtergesteld omdat hij niet voldoende talent heeft om een vreemde taal tot in de perfectie te leren. Het Nederlands mag daarom niet ten onder gaan aan een gebrek aan digitale daadkracht.

Er zal heel wat bij komen kijken voordat de infrastructuur voor onze taal er ligt. Als we het Nederlands even aantrekkelijk en effectief willen houden als het Frans, het Duits en vooral het Engels, zullen er nog wel een paar producten moeten komen. Een bruikbare taal is in de nabije toekomst waarschijnlijk ook een elektrónisch bruikbare taal.

Bankpas

De belangrijkste taalkundige computerprogramma's zijn voor de meeste mensen natuurlijk sinds jaar en dag de tekstverwerkers. Deze bieden de schrijver steeds meer hulp bij zijn werk: ze controleren zijn spelling en zijn zinsbouw, maar geven ook stilistische tips. Naar verwachting zullen in de nabije toekomst bijvoorbeeld gestandaardiseerde zakelijke brieven voor een belangrijk gedeelte automatisch geschreven kunnen worden. De schrijver hoeft dan alleen een formuliertje in te vullen met wat details, en de brief komt automatisch uit zijn printer rollen. Maar als het tegenzit, moet de gebruiker wel overschakelen naar het Engels en een paar andere grote talen zoals het Frans, het Duits en misschien het Spaans, omdat de benodigde software alleen voor die programma's beschikbaar is. Als we willen dat het niet moeilijker wordt een zakelijk stuk te schrijven in onze eigen taal dan in een vreemde, moet het Nederlands ook in dat rijtje komen te staan.

Een ander belangrijk taalkundige toepassing van de moderne techniek is spraakherkenning. Wie over een paar jaar geld uit een pinautomaat wil halen, heeft geen bankpasje of pincode meer nodig. Een mondelinge opdracht is voldoende: vertel het kastje hoeveel u nodig hebt en het ding herkent uw stem, en begrijpt welk bedrag u noemt. En niet alleen geldtransacties zullen door de computer worden afgehandeld: nu al kan zo'n apparaat u informeren over de aankomst- en vertrektijden van treinen. Computers staan ons steeds vaker te woord en dan is het prettig als ze ook onze taal spreken.

Worldwide Web

Vrijwel vanaf het moment dat de eerste computer gebouwd is, werd geprobeerd het apparaat van de ene taal naar de andere te laten vertalen. Nu de communicatie steeds internationaler wordt, wordt het ook steeds belangrijker dat documenten uit en naar onze taal vertaald worden. Het is ondoenlijk om al dat werk door menselijke vertalers te laten uitvoeren, en dus moeten ook hier computers uitkomst bieden. Op het Worldwide Web – dat niet voor niets een Engelstalige naam heeft – zijn her en der programma's geïnstalleerd die tekst automatisch van de een in de andere taal omzetten. Een Franstalige gebruiker vraagt informatie op bij een Amerikaans bedrijf, en hoewel dat bedrijf die informatie alleen in het Engels presenteert, krijgt de Fransman een en ander toch in zijn eigen taal op zijn scherm. Voorzover ik weet, zijn dat soort faciliteiten er voor het Nederlands nog helemaal niet. Nu zijn ook de vertaalsystemen die van het Engels naar het Frans vertalen nog allesbehalve volmaakt. Minstens even belangrijk als dit soort systemen zijn daarom computerprogramma's die menselijke vertalers helpen bij hun werk. Bijvoorbeeld door desgewenst een aantal mogelijke vertalingen voor een woord te suggereren, of door kleine stukjes tekst voor te bewerken. Maar ook wat dit betreft staat de ontwikkeling van de systemen die gericht zijn op het Nederlands nog in de kinderschoenen.

Schillen

Zoals een volwaardige taal een eigen literatuur, een eigen schriftsysteem en een eigen bijbelvertaling heeft, zo heeft ze in de toekomst ook voldoende ondersteunende techniek. Als we willen dat het Nederlands een serieuze taalpolitieke factor blijft, bijvoorbeeld binnen de Europese Unie, zullen we aan die infrastructuur moeten werken.

Zorg voor de infrastructuur is de taak van de overheid. In taalzaken is die overheid bij ons de Nederlandse Taalunie. Wat doet de Taalunie? Zij neemt uitgebreid de tijd om de zaak te analyseren en verdeelt de problematiek daarbij in drie schillen. Concrete programma's, zoals tekstverwerkers, spraakherkenners en automatische vertalers, horen tot de buitenste schil. Dit zijn in zekere zin de vrachtwagens die over de snelweg rijden. Ze vormen daarom eerder het werkterrein van bedrijven dan van de overheid. De bedrijven zullen moeten beslissen welke elektronische producten ze op de markt brengen en welke diensten ze aanbieden. Voor de overheid zijn de binnenste twee schillen belangrijker. Dit zijn de schillen die het ruwe materiaal leveren waarmee de producten gemaakt kunnen worden.

De allerbinnenste schil wordt gevormd door een aantal gigantische computerbestanden die het Nederlands documenteren: elektronische woordenlijsten, databanken met miljoenen voorbeelden van geschreven en gesproken Nederlands, vertaalwoordenboeken en bestanden met gedetailleerde grammaticale informatie. Al die informatie wordt idealiter zo vormgegeven dat ze door zoveel mogelijk computerprogramma's kunnen worden gebruikt. Zowel de fabrikant van een vertaalmachine als de bedenker van een nieuw soort tekstverwerker moet een databank met representatieve geschreven teksten kunnen gebruiken als testmateriaal: kan mijn programma wel alle soorten Nederlands aan?

Tussen de buitenste en de binnenste schil zit er nog een. Daarin vinden we de zogenaamde 'halffabrikaten' – de stukken software die het mogelijk maken om met de grote taalbanken te werken. Als een computer succesvol met taal om moet kunnen gaan, moeten mensen vooralsnog allerlei informatie aan de tekst toevoegen. Wat voor soort informatie dat is, hangt af van het soort computerprogramma. Wie een vertaalcomputer bouwt van het Nederlands naar het Zweeds, zal minder belangstelling hebben voor de precieze uitspraak van het woord gerechtigheid, terwijl de bouwer van een sprekende computer nu juist minder boodschap heeft aan de vertaling van dat woord in het Zweeds.

Prestige

De binnenste schillen moeten stevig zijn, want ze dragen de buitenste. Maar voor bedrijven is de investering vaak te groot, zonder dat daar een direct voordeel tegenover staat. Wetenschappelijke onderzoeksinstellingen hebben ook weinig belangstelling voor dit soort infrastructurele projecten, want opwindende wetenschappelijke resultaten levert het verzamelen van vele uren met `gewoon' gesproken Nederlands – kletspraatjes bij de bakker, echtelijke ruzies, verkooppraatjes in de autoshowroom – niet op (al kan een goede wetenschapper later misschien veel leren als hij dat materiaal analyseert). Toch willen alle betrokkenen graag dat het werk gebeurt. Daar ligt een taak voor de overheid.

Het werk van de Nederlandse overheid richt zich vooral op de binnenste schil. Zo is onlangs een groot project 'Gesproken Nederlands' gestart, waarin zeer veel onderzoekers en mensen van de overheid en uit het bedrijfsleven samenwerken om een grote databank met tien miljoen gesproken Nederlandse woorden samen te stellen. Deze databank is goeddeels gefinancierd door de Nederlandse en de Vlaamse overheid.

Portugees

Ook een door de overheid gesteunde Commissie Lexicale Vertaalvoorzieningen doet hopelijk nuttig werk. In opdracht van de Vlaamse en de Nederlandse ministers van onderwijs begeleidt deze commissie de ontwikkeling van vertaalwoordenboeken die voor commerciële uitgevers minder interessant zijn: woordenboeken voor etnische minderheden in Nederland en Vlaanderen bijvoorbeeld, of woordenboeken naar de kleinere Europese talen, zoals het Deens of het Portugees. Een ander voorbeeld is de Centrale multifunctionele databank overheidsterminologie, een project om het taalgebruik van de Nederlandse en Vlaamse overheden uniformer en homogener te maken. De databank moet gebruikt kunnen worden door ambtenaren en juristen, maar als het goed is, kan zo'n databank ook gebruikt worden om een vertaalprogramma te maken voor beleidsstukken in de Europese Unie. Op deze manier groeit langzaam maar zeker de binnenste schil. Het gaat niet snel, maar beetje bij beetje worden de fundamenten van de het Nederlandse woordennetwerk gelegd.

Hoe reageren andere Europese volkeren op de nieuwe taalkundige problemen die de elektronische snelweg stelt? Sommige landen pakken het voortvarend aan. Frankrijk loopt in dit soort dingen bijvoorbeeld vaak voorop. Maar ook een klein taalgebied als Denemarken ligt al voor op het Nederlands. In die landen is al aanzienlijk geïnvesteerd in een elektronische infrastructuur voor de eigen taal. Ik hoop dat wij niet achterblijven. Ik hoop dat iedereen zoveel mogelijk zal samenwerken voor een solide infrastructuur. Daar zal iedereen die het Nederlands ter harte gaat uiteindelijk alleen maar bij winnen. Want wie zorgt er voor een Nederlandse rijbaan op de elektronische snelweg, als wij het niet doen?