Kopje duikelen of koppeltje duiken?

Het begon vanmorgen met een stuk op Neerlandistiek van de hand van Marc van Oostendorp. Hij op zijn beurt verwijst naar een tweet van Michelle van Dijk, waarin zij vertelt dat ze de vorm ‘kopje duikelen’ tegenkwam in een boek. Beiden verbazen zich over die vorm: Marc zegt zelfs dat dit “heel raar” klinkt en zelfs “geen goed Nederlands” is. Een verbazingwekkende opmerking voor een taalwetenschapper (misschien is het ironisch): ik heb geleerd om in het aanschijn des variaties die te verklaren, of althans een poging daartoe te doen. Dat zal ik dan maar doen. En passant geeft deze casus een mooi inzicht in verschillende methodes die in de taalwetenschap worden gebruikt.

Wat vind ik zelf?

Data kun je op allerlei manieren verzamelen, maar in de taalwetenschap komen, kort door de bocht gezegd, vier methoden het meest voor. Over (1) experimenten heb ik het even niet. Methode (2) je eigen taalgevoel is de methode die Marc lijkt toe te passen. Dat werkt zo: als je een vorm tegenkomt, dan kijk je hoe die past binnen jouw eigen taalgevoel. Wat zeg ik? Zou ik dit kunnen zeggen? Op basis hiervan kun je uitspraken doen over je eigen taalgevoel. Er zijn ook mensen die op basis van hun eigen taalgevoel categorische uitspraken doen over bijvoorbeeld het Nederlands. Ik schreef daar bijvoorbeeld over met betrekking tot verreweg de grootste/de verreweg grootsteIk vind dat vaak problematisch: er is volgens mij niemand die zó representatief is voor de Nederlandse spraakgemeenschap (zelfs niet voor dat deel dat Standaardnederlands spreekt/schrijft) dat je met zo’n pars pro toto kunt werken. Je taalgevoel is een goed beginpunt, maar geen goed eindpunt, IMHO.

Wat vinden anderen?

Bij methode (2) vraag je dus: gebruik ik deze term? Dit is natuurlijk heel makkelijk op te schalen, en zo kom je bij methode (3): surveys/vragenlijsten. Je vraagt dan simpelweg aan andere mensen wat ze doen. Dat kan heel gestructureerd, of informeel, zoals op Twitter, zoals Michelle van Dijk zelf deed. Op haar tweet reageerden 68 mensen, waarvan er zich 57 uitspreken (expliciet of impliciet) over de kwestie. Op basis hiervan is de voorkeur duidelijk: 53 respondenten (ahum) zeggen koppeltje duikelen; slechts vier zeggen kopje duikelen. Het lijkt dus alsof het taalgevoel van Marc en Michelle overeenkomt met dat van het merendeel van deze volstrekt willekeurige steekproef van taalgebruikers. Dit zegt natuurlijk niet dat kopje duikelen geen goed Nederlands is, alleen dat blijkbaar minder mensen het gebruiken.

Ik zeg wat ik denk dat ik doe?

Helaas is deze aanpak niet zonder problemen. Wat mensen namelijk doen, en wat ze dénken dat ze doen, daar kan weleens een groot verschil tussen zitten. Mensen kunnen bijvoorbeeld sociaal wenselijke antwoorden geven (social desirability bias). Ze doen dat vooral over onderwerpen die ongemakkelijk zijn, of waar een taboe omheen hangt. Het gebruik van vloekwoorden is een goed voorbeeld. Bij kopje/koppeltje duikelen lijkt op het eerste gezicht weinig aan de hand, maar de originele vraagsteller maakt al wel duidelijk wat voor haar de gebruikelijke vorm is. Dat kan mensen sturen in hun antwoord. Ik zeg niet dat het gebeurt, maar je kunt het niet uitsluiten, en dat maakt de data verdacht.

Maar vragen wat mensen vinden is ook op een andere manier problematisch: als je mensen confronteert met een taalvorm, dan kunnen ze zelf gaan twijfelen over wat ze gebruiken. Dat wordt in het geval van kopje/koppeltje duikelen mooi geïllustreerd door deze tweet:

Dit laat goed zien dat wat je nu zegt en wat je misschien doet wel kan verschillen. Overigens komt dit ook leuk voor bij bijvoorbeeld spelfouten: eindeloos zijn de mensen die zeggen nooit een ‘taalfout’ te maken, om vervolgens toch de een of andere norm te overtreden. Onderbewust en bewust, het is nou eenmaal niet altijd hetzelfde. Zie hier voor nog allerlei andere valkuilen.

Kijken wat er gebeurt

Het lijkt nu alsof ik bovenstaande methodes volstrekt veroordeel. Dat is zeker niet zo: ze hebben allebei hun nut, en het overzicht dat ik hier geef is beperkt. Toch ben ik zelf meer overtuigd van een andere methode, nummer (4): kijken wat er gebeurt (ook wel corpustaalkunde genoemd). Dat klinkt triviaal, maar dat is het niet. Het is zelfs controversieel, afhankelijk van de taaltheorie die je aanhangt, maar dat is een ander verhaal. Wat je doet bij methode 4 is een tekst of verzameling teksten pakken en een vorm opzoeken. Welke vorm komt er nou daadwerkelijk voor? Als je verzameling teksten mooi gebalanceerd is en representatief voor een taalgebied (dat is eigenlijk nooit écht zo, maar je kunt het benaderen), dan kun je zelfs makkelijk extrapoleren: dat is hoe inferentiële statistiek werkt.

Kopje duikelen of koppeltje duikelen?

Nu is natuurlijk de vraag: wat zegt deze methode over het voorkomen van kopje/koppeltje duikelen? Helaas zijn er nauwelijks goede corpora van het Nederlands beschikbaar: de corpora die we hebben zijn over het algemeen niet representatief en bevatten eindeloos veel onleesbare woorden en zinnen (ik schreef er al eerder over). Daarom doe ik geen uitspraken over het Nederlands als geheel: ik beschouw deze aanpak ook als beginpunt, niet als eindpunt.

Ik gebruikte hiervoor het grootst beschikbare corpus, Corpus of the Web (COW). Dat corpus bevat ongeveer 7 miljard woorden aan schone data (hoera!), die allemaal van het internet is gehaald. Boeken, websites, chats, van alles. Het is dus niet representatief, maar het is in ieder geval groot. Ik zocht daarin op alle vier de mogelijke varianten, en dat leverde de volgende frequentietabel op:

  ruwe frequentie % van geheel (n=171)
kopje duiken 3 1,8
kopje duikelen 54 31,6
koppeltje duiken 50 29,2
koppeltje duikelen 64 37,4

Ik kan niet anders zeggen: wat een heerlijk interessante resultaten. Koppeltje duikelen is inderdaad de meestvoorkomende vorm, maar kopje duikelen en zelfs koppeltje duiken komen beide ook in bijna een derde van de gevallen voor! Kopje duiken lijkt in maar één bron voor te komen: dat is interessant, maar lijkt een geval van persoonlijke variatie. Zowel bij kopje/koppeltje als bij duiken/duikelen is dus variatie, en dat is opvallend. Nogmaals, verstrekkende conclusies trek ik hier niet uit, maar het is in ieder geval een opvallende aanvulling op de surveydata van Twitter. Overigens leverden andere corpora erg weinig hits op: Corpus Hedendaags Nederlands had 2x koppeltje duikelen; SoNaR had 2x kopje duikelen en 5x koppeltje duiken, maar ook één keer koppel duiken en één keer koppetje duiken.

Kortom: het motto dat ik aanhang sinds ik begon te schrijven met Milfje (zeg niet ‘wat dom’ maar ‘waarom’) levert als altijd mooi resultaat op, want de wereld is gevarieerder dan we dachten. De waarom-vraag, die laat ik nu nog onbeantwoord: ik moet maar eens aan het werk. Werk dat voor een belangrijk deel bestaat uit precies dit doen: taaladviezen doen uitspraken over hoe raar iets is, of dat iets nooit voorkomt. Aan mij de schone taak om te kijken wat er daadwerkelijk gebeurt.

Een gedachte over “Kopje duikelen of koppeltje duiken?

Plaats een reactie