Deze Nederlander kan – namens Oman – meebeslissen over uw emoji

Het Unicode-consortium bepaalt hoe digitale tekst tot u komt – en welke emoji er komen. De grote Amerikaanse techbedrijven zitten erin. En een Nederlander die het ministerie van Religieuze Zaken van Oman vertegenwoordigt. Hoe dat zo?

Een videovergadering met ongeveer 25 mensen in een grid. Ze werken voor aartsrivalen als Apple en Google, maar hier zitten ze gebroederlijk naast elkaar.

Op de agenda? Niet werelddominantie, maar wel iets wat nagenoeg de hele wereld gebruikt: digitale tekst.

Dit is een vergadering van het Technical Committee van het Unicode Consortium. Wat daar precies besproken wordt, is geheim. Zeker is dat het gevolgen heeft voor bijna iedereen op de planeet, ook al heeft u misschien nog nooit van Unicode gehoord. Het consortium bepaalt namelijk hoe computers schrift verwerken.

Zo is ooit vastgelegd dat de hoofdletter A als code U+0041 heeft. Elke computer weet wanneer hij U+0041 ziet: hier moet ik een hoofdletter A tonen. En daardoor krijgt een Samsung-gebruiker precies de tekst te zien die een vriend hem heeft gestuurd vanaf een iPhone.

Bestaat er van een teken in een bepaald schrift nog geen code? Dan kunnen de meeste programma’s er ook niet mee overweg, en krijg je een vierkantje of een vraagteken te zien. Ook bepaalt Unicode jaarlijks welke nieuwe emoji’s worden opgenomen in het systeem.

Grote invloed

Daarmee heeft het consortium grote invloed op onze digitale communicatie. Het is echter geen overheid. Slechts negen organisaties zijn lid op het hoogste niveau en mogen dus over de meeste zaken meebeslissen: de techgiganten Apple, Google, Microsoft en Facebook, aangevuld met de computerbedrijven Adobe, IBM, SAP en streamingdienst Netflix. O, en het ministerie van Religieuze Zaken van het sultanaat Oman.

Oman? Waarom Oman?

Dat is de verkeerde vraag, vindt Thomas Milo (1950), een Nederlandse taalkundige en pionier op het gebied van digitale tekst, die namens de Golfstaat zitting heeft in het consortium. Een betere vraag is: waarom zijn niet meer landen lid?

Dat de Amerikanen de overhand hebben in Unicode, is niet gek als je naar de geschiedenis kijkt, zegt Milo. ‘De oorsprong ligt in de Koude Oorlog. De Amerikanen waren toen bang dat de Russen ze in één klap konden uitschakelen als alle informatie op één centrale plek opgeslagen stond. Daarom begonnen ze met een netwerk van computers verspreid door het land.

‘Die computers moesten met elkaar kunnen communiceren. Daar hadden ze maar 26 letters voor nodig: de hoofdletters van het Engelse alfabet. Want als de wereld op het punt staat vernietigd te worden, is dat genoeg. Uiteindelijk werd dat met kleine letters, cijfers en leestekens uitgebreid tot coderingsstandaard ASCII: zo’n honderd tekens waarmee je alle Amerikaanse teksten kunt schrijven.

‘Toen computers de wereld over gingen, dachten de Amerikanen dat iedereen wel Engels zou leren. Dat was natuurlijk niet zo. En dus moest de code uitgebreid worden. De internationale standaardiseringsorganisatie ISO kwam met een voorstel: 1,2 miljoen plekken voor karakters. Chinees, Arabisch: alles zat erin.

Doublures

‘Maar het ISO-systeem was veel te groot voor de toenmalige computernetwerken. Om de gevoeligheden tussen China, Japan en Korea te vermijden, had ISO hun allemaal eigen karakters gegeven. Daar zitten enorm veel doublures in, waardoor het systeem veel te groot werd. Het was alsof je met een vrachtwagen van 32 meter hoog op een snelweg onder viaducten van hooguit 8 meter hoog wilde rijden.

‘Dat was onbruikbaar en daarom kwam de computerindustrie eind jaren tachtig met een eigen alternatief. De doublures verdwenen door Chinees, Japans en Koreaans samen te voegen, een technische truc waardoor het systeem wel door de tunnels van het internet past. Dat werd Unicode.’

Oman is op aanbevelen van Milo lid geworden van Unicode. Voor dat land maakte hij met zijn bedrijf DecoType een digitale versie van de Koran, die zo veel mogelijk moet lijken op het papieren origineel. Maar het traditionele Arabische schrift dat daarin staat, is niet met gewone software te typen. Niet alle benodigde karakters zijn namelijk goed in Unicode opgenomen.

Dat probleem speelt ook in het Nederlands, zegt Milo. De letter ‘ij’ ontbreekt namelijk in het systeem. Om te bewijzen dat dat niet gewoon een ‘i’ en een ‘j’ achter elkaar is, houdt hij een dossier bij. Op zijn Facebookprofiel heeft hij een mapje met foto’s van uithangborden van ijssalons, plaatsnaamborden en logo’s. ‘Neem het Stedelijk Museum Amsterdam, dat heeft als logo zijn naam in de vorm van een ‘S’. Alle letters staan op een eigen hoogte, maar de ‘ij’ staat bij elkaar.’ En geen Nederlander zal ooit ‘Ijsselmeer’ schrijven.

Maar is dat nou erg, als je een ‘ij’ kunt maken met een losse ‘i’ en ‘j’? ‘Wel voor bijvoorbeeld vertalingen van plaatsnamen,’ zegt Milo. ‘Als je Google Maps opent op een Arabische iPhone, krijg je alle Nederlandse plaatsnamen in Arabisch schrift te zien. Maar een plaats als IJsselstein wordt dan ‘Idzjelstajn’, omdat Unicode de IJ als een ‘I’ en een losse Engelse ‘J’ ziet.

‘Alle beschaving, alles wat met kennis te maken heeft en aan de toekomst doorgegeven moet worden, gaat via schrift. En al het schrift gaat via Unicode. En dat systeem is niet breder dan wat door een comité wordt goedgekeurd. Vroeger regelde elke beschaving zijn eigen papyrus en klei en konden ze gaan schrijven. Nu kun je digitaal alleen meekomen als je in Unicode zit.

Koran

‘Unicode is opgericht vanuit een zakenbelang, om Amerikaanse computers wereldwijd te kunnen verkopen. Het is een soort Conventie van Genève voor techbedrijven. Soms lossen ze in de wandelgangen problemen op die ze in een andere context niet kunnen bespreken.

‘Maar het doel is niet het doorgeven van kennis. Ik kon bepaalde dingen voor de Koran niet via Unicode geregeld krijgen, terwijl dat toch niet het minste document is met 2 miljard gebruikers. Dan krijg je de lange ‘ij’ er al helemaal niet door. Tinder is vertegenwoordigd, de Nederlandse Taalunie niet. Ik denk dat de Nederlandse staat voor zoiets belangrijks best de portemonnee mag trekken.’

Lidmaatschap van Unicode staat open voor wie ervoor wil betalen. ‘Full member’ worden kan voor bijna 18 duizend euro per jaar, maar als individu kun je al lid worden voor 64 euro. Meestemmen mag je dan niet, meepraten wel.

Emoji

Elk jaar bepaalt Unicode welke nieuwe emoji er worden toegevoegd. Die icoontjes zijn namelijk geen afbeeldingen, maar krijgen als karakter een eigen nummer in het systeem. Zo zijn dit jaar de transgendervlag en een icoon van een muntstuk toegevoegd. ‘Het grappige is dat dezelfde specialisten die zich over oud-Hebreeuws of middeleeuws Koreaans buigen, zich ook bezig houden met de kleurtjes van de politieagent en de opgestoken middelvinger,’ zegt Milo.

Emoji kunnen ook politiek zijn. Zo is de officiële vlag van Belarus groen-rood. Die wordt gebruikt door aanhangers van het regime van president Aleksandr Loekasjenko. Demonstranten gebruiken een rood-witte vlag die te herleiden is naar de tijd van voor de Sovjet-Unie. Unicode hanteert de groen-rode variant, maar wanneer je die in de door de oppositie veelgebruikte chatapp Telegram verstuurt, wordt er automatisch een wapperend rood-wit exemplaar overheen geplakt.

Bedankt voor het lezen! Ik hoor graag wat je ervan vindt. Neem gerust contact met me op.

Dit artikel verscheen oorspronkelijk in de Volkskrant op 16 oktober 2020.