Comtexxt als perfecte schrijf- en vertaaltool

Dit artikel heb ik geschreven voor Filter, een academisch tijdschrift over vertalen. Het is gepubliceerd op 24-01-2021. Ik heb de tekst hieronder integraal weergegeven en alleen de gedateerde URL’s en e-mailadressen aangepast. Volg deze link om hetzelfde artikel op de site van Filter te lezen.

Volgens het laterale denken van Edward de Bono zou je kunnen zeggen dat een tool voor vertalers niet voor vertalers moet worden gemaakt. Dat is niet zo’n rare uitspraak als het lijkt: als je naar de huidige hulpmiddelen kijkt, vind je genoeg onderbouwing voor een dergelijke stelling. De huidige CAT-tools lijken meer gemaakt voor vertaalbureaus en organisaties dan voor vertalers, en voor zover ik weet, zijn er maar weinig vertalers die er graag gebruik van maken.

Dit artikel gaat niet over CAT-tools maar over hoe een tool voor vertalers eruit zou kunnen zien. Daar denk ik al over na zo lang als ik me met vertalen bezighoud.

Mijn scriptie tijdens mijn studie Vertaalwetenschap ging over de rol van context in vertalen. Rond dezelfde tijd (eind jaren tachtig) heb ik met een studiegenoot een contextbank ontwikkeld. Daarin kon je terminologie in context in twee talen opzoeken.

Tegen terminologie werd destijds als volgt aangekeken: je maakte een record met daarin velden voor een term, een definitie, een bron, een context, synoniemen, gebruiksinformatie, notities en nog een keur aan andere velden. Voor vertalers hoefde daar alleen nog een vertaling van de term aan te worden toegevoegd.

De praktische waarde van dergelijke terminologierecords (geënt op de fiches van voor het computertijdperk) was niet erg groot. Termen kennen immers zelfs binnen één vakgebied soms meerdere definities, en schrijvers volgen die niet altijd exact, niet in de laatste plaats omdat ze er slechts deels mee bekend zijn. Beter is het dan ook om te kijken naar het eigenlijke gebruik van termen. Daar heb je veel context voor nodig, maar daar voorzagen termenbanken nauwelijks in.

Eén context per record is wel erg mager. Ludwig Wittgenstein zei al dat woorden alleen betekenis hebben in de context waarin ze zijn geplaatst, en je hoeft geen talenwonder te zijn om het daarmee eens te zijn. Het gebruik wordt echter pas duidelijk als je meerdere contexten met elkaar vergelijkt. De traditionele indeling van één trefwoord per record is voor dat doel totaal ongeschikt. In plaats daarvan hebben we destijds met onze Contextbank een systeem gebouwd waarmee je op alineabasis op elk woord kon zoeken. Je kreeg minimaal de volledige alinea te zien waarin je zoekterm voorkwam.

In de tweede helft van de jaren negentig ben ik begonnen met de ontwikkeling van txtExpress, een plug-in voor Microsoft Word waarmee je kon zoeken in eerdere vertalingen op zins- of alineabasis met daarnaast een groot aantal functies die het werk van vertalers moesten veraangenamen.

Word stelt zijn objectenstructuur beschikbaar aan de gebruiker, zodat je erin kunt programmeren. Dat bood destijds ongekende mogelijkheden, maar er waren natuurlijk ook beperkingen. Met txtExpress hebben enkele vertalers, waaronder ik zelf, jarenlang naar tevredenheid gewerkt.

Dat dit groepje vertalers nooit groter is geworden, kwam door de beperkingen die een plug-in met zich meebrengt. Het kan zomaar gebeuren dat de software die je schrijft op je eigen computer perfect werkt maar op de computer van een andere gebruiker problemen oplevert. Dergelijke problemen kun je alleen oplossen als je je software volledig in eigen hand houdt. Met een plug-in is dat per definitie onmogelijk want je bent afhankelijk van de maker van de app waar je plug-in in draait.

Necessity is the mother of invention, heeft Plato geloof ik gezegd (niet in het Engels, natuurlijk, maar in het Nederlands is het nooit een gevleugelde uitdrukking geworden). Dus denk ik al een paar jaar na over een zelfstandige app die meer mogelijkheden biedt en die door een grote groep gebruikers kan worden benut.

Het ligt voor de hand dat dat een webapplicatie moet worden. Een webapplicatie is op elk platform te gebruiken (Mac, Windows, Linux, tablet, telefoon). Er hoeft niets te worden geïnstalleerd en je hebt als gebruiker altijd de laatste versie. Online samenwerking is makkelijk in te bouwen als je in een browser werkt, en je hebt automatisch een back-up, zodat je je werk nooit meer kunt kwijtraken.

De naam van deze conceptapp (die voor een groot deel is gebaseerd op het reeds bestaande txtExpress) is Comtexxt. We hebben nagedacht over wat er allemaal in moet en hoe een en ander eruit moet zien, en er is een softwarebureau dat zich over de functionaliteit en de interface heeft gebogen. Moeilijk te maken is het allemaal niet, maar daar is wel geld voor nodig. Over mogelijkheden voor de financiering denken we nog na, en aan de promotie als de app er straks is, moeten we ook nog wel een paar gedachten wijden.

Maar ik loop op de zaak vooruit. Vertalers die dit artikel lezen, zullen vooral willen weten of ze iets aan een app als Comtexxt hebben. Denk je aan een app voor vertalers, dan denk je al snel aan CAT-tools zoals SDL Trados. Hun verkoopargument voor freelancers is dat je met hun product nooit dezelfde zin twee keer hoeft te vertalen. Dat klinkt mooi, maar hoe vaak kom je dezelfde zin tegen in een literaire vertaling? Of in non-fictie? Of in een financiële analyse?

Er zijn zeker teksten die veel herhaling en zogenaamde fuzzy matches bevatten, maar nog veel meer teksten waar dat niet het geval is. Zou je bij het vertalen van dergelijke teksten niet ook baat kunnen hebben bij een goede app? Natuurlijk, maar zo’n app zou dan andere functionaliteit moeten bieden dan de huidige hulpmiddelen.

Een greep uit de mogelijkheden:

  • Zoeken in eerder vertaalde teksten. Dat kunnen de huidige CAT-tools ook, maar de zoekmogelijkheden zijn nogal rudimentair. Zo kun je geen booleaanse operatoren als AND, OR en NOT gebruiken en behoren ook regular expressions, waarmee je zeer gericht kunt zoeken, niet tot de mogelijkheden. Als je zoekt, heb je meestal wel een idee van wat je wilt vinden. AI (artificial intelligence) zou je daarbij kunnen helpen.
  • Zoeken op zowel zins- als alineaniveau. In CAT-tools kun je alleen op zinsniveau zoeken. Er is echter geen reden waarom een app niet beide mogelijkheden zou kunnen bieden.
  • Als je in eerdere vertalingen wilt kunnen zoeken, moet je deze wel eerst hebben opgeslagen. Als je in de app vertaalt, gebeurt dat opslaan automatisch. Vertaal je in een andere app of wil je eerder vertaalde teksten erin opnemen, dan zul je die moeten aliniëren. txtExpress bevat al een zeer handige alinieerfunctie, die in Comtexxt nog handiger zal worden uitgewerkt. Weliswaar zijn er tools die je teksten volledig automatisch aliniëren, maar het is onvermijdelijk dat daar fouten in sluipen. We zorgen ervoor dat aliniëren met Comtexxt een snel en pijnloos proces wordt.
  • Behalve in vertaalde teksten zoek je als vertaler doorlopend naar allerhande informatie. Daarbij kun je denken aan:
    • Terminologie
    • Synoniemen (zie hieronder (1) )
    • Collocaties (zie hieronder (2) )
    • Stijlvoorschriften
    • Context
    • Eigen notities
  • Tekstanalyse: denk aan aspecten als woordfrequentie, zinslengte, stijlkenmerken enz.
  • Spelling-, grammatica- en stijlcontrole.
  • Revisie: meerdere versies van teksten bijhouden en teksten met elkaar vergelijken.
  • Tekstvoorspelling: met behulp van AI kan de app aan de hand van een uitgebreid woordenboek en zowel de teksten in je database als de tekst waar je op dat moment aan werkt voorspellingen doen over het volgende woord of de volgende frase. Dat betekent ook dat je een woord zelden helemaal hoeft te typen en dat je minder spelfouten maakt. En het betekent natuurlijk ook dat je sneller kunt werken.
  • Bookmarks: plekken in je tekst waarnaar je makkelijk wilt kunnen terugkeren. Word heeft bijvoorbeeld een bookmarkfunctie maar die vereist zoveel klikken dat het de moeite niet loont om er gebruik van te maken. In txtExpress kost een nieuwe bookmark maken en ernaartoe gaan slechts twee toetsaanslagen.
  • Conversie van teksten naar andere formaten, zoals html. Steeds meer teksten worden uitsluitend voor het web geschreven. Met behulp van een simpele codering zoals Markdown worden vorm en inhoud gescheiden en kun je teksten in één conversieslag voor publicatie op meerdere platforms geschikt maken.
  • Een keur aan handige tekstbewerkingsfuncties. Tekstverwerkers zijn gemaakt voor de grootste gemene deler, en de makers laten veel functionaliteit weg om te voorkomen dat gebruikers door de bomen het bos niet meer zien. Dat is alleszins begrijpelijk, maar vertalers (en ook schrijvers en redacteuren) zouden gebaat zijn bij wat meer mogelijkheden, zoals:
    • Een functie die het huidige woord automatisch selecteert, waarbij het niet uitmaakt of de cursor zich voor, achter of in het woord bevindt. Computers zijn tenslotte gemaakt om werkzaamheden te automatiseren, en vooral handelingen die je heel vaak uitvoert, zijn daar geschikt voor.
    • Is een woord eenmaal geselecteerd, dan wil je er iets mee doen. Ook dat wil je graag zo snel en makkelijk mogelijk. Vertalers zoeken continu op het web en in eigen naslagwerken naar informatie. Als je middels een toetsaanslag een menu krijgt voorgeschoteld met op maat gemaakte zoekmogelijkheden, hoef je vervolgens alleen op de bijbehorende letter te drukken om het huidige woord automatisch te laten selecteren en op het web of in een naslagwerk op je computer op te zoeken. Dat bespaart je veel tijd.
    • Zoeken en ook vervangen vereisen vaak veel handelingen. Je moet een zoekveld of zoekvenster openen, een zoekterm opgeven en een manier van zoeken kiezen. Dat kan veel makkelijker en sneller, en zonder dat er een venster hoeft te worden geopend. Voor de meeste zoekopdrachten is één toetsaanslag voldoende, en als je complexe vervangingen wilt uitvoeren, is een hulpmiddel als regular expressions onontbeerlijk.
    • Er zijn nog veel meer tekstverwerkersfuncties te noemen, maar dan wordt dit artikel te lang.
  • En last maar zeker not least moet er met de ontwikkeling van een CAT-tool rekening mee worden gehouden dat de behoeften van vertalers zeer kunnen verschillen. Als zo’n tool een scripttaal biedt waarmee gebruikers zelf functionaliteit kunnen toevoegen, vergroot dat de waarde aanzienlijk, zeker als die toevoegingen ook nog met andere gebruikers kunnen worden gedeeld.

Dit artikel is te kort voor een uitputtend overzicht van de functionaliteit, maar er is nog veel meer over te zeggen, en bovendien kunnen nieuwe inzichten weer nieuwe opties opleveren.

(1) Je zou vertalen kunnen omschrijven als zoeken naar synoniemen in een andere taal. Daarbij ga je voorbij aan heel veel wat vertalen nog meer is, maar uit mijn eigen vertaalpraktijk weet ik dat ik doorlopend naar synoniemen zoek. Dan is het teleurstellend dat synoniemenwoordenboeken zich grotendeels beperken tot synoniemen die uit één woord bestaan, terwijl deze vaak uit meerdere woorden of zelfs een hele zin kunnen bestaan.

Dit zijn bijvoorbeeld de synoniemen van “winnen” in txtExpress:

aftroeven, als beste uit de bus komen, als winnaar uit de bus komen, bedwingen, de eerste plaats behalen, de eerste prijs in de wacht slepen, de eerste prijs voor iemands neus weg kapen, de erepalm wegdragen, de hoogste plaats scoren, de loef afsteken, de overwinning behalen, een einde maken aan de heerschappij van, een gelopen race, een monsterzege behalen, een overwinning op je naam schrijven, een straatlengte voorliggen, een voorsprong hebben, het leek erop dat ze alweer een tijdje aan de winnende hand waren, iemand van de troon stoten, iemand zijn verdiende loon geven, iemand zijn vet geven, in het stof doen bijten, in je voordeel beslechten, inmaken, kloppen, krijgen wat je toekomt, lichtjaren vooruit zijn, met de eer gaan strijken, met de hoofdprijs naar huis gaan, onderdrukken, overtroeven, overwinnen, slaan, smadelijk verslaan, triomfen vieren, triomferen, uitverkoren zijn, van de eerste plaats verdringen, verdienen, verslaan, voorliggen, winnen, zegevieren

De synoniemenzoeker van txtExpress wordt overgenomen in Comtexxt en is door gebruikers aan te passen dan wel aan te vullen en te delen.

(2) Een collocatiewoordenboek bestaat bij mijn weten voor het Nederlands niet. Collocaties kun je ook via bestaande teksten en via Google achterhalen. Dat is alleen wel bewerkelijk. Als je via Google zoekt, moet je elke webpagina apart openen en dan nog keer naar je zoekterm zoeken. In txtExpress typ je een zoekterm in krijg je meteen een lijst voorgeschoteld:

  • contact leggen
  • contact maken
  • contact onderhouden
  • contact tot stand brengen
  • contact zoeken
  • een intiem contact
  • het contact verbreken
  • in contact staan met
  • persoonlijk contact
  • onderlinge contacten
  • contact opnemen met…
  • in contact treden

Ook de collocatiezoeker van txtExpress wordt in Comtexxt ingebouwd en kan door gebruikers worden aangevuld en gedeeld.

Een app met zoveel functionaliteit moet wel een heel drukke interface krijgen, zul je misschien denken. Dat hoeft helemaal niet. Je kunt zelfs met een geheel leeg scherm werken en alleen functies te zien krijgen als je dat wilt.

Aan de andere kant vinden sommige gebruikers het prettig om altijd een overzicht van de functionaliteit in beeld te hebben. Met een paar simpele instellingen kun je de interface precies zo instellen als je dat prettig vindt.

Nog even terug naar Edward de Bono. Als je stelt dat een app voor vertalers niet voor vertalers hoeft te worden gemaakt, zou je bijvoorbeeld kunnen concluderen dat vertalen, schrijven en redactie veel met elkaar gemeen hebben.

Schrijvers zoeken voor een groot deel dezelfde informatie als vertalers en zijn er zeker bij gebaat makkelijk in bestaande teksten te kunnen zoeken. Daarom richten we ons met Comtexxt niet alleen op vertalers maar ook op schrijvers en iedereen die beroepsmatig of semi-beroepsmatig met tekst werkt.

Wat is er nog nodig? Ten eerste financiering. Programmeurs moeten ook eten en krijgen graag betaald voor hun werk. Een app als Comtexxt ontwikkelen, kost tijd en geld. Financiering is ook nodig voor de promotie als de app er eenmaal is, en we zoeken ook mensen die daar verstand van hebben.

Mocht je zin hebben om mee te denken, dan kun je contact opnemen via de contactpagina.

Theo van der Ster heeft Vertaalwetenschap gestudeerd aan de UvA en werkt al 30 jaar als freelance vertaler in uiteenlopende vakgebieden. Daarnaast houdt hij zich bezig met grafisch ontwerpen, schrijven en programmeren.


Copyright © 24-1-2021 Theo van der Ster

De reacties onder dit blogbericht zijn gesloten. Wil je contact opnemen, dan kan dat op deze pagina.