Engelse teksten machinaal omzetten naar Frans geeft helemaal geen slecht resultaat, waar het wordt anders als die tekst vertaald moet worden naar het Tsjechisch, Fins en zelfs Duits. Dat levert vaak vrij onbegrijpelijke teksten op. Diverse onderzoeksgroepen in Europa willen zich werpen op het verbeteren van machinevertaling, zodat vertaling tussen de 24 EU-talen op zijn minst begrijpelijke teksten oplevert. De Europese Unie betaalt.
Wie Fins wil leren krijgt te maken met vijftien naamvallen. Die naamvallen worden deels zichtbaar gemaakt in het zelfstandige naamwoord, waardoor een veelheid aan woordvormen en uitdrukkingsmogelijkheden ontstaat. “Dat een computer bijbrengen is uiterst lastig”, zegt Josef van Genabith, hoogleraar vertaaltechnologie aan de universiteit van Saarland, een van de deelnemers aan het EU-project. Zijn onderzoeksgroep volgt een ander spoor. De computer krijgt niet de grammaticale regels ingestampt, maar haalt zijn kennis door te leren uit zo veel mogelijk teksten, een aanpak die Google al jaren gebruikt.
“Dat machinaal leren of kunstmatige intelligentie heeft niets met menselijke intelligentie te maken”, zegt van Genabith. “Het lijkt meer op het proces hoe spieren aangestuurd worden. Een kind moet in een bos leren zijn voeten op te tillen om niet over wortels en stenen te struikelen. Bij volwassenen gaat dat vanzelf, omdat de hersens dat geleerd hebben.” Iets soortgelijks zou ook bij een computer moeten lukken. Het gaat dan bij de machinevertaling niet om structuren, zoals een kind op school leert, maar om het hanteren van voorbeelden.
Aan het QT 21-project doen veertien onderzoeksinstituten on Europa en Hongkong mee, waaronder die van bedrijven. “het gemeenschappelijke doel is het machinevertalen ook voor ingewikkelde talen als het Lets en het Tsjechisch te verbeteren”, zegt de ki-hoogleraar, die tevens projectleider is. Voor het driejarige project, dat al een jaar loopt heeft de EU een schamele € 3,9 miljoen uitgetrokken (waarvan bijna een kwart naar Saarland gaat).
IJsland en Noorwegen
In een tweede vertaalproject, ELRC, werken onderzoekers aan een opdracht van de Europese commissie aan vertaalfaciliteiten voor de EU-landen en voor IJsland en Noorwegen. Het zou om een van de omvangrijkste verzamelingen van taalgegevens in de wereld gaan. Ook daarbij is Van Genabith betrokken. “We zijn bezig met grote tekstbestanden en vertalingen op allerlei terrein van allerlei ministeries in de Europese landen. Daarmee worden ter lering vertaalsystemen gevoed en daaruit moeten de behoeftes van de overheidsdiensten en van de burgers op elkaar afgestemd worden.” Dit project heeft een looptijd van twee jaar en kost € 1,7 miljoen.
Die verbeterde machinevertalingen zouden ook dienstig moeten zijn voor de intra-Europese handel. Dat betekent overigens niet dat de tolken en vertalers binnenkort werkeloos zullen zijn. Van Genabith: “Integendeel. Computers kunnen grote tekstbestanden veel sneller vertalen dan mensen, maar ze zullen nooit perfect zijn. Vertalers zullen die onaffe teksten moeten nabewerken.” Leuker zal het er voor de vertalers niet op worden.
Bron: Alpha Galileo