Jak dokładne są tłumaczenia maszynowe wykonywane przez dedykowane programy?
Artykuł niniejszy powstał na kanwie wniosków i uwag zawodowego tłumacza medycznego wniesionych do maszynowego tłumaczenia artykułu naukowego z zakresu medycyny, ściśle endokrynologii. Była to translacja z języka polskiego na język angielski przy pomocy komercyjnej wersji programu tłumaczącego DeepL. Ogólne wrażenie, jakie wywarł program na weryfikatorze było sporym zaskoczeniem in plus. Sztuczna inteligencja (po angielsku artificial intelligence, w skrócie AI) świetnie poradziła sobie z wieloma aspektami translatoryki. Ba, można wręcz wyróżnić wiele przewag AI nad człowiekiem-tłumaczem.
Zalety tłumaczeń maszynowych
Brak pominięć w tłumaczeniu maszynowym DeepL
W tłumaczeniu maszynowym (po angielsku machine translation) rzeczonego artykułu naukowego nie było żadnych pominięć, które nierzadko mają miejsce w transpozycjach tekstu na język drugi wykonywanych przez spory odsetek ludzi (po angielsku human translations), w tym również zawodowych tłumaczy przysięgłych. W ślad za łacińską sentencją Errare humanum est nie istnieją bowiem ludzie nieomylni. Zmęczenie, znużenie, gorszy dzień etc. powodują, że tłumaczowi-człowiekowi zdarzy się pominąć pojedyncze słowo, zdanie czy nawet cały akapit w tłumaczeniu. Zwyczajnie w swej nieroztropności nie zauważy fragmentu tekstu i w tłumaczeniu będą braki. Natomiast maszyna się nie męczy, „zawsze jest wyspana” i się nie myli w zakresie, w jakim została zaprogramowana.
Fenomenalna interpretacja akronimów w tłumaczeniu maszynowym
Kolejną zaletą tłumaczenia medycznego wykonanego przez maszynę jest fakt, iż potrafi ona przełożyć poprawnie akronim (skrótowiec) w języku polskim na tożsamy akronim w języku angielskim, orientując się doskonale w otoczeniu kontekstowym, w którym on wystąpił zarówno w zdaniu, jak i w szerszym kontekście, akapitu jak również całego tekstu artykułu. Przykładowo program DeepL od razu bezbłędnie zamienia skrótowiec OB (odczyn Biernackiego) na ESR (erythrocyte sedimentation rate, dosłownie „szybkość opadania krwinek czerwonych”). Z racji tego, iż tłumaczenia artkułów naukowych z dziedziny medycyny obfitują, ba, zwykle wręcz naszpikowane są akronimami medycznymi, taka funkcjonalność tłumaczeń maszynowych niesamowicie skraca czas pracy tłumacza medycznego podczas postedycji tłumaczenia maszynowego. Postedycja tłumaczenia maszynowego to nic innego, jak tylko poprawa przez człowieka błędów tłumaczenia wygenerowanego przez program, To inaczej wygładzenie tekstu, z wnikliwą analizą porównawczą z tekstem źródłowym, bardzo ważny etap pracy z tekstem. Inaczej to weryfikacja tłumaczenia maszynowego przez człowieka.
Doskonała analiza i interpretacja drobnych przejęzyczeń i błędów literowych przez program do tłumaczeń maszynowych DeepL
DeepL jest w stanie poprawnie interpretować słowa, które mają błędną pisownię w tekście źródłowym przeznaczonym do tłumaczenia, gdzie pominięto lub przekręcono jedną, dwie bądź trzy litery. Genialnie wręcz wyłapuje z szerszego kontekstu poprawne brzmienie słowa i przeważnie proponuje trafne jego tłumaczenie. Domyśla się znaczenia błędnego słowa od razu. Człowiek-tłumacz niejednikrotnie musiałby się zastanawiać, co pochłaniałoby czas. W tym zakresie weryfikator może zaoszczędzić cenną energię i czas.
Nienaganna składnia angielskich zdań, naturalność języka oraz stosowanie bogatych i trafnych związków frazeologicznych przez maszyny tłumaczące
Można odnieść wrażenie, iż niejeden zawodowy tłumacz-człowiek nie potrafiłby budować tak pięknych, trafnych i obfitujących w rozmaite związki frazeologiczne zdań w swoim tłumaczeniu z polskiego na angielski, co program DeepL. Zdania są krótkie, proste, lecz niesłychanie trafnie oddające znaczenie oryginału w języku polskim.
Poprawna interpretacja przeplatanki polsko-angielskiej przez program do tłumaczeń maszynowych DeepL
Maszyna DeepL potrafi poprawnie interpretować typową składnię zdań przygotowaną przez naukowców, którzy korzystają zarówno ze źródeł polsko-, jak i anglojęzycznych, przygotowując manuskrypt do tłumaczenia jako mieszaninę fragmentów w języku polskim i języku angielskim. Takie mieszanie języków może dotyczyć zarówno odrębnych zdań, jak i fragmentów wewnątrz pojedynczego zdania. DeepL poprawnie składa takie zdania w monolity w języku angielskim. Niesamowite!
Mankamenty tłumaczeń maszynowych
Na przykładzie programu DeepL wśród wad tłumaczeń maszynowych można wyróżnić ewidentne braki programistyczne, czyli te aspekty, które należałoby doprecyzować w pracowni programistów.
Proste błędy językowe maszyny tłumaczącej
Czasem będą to oczywiste, proste błędy, a czasem niedokładności wynikające z braków pojedynczych pojęć terminologii fachowej w bazie programu w kontekście tłumaczeń tekstów specjalistycznych, choćby tłumaczeń medycznych.
Niewłaściwe terminy fachowe w tłumaczeniach maszynowych DeepL
Wówczas maszyna tłumacząca podaje słowo funkcjonujące w języku potocznym zamiast użyć terminu medycznego bądź innego pojęcia specjalistycznego.
Brak synonimizowania w tłumaczeniach maszynowych
Tłumaczenie artykułu naukowego wykonane przez maszynę DeepL bardzo łatwo można rozpoznać po tym, że stosuje ubogie słownictwo i zwykle na ten sam sposób tłumaczy daną frazę, np. „W dodatku”, „Ponadto” spójnie tłumaczy na język angielski jako „In addition” w obrębie całego artykułu naukowego. Zatem w przekładzie może wystąpić nawet 10 razy fragment „In addition” i ani razu jego synonimy w brzmieniu „Moreover„, „Additionally„, „Furthermore„, „Apart from that” czy „Besides„.
Drugim klasycznym przykładem pozwalającym rozpoznać tekst artykułu naukowego bądź studium przypadku medycznego w języku angielskim jako tłumaczenie maszynowe z języka polskiego jest przesadne użycie sformułowania „A study showed” etc. wszędzie, gdzie to tylko możliwe. Badnie mogło coś wykazać, ujawnić, zademonstrować, udokumentować etc., a nie tylko „pokazać”. Zatem w profesjonalnych tłumaczeniach naukowych należałoby zastosować synonimiozowanie owej myśli przy pomocy następujących sformułowań: „Our/My study (…) demonstrated, revealed, documented, found, shed the light to” itd. Występuje cała masa pięknych i wyjątkowych synonimów służących do wzbogacenia języka i uczynienia tekstu piękniejszym. Tłumaczenia maszynowe demonstrują w tym zakresie bardzo ograniczone horyzonty myślowe, zdradzając swą naturę AI!
Przykłady błędów tłumaczeń maszynowych w ujęciu tabelarycznym
tekst źródłowy w języku polskim | tłumaczenie maszynowe na angielski | weryfikacja tłumaczenia – postedycja przez tłumacza-człowieka |
obnisżoną jakość nasienia | reduced semen quality | reduced quality of semen |
Mutacje można grupować według zachowanej rezydualnej aktywności 21-hydroksylazy | Mutations can be grouped according to retained residual 21-hydroxylase activity | Mutations can be grouped in accordance with retained residual 21-hydroxylase activity |
zmieniają domenę przyłączającą substrat | alter the substrate-attachment domain | alter the subtrate-binding domain |
przerost warg sromowych | hypertrophy of the labia minora | hipertrophy of the labia |
u płodów męskich | in male fetuses (American English) | in male foetuses (British English) |
żadne z nich nie miało palpacyjnie wyczuwalnego guza | none of them had a palpably palpable tumour (tautologia w tłumaczeniu maszynowym) | none of them had a palpably detectable tumour |
Płodność zostaje zachowana u 23-67% pacjentów z TARTs współwystępującymi z CAH. | Fertility is preserved in 23-67% of patients with TARTs co-occurring with CAH. | Fertility is preserved in 23-67% of patients with TARTs concomitant / coexistent with CAH. |
przełom nadnerczowy | adrenal breakthrough | adrenal crisis |
Forma klasyczna CAH pojawia się u 1:9800-18000 żywych urodzeń wśród rasy kaukaskiej. | The classical form of CAH occurs in 1:9,800-18,000 live births among Caucasians (Note! Classical is correct in the context of classical music etc.; a similar differentiation takes place between historic and historical, however the machine does not distingush between the both forms of the word). | The classic / typical form of CAH occurs in 1:9,800-18,000 live births among Caucasians. |