Keď hovoríme o strojovom preklade, hovoríme o automatickom preklade textu z jedného jazyka do druhého bez účasti človeka.
Strojový preklad funguje na princípe základného dvojkrokového procesu. V prvom kroku dochádza k dekódovaniu významu pôvodného textu vo východiskovom jazyku a následne k zakódovaniu významu do cieľového jazyka. Najnovšie systémy strojového prekladu využívajú na neustále zlepšovanie svojich výstupov rôzne technológie umelej inteligencie vrátane strojového učenia a neurónových sietí.
A aká je história strojového prekladu? Myšlienka používať počítače na automatický preklad jazykov sa prvýkrát objavila na začiatku 50. rokov 20. storočia. V tom čase bol však strojový preklad oveľa zložitejší, než počítačoví vedci pôvodne odhadovali. Na spracovanie a ukladanie údajov vyžadoval obrovský počítačový výkon, čo bolo nad možnosti prvých strojov. Počítačový softvér a hardvér tak začali vykonávať základný strojový preklad až v roku 2000. Prví vývojári používali na trénovanie počítačov v prekladaní textu štatistické databázy jazykov. To si vyžadovalo veľa manuálnych zásahov i času. Každý pridaný jazyk znamenal začať s vývojom pre daný jazyk odznova. Odvtedy sa strojový preklad zdokonaľoval v rýchlosti aj presnosti a vyvinulo sa niekoľko rôznych stratégií.
Strojový preklad vs. počítačom podporovaný preklad
Pozrime sa bližšie aj na to, aký je rozdiel medzi strojovým prekladom a počítačom podporovaným prekladom (preklad pomocou nástroja CAT), keďže tieto pojmy si často zamieňame. Ako sme už v úvode spomínali, strojový preklad funguje bez zásahu človeka. Počítačový softvér realizuje preklad sám – automaticky na základe algoritmov. Kvalita výstupu však nemusí zodpovedať, či už po obsahovej, alebo gramatickej stránke, požadovaným nárokom a v takom prípade do tohto procesu zasahuje aj človek. Nástroje CAT využívajú prekladatelia, ktorým výrazne pomáhajú, keďže pracujú s tzv. prekladovými pamäťami a terminologickými databázami, ktoré sa s každým novým prekladom rozširujú a tak zabezpečujú, že preklady sú jednotné a dodržiavajú rovnakú terminológiu. Ich využívanie navyše umožňuje rýchlejšie dodanie hotového produktu a zníženie nákladov.
Typy strojového prekladu
Existujú tri základné typy strojového prekladu, a to: pravidlový, štatistický a neurónový strojový preklad.
Strojový preklad založený na pravidlách (z anglického Rule-based Machine Translation – RBMT) sa riadi lingvistickými pravidlami a slovníkmi vyvinutými jazykovými expertmi a programátormi. Jeho najväčším nedostatkom je, že kvalita výstupného prekladu býva často nízka. Podstata výsledného prekladu môže byť pomerne jasná, ale vyžaduje si prispôsobenie konkrétnemu cieľovému publiku a štýlu písania. V tomto prípade hovoríme o tzv. posteditácii (post-editing work), teda manuálnej úprave strojového prekladu.
Systém štatistického strojového prekladu sa používal do roku 2016. Fungoval tak, že analyzoval už existujúce preklady a zo vzťahov medzi slovami, frázami a vetami vytváral štatistický model. Pri tomto type strojového prekladu teda platí, že čím väčšie množstvo správnych prekladov má počítač k dispozícii, tým lepší preklad ponúkne. Najväčšou slabinou štatistického strojového prekladu je to, že dokáže preložiť frázu len vtedy, ak existuje v referenčných textoch.
V súčasnosti je najpoužívanejším typom strojového prekladu neurónový strojový preklad, ktorý využíva metódu neurónových sietí podľa vzoru ľudského mozgu. Softvér sa učí a s každou novou skúsenosťou zlepšuje. Musíme však dodať, že ani neurónový strojový preklad aj napriek neustálemu zdokonaľovaniu stále nedokáže konkurovať prekladu vyhotovenému človekom. Strojový preklad si často nedokáže poradiť s gramatikou a správnym skloňovaním.