28.06.2024

Maciej Rapacz (Akademia Górniczo-Hutnicza): Cyfrowy Orygenes? Badania nad generowaniem interlinearnych maszynowych przekładów Nowego Testamentu ze starożytnej greki na polski oraz angielski przy użyciu transformerów.

Celem tłumaczenia maszynowego w większości przypadków jest dostarczanie precyzyjnych i naturalnych przekładów, co często sprawia, że składnia języka źródłowego w tekście docelowym nie jest dokładnie odzwierciedlona. Tymczasem w niektórych przypadkach, takich jak tłumaczenie interlinearne, kluczowe jest zachowanie tej struktury również w tekście docelowym.

Podczas mojego wystąpienia przedstawię wyniki badań nad zastosowaniem modeli enkoder-dekoder z rodziny T5 do tłumaczenia interlinearnego ze starogreckiego na polski i angielski, używając Nowego Testamentu jako korpusu tekstów.

Na badania składają się porównanie modelu wielojęzycznego (mT5) z dedykowanymi modelami pretrenowanymi na starożytnej grece (PhilTa, GreTa) oraz ocena wpływu sposobów kodowania metadanych morfologicznych na ostateczną jakość generowanych tłumaczeń.

W celu uczestnictwa wirtualnego prosimy o zapisanie się przez ten formularz: https://forms.gle/4K1MJ7V9JW8MDKmq7