Po orędziu premiera Google musi tłumaczyć się z Tłumacza. Jak do tego doszło?
Sposób, w jaki rząd i MSZ komunikował światu nowelizację ustawy o IPN-ie można już dziś ocenić jako fraktalnie nieskuteczny. Kolejne napięcia były eskalowane zbyt długo, co postanowił zmienić sam premier. Niestety, fraktal pozostaje nieskończony i także w przypadku orędzia nie zabrakło problemów. Co ciekawe, kolejny epizod dotyczy tłumaczenia maszynowego, a konkretnie Tłumacza Google. Przynajmniej pozornie.
02.02.2018 | aktual.: 02.02.2018 17:38
Na kanale YouTube Kancelarii Premiera udostępnione zostało orędzie Mateusza Morawieckiego w sprawie napięć dyplomatycznych wywołanych przez nowelizację ustawy o IPN-ie. Możliwe było obejrzenie filmu z wygenerowanymi maszynowo przez Tłumacza Google napisami. Niestety, tam gdzie Morawiecki mówił, że obozy, w których miliony Żydów było mordowanych nie były polskie, widniały napisy, według których Camps where millions of Jews were murdered were Polish. Czyli precyzyjna antyteza tak pojedynczego zdania, jak i całego wystąpienia.
Napisy wyłączono, ale błąd nie umknął uwadze internautów. Na marginesie warto zaznaczyć, że sprawa została nieco rozdmuchana. Przede wszystkim orędzie tylko pozornie było kierowane do rodaków, zaś jego celem była głównie próba załagodzenia opinii poza Polską. Morawiecki sprawnie posługuje się językiem angielskim, dzięki czemu na kanale YouTube opublikowano także orędzie anglojęzyczne. To właśnie ono trafiło zapewne do większej liczby odbiorców poza granicami Polski, nie zaś wariant polski z automatycznie generowanymi napisami. Wystarczył jednak jeden zrzut ekranu z niefortunnym tłumaczeniem, by kwestia ta straciła znaczenie.
Dlaczego Tłumacz zawiódł?
Google dzisiejszego popołudnia przeprosiło za błąd. Adam Malczak z polskiego oddziału korporacji stwierdził dla WP, że błąd spowodowany był przez automatyczne tłumaczenie na YouTube, za co przepraszamy. To w zasadzie zamyka sprawę pod względem obyczajowym, ale warto się jej także przyjrzeć pod względem technicznym. Dlaczego Tłumacz Google nie wychwycił kluczowego przeczenia?
Aktualnie problem w Tłumaczu Google nie występuje w polsko-angielskiej parze językowej, poprawnie tłumaczone jest to samo zdanie z angielskiego na polski. Bardzo możliwe, że Google wprowadziło po takiej wpadce tłumaczenie podobnych konstrukcji na sztywno, zdając sobie zapewne sprawę, że liczni internauci na własne oczy będą chcieli przekonać się o nieskuteczności Tłumacza.
Warto zatem przetestować skuteczność zachowywania przeczeń na innych konstrukcjach – modyfikacje post factum mogły dotyczyć konkretnego szyku. Wprowadziliśmy zatem do Tłumacza dwie konkretne frazy – jedną strukturalnie podobną do wypowiedzi – domy, w których mieszkali ludzie nie były duże – oraz typowy test wielokrotnych przeczeń – nigdy więcej niczego nie napiszesz. W obu przypadkach tłumaczenie było bez zarzutu.
Skąd zatem wpadka? Otóż problem wcale nie musi leżeć w Tłumaczu, lecz w... algorytmach przetwarzania mowy na tekst. Zapominamy o tym, że aby YouTube wyświetlił napisy, w pierwszej kolejności musi pojawić się tekst. A tego nikt nie wprowadzał ręcznie, również maszyna przetworzyła głoski na znaki. Problem najpewniej wynikał nie z tego, że zdanie zostało błędnie przetłumaczone, lecz z tego, że mechanizm transkrybujący przemówienie premiera pominął słowo nie w procesie wychwytywania dźwięków.