Tekstaro de Esperanto

Le Monde diplomatique en Esperanto 2014-2016

Verkis: Diversaj aŭtoroj
Eldonado: Unesko-Grupo Narbonia Embres-et-Castelmaure 2014-2016

La bazan tekston origine enkomputiligis Vilhelmo Lutermano

Kreis la Esperantan tekston: diversaj personoj

La artikoloj estas ĉerpitaj el la TTT-ejo de Le Monde diplomatique en Esperanto: https://eo.mondediplo.com.

Proksimuma verkojaro: 2014-2016

Ligilo al la origina teksto en “Le Monde diplomatique en Esperanto”

Google kaj lingva imperiismo

Pluvas katoj kaj hundoj

Frue en decembro 2014, ĉiu, kiu petis de Google Translate la italan ekvivalenton de la frazo “Tiu fraŭlino estas bela”, ricevis strangan rezulton: “Questa ragazza è abbastanza”, laŭvorte “Tiu fraŭlino estas sufiĉe.” La beleco perdiĝis en la tradukado. Kiel povas esti, ke tian eraron faru unu el la plej lertegaj maŝintradukiloj de la mondo, servo subtenata de senegala lingva kapitalo el miliardoj da propozicioj? La solvo estas simpla: per pasigo de la frazo tra la angla. Anglalingve, oni povas traduki “bela” per “pretty”, sed “pretty” ankaŭ povas signifi “sufiĉe”, kaj “sufiĉe” en la itala estas “abbastanza”.

Ekkompreninte ĉi tiun principon, oni povas facile produkti frazojn nekutimajn kaj eĉ amuzajn. “Je pense que vous avez un président magnifique” (“Mi opinias ke vi havas imponegan prezidanton”) fariĝas itallingve “Penso che tu abbia una bella sedia”, tio estas, “Mi opinias ke vi havas belan seĝon”, ĉar “président” (prezidanto) povas esti tradukita per “chair” (seĝo) en la angla. La uzo de la angla kiel la pivotlingvo ĉi-maniere estigas foje la malon de la vera signifo. Google tradukas la italan “Hai fatto un compito terrificante” (Vi faris fuŝegan laboron) per “Vi faris bonegan laboron” konforme al la signifo de la angla vorto “terrific”. La tradukilo transformas la idiomaĵon “it is raining cats and dogs” (“pluvegas”) en “piove gatti e cani” (“pluvas katoj kaj hundoj”), laŭvorta traduko de la angla frazo kiu tamen estas nekomprenebla por italo.

Por disvolvi maŝintradukilon, estas necese disponi grandan korpuson de identaj tekstoj tradukitaj el unu lingvo al alia. Google estas usona kompanio kaj tial nature konstruis sian tradukilon sur la bazo de tekstaj paroj de kiuj la angla preskaŭ ĉiam estas la pivotolingvo. La tradukilo estas projektita tiamaniere ke, por traduki el la franca al la itala, oni unue devas fari tradukon pere de la angla. Ĉi tiu procedo kreas gravan lingvan biason. La lingvoj franca kaj itala estas relative similaj. Kompare kun ili, la angla estas tute alia lingvo, kompakta kaj riĉa je idiomaĵoj. Nesufiĉa kompreno de la kunteksto kondukas al multaj eraroj. Transformi iun esprimon en la anglan, kaj poste retransformi ĝin en cellingvon, estigas senintencajn lingvajn novigaĵojn.

La kapricoj kreitaj de maŝintradukiloj eble ŝajnas esti malgravaĵoj. Vaste konataj estas la malfacilaĵoj prezentataj de la maŝintradukado. Sekve, estas tute antaŭvideble ke la maŝinoj faras erarojn. Iliaj eraroj estas, tamen, interesaj; ili pripensigas nin pri la specifaĵoj de ĉiu lingvo. Kaj oni povas atendi ke la tradukojn iam plibonigos la evoluado de dulingvaj tekstaj korpusoj sen la perado de la angla, kaj korektoj faritaj de la retumantoj mem. Eble la eraroj menciitaj en ĉi tiu artikolo estos jam korektitaj ĝis kiam, laŭ la konata diraĵo, “nous mettons sous presse” (ĝis la horo de presado) — frazo kiun Google tradukas en la hispanan per “vamos a presionar” (ni premos). Ĉu do vere indas zorgi pri la fenomeno?

Por kompreni la verajn efikojn de la angla kiel pivotlingvo, ni devas meti la maŝintradukadon en pli larĝan kuntekston, nome tiu de la tekstoj kiuj utiligas algoritmojn en Interreto. Ĉi tiuj komputilaj programoj ne nur kreas lingvajn novigaĵojn en la kunteksto de robotaj tradukoj, sed ankaŭ estas uzataj por aŭtomate verki gazetarajn artikolojn, korekti sintakse kaj semantike la enhavon de vikipediaj paĝoj, krei laŭcelajn reklamojn, kaj optimumigi la enhavon de retpaĝoj por ke serĉiloj facile ilin indeksu.

Kiel do oni povas distingi inter primaraj lingvaj fontoj produktitaj de homoj sen algoritma perado (skribaj konversacioj, ciferecigitaj libroj, ktp) kaj sekundaraj lingvaj fontoj kiuj rezultas el algoritmaj transformoj de primaraj rimedoj?

En multaj enigiloj, la aŭtomata kompletigo estas ofta, tio estas, la uzanto tajpas la komencon de vorto aŭ frazo kaj programo aŭtomate kompletigas ĝin. Ĉi tiel, algoritmoj fariĝis preskaŭ rutinaj periloj kiam oni skribas enrete. En multaj kazoj, ni ĉesis enigi nian tekston per sinsekvaj literoj aŭ vortoj: ni simple elektas el kelkaj eblaj kompletigoj proponitaj de algoritmoj. Ĉi tiu formo de skribado kombinas rapidecon kaj efikecon, precipe kiam oni uzas la malgrandan klavaron de poŝtelefono ĉar, por skribi tekston, oni nur devas facilmove elekti vojon tra la arbo de konvenaj esprimoj. Post kelkaj jaroj, oni verŝajne malfacile trovos enigilon kiu ne uzas ĉi tiun teknikaron.

Kiel aliaj sekundaraj rimedoj, tekstoj algoritme kreitaj per maŝintradukado ne nepre estas tiel identigitaj. Male, ili ofte ŝajnas esti primaraj, naturaj fontoj, kiujn legantoj eble povus uzi kiel modelon. Retumanto, por kiu la itala ne estas la denaska lingvo, ne havas motivon por kredi ke la esprimo “Piove gatti e cani” estas erara. Ĉi tiu rimarko estas precipe vera por algoritmoj kiuj analizas la strukturon de la lingvo por artefarite produkti novajn tekstojn. Povas okazi, ke algoritmo serĉanta primaran fonton por optimumigi siajn tradukajn kapablojn senintence uzas tekston produktitan de alia algoritmo kun ĉiuj ĝiaj eraroj.

La disvastiĝo, pere de Interreto, de fontoj “kontaminitaj” de robotaj programoj minacas subfosi teknikan strukturon kiu favoras masivajn kvantojn da donitaĵoj pli ol sistemecan kvalitan kontrolon. Jam estas multaj ekzemploj de strangaj esprimoj en la Tut-Tera Teksaĵo. En la retbutiko kie Apple vendas siajn produktojn (Apple Store), oni legas, ekzemple, la sekvantajn rimarkojn pri aplikaĵo kiu ebligas ke oni tajpu mesaĝojn piedirante: “Intuicie uzebla, belaj rezultoj kaj denove bonhumora. Dankon kiu faris la! ĝi estas rava kaj rekomendas”. Posta rimarko kundividas la lingvajn strangaĵojn de la unua: “Ĝi helpas min enkonduki horizontalan kaj vertikalan tekston, sendi SMS-mesaĝojn, sendi retpoŝtaĵojn, sendi mesaĝojn per Tvitero kaj Facebook ... sufiĉe amuze, mi dankas vin!”

Ĉi tiaj frazoj, kiuj enhavas la groteskajn tordaĵojn de algoritmoj, povus poste servi kiel modeloj en servoj de teksta perado proponante, ekzemple, aŭtomate kompletigi la frazon kiun oni tajpas. Ne estas neimageble ke italo iam komencos propozicion per “Piove” (pluvas) kaj vidos la proponatan “kompletigon” “ ... gatti e cani” (katoj kaj hundoj), esprimo kiu probable neniam estas parolita aŭ skribita en la tuta historio de la itala lingvo.

Tiel, la angla kiel lingva pivoto iam povus partopreni procedon de kreoligado: la formado de nova lingvo surbaze de transformado sub la influo de aliaj pli malnovaj lingvoj, fenomeno konata de lingvistoj. Aktuale, la ŝanĝoj enkondukitaj de la algoritma perado konsistigas specon de piĝino, lingvon de kontakto, potenciale efemeran, inter du lingvaj sistemoj. Sed kiam nova generacio estos elmetata al ĉi tiuj transformitaj esprimoj, la novigaĵoj probable stabiliĝos en la formo de kohera kaj memstara lingvo, kreolo. Ĉi tiu evoluado povus rapidigi la peradon de novaj enigiloj, intimaj lingvaj protezoj kiuj povus forte influi estontajn esprimformojn.

La anglalingva imperiismo tial estigas pli subtilajn efikojn ol tiuj, kiujn sugestus pritraktoj centritaj en “la lingva milito”. La uzo de ununura lingvo kiel pivoto kuntrenas la enkondukon en ĉiujn aliajn de logiko propra al la pivotlingvo kaj tial, nepercepteble, de specifaj pensmanieroj. Ankaŭ povus esti ke ĉi tiu fenomeno partoprenos ampleksan lingvan transformon en kiu la algoritmoj ludos kernan rolon. Kvankam la angla funkcias kiel pivoto por la lingvoj de Eŭropo, aliaj lingvoj probable okupas la saman pozicion en aliaj lingvofamilioj (ekzemple, la hindia). Sekve, establiĝas tutmonda tradukreto funkcianta per referencado al kelkaj pivotlingvoj.

Kiu, post kvin jaroj, ankoraŭ verkos purajn primarajn fontojn sen algoritma perado? Kiom da tempo pasos antaŭ ol la unuaj algoritmaj novigaĵoj fariĝos rigardataj kiel naturaj formoj? Ĉi tiuj hibridaj verkoj necesigas zorgeman studadon, kaj eble ankaŭ la evoluadon de nova lingvistiko kiu masive utiligos algoritmojn por pli bone kompreni kaj kontroli la efikojn de algoritmoj.

Frédéric KAPLAN kaj Dana KIANFAR

Tekstaro de Esperanto

Parto de unu teksto en kolekto de Esperantaj tekstoj

Le Monde diplomatique en Esperanto 2014-2016

Google kaj lingva imperiismo

Pluvas katoj kaj hundoj