Google Translate ne služi prevođenju Mujo kuje konja po mjesecu

13. maj 2013

Razgovarali smo sa Semirom Mehadžićem, prevodiocem, stručnjakom za lokalizaciju i članom Udruženja Lingvisti. Povod je uvrštavanje bosanskog jezika u Googleov prevodilački servis, a razlog zanimljivi komentari i izjave u medijima o tome. Da raščistimo neke stvari...

 

Lingvisti: U medijima su se već našle šale kako Google ne zna šta je burek i ćevap. Ljudi ustvari ne znaju po kom principu funkcionira Google Translate. Možete li objasniti na koji način svaki od korisnika/ca bosanskog Googlea može unaprijediti ovaj prevodilački alat?

Semir Mehadžić: Ovdje treba pojasniti jednu stvar – sve što vidimo u Google Translateu je ustvari rezultat rada računara koji softverski izdvajaju naše riječi i njihove prijevode iz mnoštva prevedenih tekstova na internetu. U Googleu ne sjede osobe čiji je posao da ručno traže i ukucavaju prijevod svake riječi na bosanskom. Ljudi-prevodioci su tu samo da „istreniraju“ te računare i nadgledaju cjelokupni proces, vršeći tek povremene korekcije.

Zato nas i ne treba čuditi što u Google Translateu nema prijevoda za riječi kao što su aščinica, merak ili nafaka. Razlog je vrlo jednostavan – njihovi prijevodi na engleski se ne pojavljuju dovoljno često na internetu da bi ih Google sam mogao naći, evidentirati i „upariti“. Kako je određene riječi u bosanskom jeziku (naročito turcizme) jako teško adekvatno prevesti na strani jezik; malo ko ih je uspio prevesti pa onda još i intenzivno koristiti te prijevode po internetu. To je glavni razlog zašto ih Google nije uvrstio u Google Translate, a ne neko subjektivno mišljenje ove kompanije o tome koje riječi pripadaju bosanskom a koje ne.

Ovaj nedostatak je, međutim, relativno lako rješiv. Korisnici sada mogu sami unaprijediti ovaj servis tako što će naknadno dodavati nove riječi, ocjenjivati stare prijevode ili upozoravati Google ako određena riječ ne pripada bosanskom jeziku. Treba samo kliknuti na riječ koja je ponuđena kao prijevod i unijeti svoje mišljenje ili sugestiju (ili odabrati neki od već unesenih prijedloga). To naravno ne znači da će svaki prijedlog za prijevod biti prihvaćen istog trenutka, ali će svakako biti analiziran.

 

Lingvisti: Koliko ovaj novi alat može olakšati ljudima koji ne znaju engleski jezik?

Semir Mehadžić: Prije svega, potrebno je napomenuti da od Google Translatea ne treba očekivati vrhunske prijevode jer ovo prevođenje radi računar. Za kvalitetan prijevod će vam, ipak, i dalje biti potreban čovjek-prevodilac.

Google Translate služi da vam otprilike kaže šta piše u nekom tekstu koji sadrži kompletne, „normalne“ rečenice, tek toliko da se možete snaći ako ne znate jezik. Dakle, prevođenje bosanskih narodnih izreka (Mujo kuje konja po mjesecu) ili tekstova pjesama (Dubioza kolektiv - Kažu) na engleski, čime se naša javnost zabavlja posljednjih dana, nije pravi način za korištenje ovog prevodilačkog servisa. Osim toga, Google Translate će uvijek davati bolje rezultate kada se prevodi NA bosanski jezik nego obratno (zbog razloga jezičke prirode).

Međutim, interesantno je da niko nije pomenuo ubjedljivo najvažniju korist od uvrštavanja našeg jezika u Google Translate – njegovu primjenu u pregledniku (browser) Google Chrome. Naime, od ovog trenutka mi možemo otvoriti bilo koju internet stranicu na svijetu, na bilo kojem od 70-ak svjetskih jezika i pisama, i odmah je cijelu pročitati na bosanskom jeziku.

Evo i konkretan primjer. Sada možete otvoriti japansku stranicu Toyote i samo jednim klikom miša je dobiti čitavu na bosanskom jeziku. Prijevod će biti daleko od savršenog, ali ćete moći dovoljno razumjeti sadržaj. Sjajno, zar ne?

Za ovu mogućnost potrebno je samo instalirati besplatni Google Chrome (Googleova varijanta Internet Explorera), i koristiti ga za pregledanje internet stranica. Savjetujem da sa interneta odmah preuzmete i besplatnu prevodilačku ekstenziju za Chrome koja dodatno olakšava proces automatskog prevođenja. Dovoljno je ukucati „Google Translate extension“ u Google i naći ćete je.

 

Lingvisti: Kako se uopće bosanski jezik našao na Googleovoj listi? Jesu li možda prepisali od Microsofta?

Semir Mehadžić: Nije toliko riječ o 'prepisivanju', s obzirom da je Microsoft uključio bosanski jezik u svoje projekte još od kraja 2005. godine, u nekom manjem obimu. Više možemo reći da je sad došao trenutak da se Googleu nuđenje usluga na bosanskom jeziku može isplatiti. Riječ je, dakle, prije svega o finansijskoj računici.

Bosanski jezik dugo nije bio „privlačan“ za internetske gigante zbog male stope korištenja interneta u našoj zemlji, loše kupovne moći stanovnika Bosne i Hercegovine te relativno malog broja govornika u svjetskim okvirima. Ni konstantno osporavanje legitimnosti bosanskog jezika mu svakako nije išlo u prilog, s obzirom da na Googleu već postoje slični jezici. Ipak, situacija po pitanju našeg jezika se postepeno mijenjala, i to zbog nekoliko konkretnih razloga.

Prvi je taj da se broj korisnika interneta u BiH konstantno povećava, i u 2012. godini je prešao 50%. Prije tri godine je taj procenat iznosio oko 37%, a 2001. tek 1,1%. Osim toga, Bosanci i Hercegovci sve češće kupuju tj. plaćaju usluge preko interneta, i imaju sve više povjerenja u takav način poslovanja. Sve navedeno znači da se i kod nas stvara tržište ove vrste, što je i najvažniji pokazatelj za kompanije poput Googlea.

Drugi faktor je činjenica da je bosanski jezik danas realnost koja se ne može zaobići, unatoč svim pokušajima njegove diskreditacije. Broj govornika u BiH i inostranstvu koji se služe bosanskim jezikom i smatraju ga svojim maternjim jezikom je između dva i tri miliona, prema posljednjim procjenama. To predstavlja ozbiljan broj, naročito ako ga se posmatra kao broj potencijalnih novih kupaca i korisnika usluga na internetu, i rijetko će koja kompanija to zanemariti. Upravo zbog toga, ogroman broj zahtjeva koje su Bosanci i Hercegovci redovno slali Googleu da podrži i bosanski jezik je imao efekta.

 

Lingvisti: Šta možemo dalje očekivati?

Semir Mehadžić: Možemo očekivati mnoge sjajne stvari. Upravo smo gore naveli jednu od njih – pregledavanje gotovo cijelog interneta na maternjem jeziku. Možemo očekivati i da će Googleov prevodilački servis za bosanski jezik postepeno postajati bolji – svi mi koji govorimo bosanski ćemo moći tome direktno doprinijeti kroz unošenje novih prijevoda i ocjenjivanje postojećih. Osim toga, sada će Google mnogo brže uvrštavati bosanski u svoje nove usluge, naročito ukoliko su one zasnovane na podacima iz baze Google Translatea.

Također, činjenica da je bosanski podržan na Googleu može samo pozitivno utjecati na odluke drugih internetskih kompanija da i naš jezik uvrste u svoje planove.

Naravno, ne treba zaboraviti da će i Google imati koristi od ovog koraka. Ova kompanija je jednim potezom sebi osigurala potencijalnih 2 do 3 miliona korisnika svojih usluga i proizvoda te gomilu novih podataka o korisnicima, što joj može biti vrlo korisno. Ali, ako zanemarimo sve potencijalne „big brother“ scenarije u budućnosti, ipak možemo reći da od ovog događaja naš jezik i mi imamo samo ogromnu korist.

 

Povezano:

klix.ba - Google Translate - Ovo je još jedna velika pobjeda bosanskog jezika

avaz.ba - Google prevodi i na bosanski jezik

radiosarajevo.ba - Google Translate izgubljen u prevodu na bosanski jezik

lingvisti.ba - Zrno po zrno pogača, korisnik po korisnik - google i facebook na bosanskom

Sandra Zlotrg, PROFESORICA BHS JEZIKA

izvršna direktorica

Završila Filozofski fakultet u Sarajevu: bosanski, hrvatski, srpski jezik i književnost naroda BiH i komparativnu književnost. Radi kao lektorica i kao profesorica BHS jezika kao drugog/stranog. Zanima je feministička lingvistika i uživa u objašnjavanju kako gramatička pravila imaju smisla.

Comments

© 2015 lingvisti.ba All rights reserved.