2009-10-11

The vodka is good

En gång i tiden läste jag ett fascinerande ämne som heter datalingvistik. Det går i princip ut på att få datorer att hantera språk, naturliga språk som svenska och engelska. En typisk tillämpning inom området är maskinöversättning.

Lovande demonstrationer på 1950-talet gjorde det möjligt att finansiera stora projekt. Men här finns en lurig fälla; det är enkelt att skriva program som kan översätta väl inom begränsade områden, men när de skall utökas växer problemen exponentiellt. Dessutom inser man snart att goda översättningar kräver viss förståelse av det som texten avhandlar, vilket är en helt annan och oerhört mycket större utmaning. På 1960-talet kom några rapporter som i princip avfärdade de uppsatta målen som orealistiska, översättningsdatorer skulle inom överskådlig tid vara sämre och dyrare än människor som gjorde detsamma.

Och så nämns ett klassiskt exempel; alla i branschen känner till det.

Det var när man tog den engelska frasen the spirit is willing, but the flesh is weak (Matt 26:41) och översatte till ryska - resultatet blev the vodka is good, but the meat is rotten.

Roligt? Jo, om det inte vart för alla miljoner dollar och manår av forskning som lagts ner på att komma fram till detta. (Men som alla som använt tjänsterna på nätet vet så är en ungefärlig översättning, om aldrig så klumpig och torftig, oerhört mycket bättre än ingen översättning alls.)

Men nuförtiden ägnar jag mig främst åt faktoider, och då slår det mig: är den där vodka-historien sann? Var och när skulle den ha inträffat? Vilket system användes? Ofta antyds att det skall ha hänt på 50- eller 60-talet, och i vilket fall är det första belägg Mattias funnit från 1958 (liksom en hoper från 60-talet, snarare än det relativt sena från 1970 som jag förut orkat fram till).

I en intressant variant gäller det en offentlig demonstration av ett sovjetiskt program, där en amerikansk ambassadör får välja bibelord. Där kan man ana politiska poänger - att den inte är sann indikeras av att den i versionen jag hittat är förlagd till slutet av 1980-talet, eller senare är åtskilliga andra belägg.



Tills vidare håller jag "vodkan" för att vara en datalingvistisk vandringssägen. Vilket i så fall är den första jag identifierat inom just det området.

13 kommentarer:

Mattias sa...

Det säger ju inte att det inte är en vandringssägen, men

Google böcker 2 träffar
1962 - Busines automation
1964 - Water power

Google news archives
1965 - Los Angeles Times

Mattias sa...

Klassiskt skämt 1958, enligt Worlds of if

Hexmaster sa...

Tack -- variationer ger resultat, "flesh is weak" är ju pålitligt original plus vodka, men sistnämnda har visat sig vara "good", "strong", "fine" m.m. Nu hittar jag flera belägg från 60-talet (som Popular Mechanics 1963, som dessutom visste att "hydraulic rams" översatts till "water goats"), varav flera kallar historien ett skämt, "apocryphal" m.m.

Denna period var också den då mest pengar lades ner. Det är lätt att se hur det skämtas om sådana projekt när resultaten uteblir.

Ibland, som i "World of If" har man dubblerat översättningen, engelska-ryska-engelska. Vad nu det nu skulle vara bra för.

Anonym sa...

Intressant.

Jag har förmånen (? ;)) att komma i kontakt med en massa utlänningar i jobbet och har indirekt kontakt med översättare och översättningstjänster sedan mitten av 1990-talet.

När jag kom i kontakt med de maskinöversättningar då så var de kassa till med nöd och näppe användbara. Hade man trist en dag översatte man en text från språk A till språk B och sedan tillbaka till språk A - och sedan låg man dubbelvikt av skratt. Numera med t.ex Google är det inte alls lika roligt - framför allt om man passerar via engelska (ungerska direkt till svenska är två för smala språk - resurserna torde läggas på att få en bra tjänst till och från engelskan - tror jag).

Mina 2 € cent.

MVH

Hans

Tore Kullgren sa...

I en liknande sägen ska "The Grapes of Wrath" översatt engelska-ryska-engelska ha blivit "Angry raisins".

Lena Synnerholm sa...

Jag råkar veta att det var en japan, som översatte fel tillbaka till engelska. Det var alltså inte frågan om maskinöversättning.

Hexmaster sa...

Och jag råkar veta att titeln "Ikareru hoshibudou" som sagt är en sägen.

Snopes: Angry Raisins

Tore Kullgren sa...

http://www.snopes.com/language/misxlate/raisins.asp

Lena Synnerholm sa...

Jo, det var därifrån jag fick det.

Unknown sa...

Varför är det påfallande ofta ryska? Även mitt exempel sägs vara en automatöversättning engelska-ryska-engelska vilket gav "out of sight, out of mind" - "invisible idiot". Detta var åtminstone 15 år sedan så innan Babelfish och dess likar.

Hexmaster sa...

Ryskan är trovärdig eftersom Sovjet ju var det intressantaste landet för USA under 50- och 60-talet. Att "vodka" är ryska för "spirit" är också något man förstår direkt i just den versionen.

Jag kände inte till "invisible idiot"-exemplet.

Lena Synnerholm sa...

I just det fallet tror jag det var mandarin. Jag kommer inte ihåg, varifrån jag fått det, men jag misstänker Carl Sagans "Lustgårdens drakar". Ska kolla så snart jag får tid.

Lena Synnerholm sa...

Nu har det äntligen blivit av, att jag kollat upp det. Jodå, exemplet står omnämnt, i Carl Sagans "Lustgårdens Drakar". Det var verkligen mandarin, som det var frågan om. "Osynlig idiot" ska ha varit resultatet, av översättning tillbaka till engelska. Fast det är inte riktigt säkert, att det verkligen inträffat. Författaren kallar anekdoten "förmodligen något tvivelaktig".