Internationalisering, lokalisatie, codering, IJsland en vertaling van een Japanse kattenfoto-website

internationalisering vertaling

internationaliseringEr is veel informatie beschikbaar als het gaat om internationalisering, lokalisatie en codering binnen webapplicaties. Er zijn ook veel misverstanden over wat elk voor een webtoepassing biedt. Hier is mijn mening ...

Wanneer een webbrowser verbinding maakt met een webserver, geeft deze nogal wat variabelen door en doet hij aanvullende verzoeken, hier is een voorbeeld:

GET / HTTP / 1.1
Gastheer: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accepteren: HTTP Accepteer = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accepteer-taal: en-us, en; q = 0.5
Accepteer-codering: gzip, leeglopen
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

internationalisering

Internationalisering is een samenstelling van veel dingen:

  1. Localization: De mogelijkheid om te identificeren vanuit welke taal en locatie een bezoeker bezoekt. Dit wordt gedaan door middel van HTTP-verzoeken waarbij de bezoeker wordt geïdentificeerd door een landinstelling. In mijn geval is dat en-US. "En" is Engels en "US" is de Verenigde Staten. Dit is een instelling binnen mijn besturingssysteem.
  2. Tijdzones: De mogelijkheid om aan te passen aan tijdzones. Dit wordt normaal gesproken bereikt door uw server in te stellen op een Greenwich Mean Time (GMT) en gebruikers vervolgens toe te staan ​​hun lokale offset van GMT in te stellen.
  3. Tekencodering: Dit is de mogelijkheid om taaltekensets correct weer te geven. Het verschilt van lokalisatie, aangezien lokalisatie me de taal en regio kan vertellen van de computer die het verzoek doet, maar het zal me niet vertellen welke taal de lezer vraagt… dat is aan de lezer!

Merk op in mijn HTTP-header dat wanneer de browser het verzoek deed, het de server vertelde dat het mijn locale opvroeg (Accept-Language: en-us); het moet de server echter ook vertellen om welke tekenset wordt verzocht (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 en utf -8 zijn beide toegestane tekensets.

Lokalisatie

In deze fantastische verwarde wereld dicteert lokalisatie nooit meer de taal. Ook al ben ik in en-US, ik kan absoluut een andere taal lezen met een andere tekenset… dat is wat er gebeurt als ik het gebruik Google Hindi (Ik gebruik Google Hindi niet echt). Mijn verzoek om locale en tekenset is identiek als wanneer ik het Google Engels pagina, maar ik krijg eigenlijk een pagina die ik niet kan lezen omdat ik de tekenset niet heb. Het komt allemaal ??????????? ... Ik kan die tekenset echter in Firefox laden (Firefox> Voorkeuren> Geavanceerd> Talen):

Firefox Laadtaal

Als ik die taal laad, kan ik de pagina opvragen in de oorspronkelijke tekenset en deze op mijn computer weergeven, ook al is mijn standaardlandinstelling en-US!

Dus ... als ik een Hindi student ben, Engels studeer aan Purdue en verbonden ben via VPN op de server van de school, op vakantie in Australië ... er zijn 3 verschillende instellingen die moeten worden toegepast om echt geïnternationaliseerd te zijn - en geen afhankelijk van de ander.

Mijn landinstelling zou verschijnen als en-US, maar mijn tijdzone is Australië, maar de taal die ik van de website vraag, kan Hindi zijn. Als ik mijn applicatie zou programmeren om te maken veronderstellingen op basis van de locatie van mijn computer zou ik het helemaal mis hebben - de persoon Engels te voeren in een oosterse tijdzone. Idealiter zou ik mijn applicatie programmeren om aan te bieden is zowel een taal- en tijdzone-instellingen ... maar ik zou ze niet aannemen op basis van locale.

IJsland - het ultieme voorbeeld

We zijn niet op de hoogte van meertalige en multi-locale uitdagingen in de Verenigde Staten waar we dat doen allen spreek Engels [impliciet sarcasme]. In sommige landen, zoals IJsland, hoewel de moedertaal IJslands is, groeien de ongelooflijke IJslanders op met het leren van 3 talen! Aangezien IJsland een land is in het midden van Europa en Noord-Amerika, werken hun bedrijven in meerdere continenten, talen, dialecten van talen en meerdere tijdzones vanaf hun desktop!

Veel IJslandse websites zijn gebouwd in Amerikaans Engels, Brits Engels, IJslands, Spaans, Spaans, Frans en Duits! Stel je eens voor hoe uitdagend het zou zijn om te bouwen Van Icelandair websitetoepassingen en ticketingsystemen ... wauw!

DISCLAIMER: Ik heb het absolute genoegen gehad om met de fijne mensen van Icelandair samen te werken en kan je vertellen dat ze enkele van de meest getalenteerde en vriendelijke professionals zijn waarmee ik heb mogen werken. Het is gewoon een geweldig land en mensen! Ga op bezoek ... neem Icelandair en zorg ervoor dat u de Blue Lagoon!

Taal versus codering

Er zijn zelfs verschillende karaktercoderingen binnen een enkele taal die niet goed met elkaar spelen! Voorbeeld: een Japanse e-mail geschreven in Shift-JIS kan onleesbaar worden op de computer van een Japanner met de lokalisatie ingesteld op ja-JP omdat hun mailserver alleen EUC-JP herkent. Idealiter zou een klant in staat moeten zijn om in te stellen welke codering ze willen en welke taal - gewoon ervoor zorgen dat de codering en taal compatibel zijn met wat de klant vraagt.

Als ik Japans wil lezen, moet ik misschien zowel Japans als mijn taal selecteren EN Shift-JIS voor codering om die taal correct weer te geven. Hier is nog wat verwarring om aan de mix toe te voegen… sommige coderingstypen ondersteunen verschillende talen. UNICODE / UTF8 ondersteunt tientallen. Het omgekeerde is ook waar. Sommige talen kunnen in veel coderingstypen worden gelezen. Als dat niet klopt ... mijn excuses, het is een zeer complexe kwestie.

Op een dag geloof ik (hoop) dat dit allemaal zal veranderen. Ik denk dat de oorspronkelijke ontwerpers van lokalisatiecodes hoopten dat de taal-landcombinatie alles zou zijn wat nodig is ... maar we zijn veel geavanceerder geworden. Bedenk dat veel hiervan is ontwikkeld voordat er een internet bestond. Met de komst van GIS, kan een persoon misschien zijn codering selecteren en zou GIS tijdzone- en locale-informatie afhandelen.

internationalisering

Terug naar Internationaliseringsondersteuning. Als u een geïnternationaliseerde aanvraag wilt indienen, moet u:

  1. Ondersteuning van meerdere coderingstypen, talen en vertaalbestanden om die vertalingen weer te geven.
  2. Sta de cliënt toe om hun taal in te stellen, en misschien zelfs hun coderingstype, indien nodig.
  3. Ondersteuning van tijdzones door gebruikers toe te staan ​​hun tijdzone te vergelijken met GMT.
  4. Wees voorzichtig met het gebruik van lokalisatiecodes… ze geven NIET nauwkeurig weer wat uw gebruiker werkelijk vraagt, noch wat ze kunnen lezen.

Vertaling

Machinevertaling staat nog in de kinderschoenen. Er zijn een aantal websites (en WordPress Plugins) die automatische vertaling van uw site bieden. Laat u niet verleiden om dit te doen ... er zijn twee redenen waarom:

  1. Als machinevertaling werkt, heeft de gebruiker die uw site bezoekt al een vertaler om mee te werken.
  2. Machinevertaling is waardeloos.

Geloof me niet? Hier is een Japanse vertaling voor jou:
Geplakt van Masatsu-bestand - een kerel met een heleboel foto's van katten:

Japans blogbericht

??
- 00:29:35 door masatsu

???????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
?????????????????????????????

?????????????????????????????????? (?)

?????????????????

??????????????
??
??

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????

​ Ag ??????????????

?????????????????????????????????????

Machine vertaling:

​ Hann ?????
-00: 29: 35 door masatsu

De naam van de vuistheilige van een / de olifant die gisteren verscheen op de "a / the beast fist" -vloot ?? boswachter ”“ ?? Hann ???? " met een / de radioacteur Yutaka Mizushima….

? (?) dat doet inktvissen gemakkelijk.

Omdat zelfs de radioacteur van de eerste heilige, meester ????? van een / de kat zijn de Chinese kweepeer van een Nagai Ichiro = drakenbal de staf van een / de ?? ranger lijkt op de mensen die een geestige opmerking gemakkelijk weten.

?????? (Het zweet) dat ik dit jaar volledig vergat "het geheim van de naam van de supervloot", van de gebruikelijke praktijk elk jaar?,

?????? Als ik dit jaar te laat schrijf,

??????? altaar ??? (kan hoe?)? landtong cullion (?? gesneden niet) Fukami ?? (? of observeren in staat?) en / is het dat doet

?????? Met, het wordt "een kan /? /?", Met andere woorden, "kung fu", wanneer u zich opstelt en het hoofd van een / de naam verandert.

?????? Hoewel er naar verluidt twee extra zou toenemen, zou het kunnen worden wat voor naam.

De waarheid is "leeftijd" omdat het zilveren elementensymbool Ag? Is, hoewel de naam van "de ???? zilver ”de Takaoka? technicus van ??????? dacht dat het personage met de naam "?" werd gebruikt met de associatie van een Silver'screen-film, als het het noemt met een extra lid.

?????? Ik denk echter egoïstisch, dat mijn theorie niet los staat van dat "?" is opgenomen in een / het Chinese karakter.

Ik ben er zeker van dat het omkeren van de polariteit van deze vertaling een net zo leesbare uitspraak in het Engels zou opleveren. Je hebt de invoer begrepen, toch?

2 reacties

  1. 1

Wat denk je?

Deze site gebruikt Akismet om spam te verminderen. Ontdek hoe uw reactiegegevens worden verwerkt.