...

среда, 18 марта 2015 г.

Не каждый человек может написать своё имя в Юникоде

Казалось бы, в Юникод включили уже все возможные и невозможные символы. В последней версии Unicode 7.0 добавлено 23 новых письменности, включая древнепермское письмо и почти полностью расшифрованное линейное письмо А минойской цивилизации 2000 г до н.э., сотни экзотических эмотиконов.

Общее количество символов в Unicode превысило 110 000 штук. Казалось бы, там уже есть все распространённые символы. Оказывается, это не так. До сих пор остались люди, которые не могут написать в Юникоде даже собственное имя. Им приходится прибегать к разным трюкам.


О своей проблеме рассказал индийский IT-специалист, имя которого мы не можем правильно напечатать, разве что в транслитерации: Адитья Мукереджи.



Родной язык парня — бенгальский, это седьмой по популярности язык в мире, который значительно опережает по численности носителей даже русский. Вы можете представить, что не все символы русского языка представлены в Unicode? А вот для бенгальского это привычное дело.




Бенгальские символы


Бенгальский представлен в Unicode с самой первой версии, но с самого начала в нём не хватало символов. Жителям страны приходилось изобретать велосипеды, восполняя недостающие символы при письме комбинациями похожих букв и цифр, как в хакерском l33tspeak. Так, его собственное имя можно написать со сходной графемой из родственной письменности: আদিত্য.




Отсутствующая буква


В 2005 году некоторые символы добавили, но не все. В его имени до сих пор не хватает буквы, хотя оно — вовсе не какая-то экзотика, а повсеместно встречается в Индии и даже входит в 1000 самых популярных имён в США.


Адитья Мукереджи обвиняет в технической некомпетентности сотрудников консорциума Unicode, которые занимаются подготовкой стандарта. Смелый специалист даже делает расистские намёки. По его мнению, среди сотрудников слишком много белых англоговорящих людей. Дерзость можно понять: он как продвинутый пользователь цифровой техники немало уже натерпелся за свою жизнь из-за «неудачного» имени.


Адитья опасается, что консорциум Unicode не собирается изменять список из 224 024 символов, которые планируется включить в Unicode в ближайшие годы.


Эта история представляется ещё и интересным примером того, что современные технологии могут не только упростить жизнь, но и осложнить её.


This entry passed through the Full-Text RSS service - if this is your content and you're reading it on someone else's site, please read the FAQ at http://ift.tt/jcXqJW.


Комментариев нет:

Отправить комментарий