alex171069

18 мая, 2009

Как это нету уважаемые.

А мифическое код-поинт U-0410 скажем - это тоже конкретика ?

А куда эта конкретика показывает ?

В ASCII точно можно сказать, что код буквы показывает на расположение ее в конкретной таблице.

Буква "А" в ASCII - E0 и все ясно где она находится и что нужно рисовать именно "А".

А в UTF-8 буква "А" выглядит как EF BB BF D0 B0 -и где тут буква А ?

С этими байтами, что надо делать чтобы получить U-0410 ?

И вообще какой алгоритм точно укажет на букву А из этого набора цифр?

Иными словами компьютер по какому алгоритму отыскивает букву "А" руководствуясь этим набором цифр ?

Вот этот алгоритм меня очень интересует и его нет в указанной вами статье . http://ru.wikipedia.org/wiki/UTF-8

18 мая, 2009

Господа, я слегка не понимаю как может один символ в кодировке UTF-8 быть представлен 4-6 байтами ?

КАК потом процессор сливает эти байты для того чтобы получить один байт для отображения символа ?

Вот этот алгоритм очень интересен ?

А не всякие пространные статьи о том как появилась эта кодировка да зачем она нужна как в википедии !

Сообщения, опубликованные alex171069