alex171069
-
Постов
2 -
Зарегистрирован
-
Посещение
Никогда
Сообщения, опубликованные alex171069
-
-
Господа, я слегка не понимаю как может один символ в кодировке UTF-8 быть представлен 4-6 байтами ?
КАК потом процессор сливает эти байты для того чтобы получить один байт для отображения символа ?
Вот этот алгоритм очень интересен ?
А не всякие пространные статьи о том как появилась эта кодировка да зачем она нужна как в википедии !
UTF-8
в Программирование: C / C++
Опубликовано
Как это нету уважаемые.
А мифическое код-поинт U-0410 скажем - это тоже конкретика ?
А куда эта конкретика показывает ?
В ASCII точно можно сказать, что код буквы показывает на расположение ее в конкретной таблице.
Буква "А" в ASCII - E0 и все ясно где она находится и что нужно рисовать именно "А".
А в UTF-8 буква "А" выглядит как EF BB BF D0 B0 -и где тут буква А ?
С этими байтами, что надо делать чтобы получить U-0410 ?
И вообще какой алгоритм точно укажет на букву А из этого набора цифр?
Иными словами компьютер по какому алгоритму отыскивает букву "А" руководствуясь этим набором цифр ?
Вот этот алгоритм меня очень интересует и его нет в указанной вами статье . http://ru.wikipedia.org/wiki/UTF-8