В мире существует большое количество языков и
просто огромное количество символов. HTML4 позволяет нам использовать
большую часть из них, причем использовать на одной странице китайские
иероглифы, кириллицу и иврит. Однако не всегда возможно указать явно
какие-то символы в документе, и связано это с кодировкой документа,
ограничивающей наши возможности, но ссылки-мнемоники на символы,
позволяют обойти ограничения кодировок.
Источник проблем
HTML страница - это обычный текстовый файл. Какие символы позволяет
использовать HTML4? Любые символы Unicode, а это знаки практически всех
письменных языков. Т.е. вы можете создавать свои страницы в кодировке
Unicode и использовать явным образом в документе огромное количество
символов из различных алфавитов (но для этого редактор должен
поддерживать Unicode; так же имейте ввиду, что документ в кодировке
юникод имеет, больший размер, так как один символ кодируется не одним
байтом, как в различных национальных кодировках, а несколькими байтами
(но есть и исключения), например, данная статья в юникод-кодировке
UTF-8 имеет размер в 1,5 раза больший чем в кодировке windows-1251, и в
2 раза больше размер будет в кодировке UTF-16). Однако пока большинство
документов в сети используют 8-битные кодировки, ограниченные набором
символов из 256 элементов. Таким образом, используемая в документе
кодировка может ограничивать набор символов документа лишь теми
символами, которые она "знает". Поэтому HTML предлагает механизм,
называемый ссылки на символы, для представления любых юникод-символов в
документе независимо от кодировки документа.
Ссылки-мнемоники на символы в HTML 4
Ссылки на символы - это конструкции специального вида, встречая
которые браузер заменяет их на соответствующие Unicode-символы.
Например, встречая на странице конструкцию π или π браузер знает, что это ссылка на юникод-символ греческой pi - π, и заменяет конструкцию на данный символ. Ссылки на символ (мнемоники) могут быть двух видов:
- Цифровые мнемоники (десятеричные или шестнадцатеричные);
- Именные мнемоники.
Цифровые мнемоники
Цифровые ссылки-мнемоники на символы указывают кодовую позицию
символа в символьном наборе документа. Цифровые мнемоники бывают двух
видов:
- "&#D;", где D, десятеричное число, ссылается на десятеричное значение D символа Unicode (ISO 10646;)
- "&#xH;"
или "&#XH;", где H, шестнадцатеричное число, ссылается на
шестнадцатеричное значение H символа Unicode (ISO 10646).
Шестнадцатеричные числа в цифровых мнемониках нечувствительны к
регистру.
Примеры:
- å (å) - представляет букву "a" с маленьким кружком сверху (используется, напр., в Норвегии) заданная десятичным числом;
- å или å - та же самая буква что и выше но заданная шестнадцатеричным числом;
Именные мнемоники (ссылки-мнемоники по псевдониму)
Некоторые, наиболее часто используемые мнемоники имеют имена (псевдонимы), например, ранее упомянутая мнемоника π имеет также псевдоним π. Как видно, псевдоним запомнить намного проще, чем кодовую позицию символа.
Следует отметить, что HTML 4 определяет символьные мнемоники не для всех символов кодового набора, а так же
слудует знать, что символьные мнемоники чувствительны к регистру.
Так, именная мнемоника Å ссылается на заглавную Å , а å на строчную å.
Будте осторожны
Иногда в тексте документа необходимо использовать символы "<" и
">" которые зарезервированы как служебные для обрамления
дескрипторов. Поэтому в тексте, воизбежании возможных конфликтов с
началом или концом тега, данные символы следует заменять на их
мнемоники < для "<" и > для ">".
Также обратите внимание на использование самого символа "&". Так
как он зарезервирован в качестве начала ссылки-мнемоники, то в тексте
его следует заменять на мнемонику &
И ещё. Значения атрибутов дескрипторов обрамляются двойными
кавычками ("), поэтому при необходимости указать кавычки в значении
атрибута вы можете использовать мнемонику ", чтобы избежать конфликта с закрывающимися кавычками.
Автор: Цыгырлаш Игорь
Источник: http://www.tigir.com |