С работа с кодировками: Использование классов кодировки символов в .NET

Содержание

Учим русский | Глава 2. Основные принципы работы с Dreamweaver | Статьи | Программирование Realcoding.Net

Выберем в списке вкладок пункт New Document. Итак, что же здесь изображено? Но прежде чем начать
разговор о русификации Dreamweaver, немного поговорим об особенностях
национального Web-творчества. А именно о кодировках русского языка и борьбе с
ними.

Вероятно, вы знаете, что каждый символ, который может быть введен с клавиатуры и
отображен на экране, имеет уникальный номер, называемый кодом символа.
Совокупность таких кодов вместе с описанием, какой код какому символу
соответствует, образует кодировку. Каждая кодировка имеет свое наименование,
например 1251 или КОИ-8.

Поскольку любой язык использует свой набор символов, для каждого языка
кодировки, как правило, различны. (Исключение — некоторые западноевропейские
языки.) Но на этом путаница с кодировками не кончается. Дело в том, что разные
операционные системы используют различные кодировки. Например,
западноевропейская версия Windows использует кодировку 1250, русская — 1251,
американская версия MS-DOS— 437, а русская -866 (она же ISO-8859-5). Ну,
американская с западноевропейской — бог с ними, обойдемся без иноземцев! Однако
русских кодировок, как видите, уже две. А если добавить сюда еще кодировку,
используемую русской версией операционной системы UNIX — КОИ-8, и русской
версией компьютеров Macintosh — MacCyrillic, кодировок станет уже четыре. И это
только главные, на памяти автора существовали еще штуки четыре менее
распространенных кириллических кодировок («основная» кодировка ГОСТ,
«болгарская», «американская», «югославская» и еще какие-то). Кроме того, в
последнее время появилась кодировка Unicode, поддерживающая ВСЕ имеющиеся на
Земле языки. Настоящая тирания кодировок!..

Чем
все это грозит? А вот чем. Вы, наверно, пытались открыть текстовый документ,
созданный в Блокноте, в Norton Commander. Видели, что при этом получается —
текст абсолютно нечитаем. А все потому, что русские кодировки 866 (MS-DOS) и
1251 (Windows) не совпадают! В них одному и тому же символу присвоены разные
коды!!!

Каков же выход?

Выхода нет. Можно надеяться только на то, что какая-то из кодировок станет
стандартом и постепенно вытеснит конкурентов. Пока что на роль такого
(негласного) стандарта претендует 1251, хотя интернетчики старого поколения,
пользующиеся UNIX-совместимыми системами, «пропихивают» КОИ-8. Во всяком случае,
сейчас большинство Web-страниц, имеющихся в русском сегменте Сети, написано в
кодировке 1251.

Здесь стоит упомянуть еще два момента. Современные программы Web-обозревателей
поддерживают все доступные сейчас кодировки и корректно их распознают. Это
первое. Второе: Web-сервер (точнее, его администратор) может потребовать, чтобы
публикуемые вами странички были закодированы в какой-либо конкретной кодировке,
например в КОИ-8. Это стоит иметь в виду, когда вы будете выбирать кодировку для
своего Web-творения.

Когда вы создаете в Dreamweaver Web-страницу, используемая в ней кодировка
прописывается в ее заголовке с помощью особого тега <МЕТА>. Например, так:

<МЕТА HTTP-EQUIV=»Content-Type» CONTENT=»text/html; charset=windows-1251″></HEAD>

Как
вы поняли, эта страница создана с использованием кодировки Windows, т. е. 1251.
Подробнее о теге <МЕТА> мы поговорим далее в этой книге.

Итак, какие же кодировки поддерживает Dreamweaver? (Имеются в виду, конечно же,
русские кодировки.) Все они перечислены в табл. 2.4 и задаются с помощью
раскрывающегося списка Default Encoding.

Таблица 2.4. Кодировки русского текста, поддерживаемые Dreamweaver


	Обозначение	Описание
	ISO-8859-5 КОИ8 (KOI-8R) MacCyrillic Windows-1251	Русская версия MS-DOS Русские версии UNIX-совместимых систем Русская версия ОС Macintosh Русские версии Windows, начиная от версии 3.0
	Western (Latin1)	Это не русская кодировка, она включена в этот список только для справки. Поддерживает западноевропейские языки

Какую же кодировку выбрать? Ответ прост. Если вы не связаны какими-либо
специфическими требованиями администратора Web-сервера, на котором будет
опубликован ваш сайт, смело выбирайте пункт Windows-1251. В противном
случае выберите ту кодировку, которую требует сервер. Если вы создаете странички
на английском языке, ваш выбор — Western (Latinl).

Теперь переключитесь на вкладку Fonts. На этой вкладке вы сможете
настроить шрифты, которыми будет отображаться текст вашей страницы. В списке
Font Settings выберите шрифтовой набор, который будет использован для
отображения ваших Web-страниц. Здесь альтернатива еще проще: если текст русский
— выбирайте Cyrillic, если английский — Western (Latinl).

Что
касается начертаний и размеров шрифтов, используемых для отображения текста,
автор может только посоветовать, но никак не порекомендовать. Автор предпочитает
в качестве пропорционального шрифта (раскрывающийся список Proportional Font)
Arial, в качестве моноширинного (Fixed Font) — Lucida Console, а для
отображения исходного HTML-кода в редакторе кода (Code Inspector) — тоже
Lucida Console. Размеры шрифтов (раскрывающийся список Size) автор обычно ставит
равным 10 пунктам (малый размер, Small). Но, еще раз повторим, что это
дело вкуса.

А
теперь еще одна важная деталь. К сожалению, все программы имеют ошибки, даже
самые лучшие из них. Dreamweaver в этом случае не исключение. Из-за ошибки он
некорректно открывает Web-страницы, в которых не прописана с помощью тега <МЕТА>
используемая в них кодировка. Для того чтобы вразумить его, нам придется сделать
следующее.

Прежде всего, закройте Dreamweaver. Далее откройте в Проводнике или в другом
диспетчере файлов папку, в которой у вас установлен Dreamweaver. Обычно это
папка Program Files/Macromedia/Dreamweaver MX. В ней вы увидите папку
Configuration. Откройте в ней подпапку Encodings. В этой подпапке находится файл
EncodingMenu.xml. В этом файле перечислены все поддерживаемые Dreamweaver
кодировки.

Ниже
приведен фрагмент этого файла, в котором перечисляются русские кодировки,
интересующие нас:

<mm:encoding
name=»Cyrillic (ISO-8859-5)» charset=»iso-8859-5″