Кодировка windows 1251 в сайтостроении

Кодировка windows 1251 была создана в начале 90 годов для русификации программных продуктов, выпускаемых корпорацией Microsoft:

Кодировка windows 1251 в сайтостроении Кодировка будет 8-битной и содержит символы славянской группы языков, в которую входят русский, белорусский, украинский, болгарский, македонский, сербский – это дает преимущество перед остальными кириллическими кодировками(ISO 8859-5, KOI8-R, CP866). Однако у 1251-кодировки имеются и весомые недостатки:

  • 0xFF(25510) – это программный код, который зарезервирован для символа «я». В программах, которые не поддерживают чистый 8-ой бит, часто возникают непредсказуемые проблемы;
  • Нет псевдографики, которая присутствует в KOI8, CP866.

Ниже приведены символы из Code Page 1251 или сокращенно СР1251(числа под символами являются кодом в шестнадцатеричной системе такого же символа в Юникоде):

Кодировка windows 1251 в сайтостроении

Кодировка windows 1251 в html

Нередко у web-разработчиков и блогеров, обладающих разной квалификацией возникает проблема с кодировкой страниц: вместо подготовленного текста появляются неизвестные, нечитаемые символы. Чтобы разобраться с данной проблемой, надо понимать суть термина «кодировка страницы».

Текст в памяти компьютера хранится в виде определенного числа байт, а не в том виде, в котором он выводится в текстовом редакторе. Каждый байт будет кодом, который соответствует одному символу. Для того чтобы текст на странице выводился как следует, необходимо сообщить браузеру, какую таблицу кодов для расшифровки и выведения он должен использовать.

Таблица кодировок не будет универсальной, то есть, для расшифровки текста надо использовать ту, которая соответствует кодировке символов:

Кодировка windows 1251 в сайтостроении Для того чтобы html-документ корректно отобразился в браузере, надо указать используемую кодировку. Делается это следующим образом:

— между тегом <head> и закрывающим его </head> необходимо прописать <meta http-equiv=»Content-Type» content=»text/html; charset=windows-1251″> — исходя из данной строки, браузер будет использовать символы русского алфавита для выведения текста на странице.

Кодировка windows 1251 в PHP

Ни для кого не будет тайной, что генерация страниц проходит путем выборки и использования какой-то части информации, которая хранится в базе данных. При написании веб-сайта на PHP, чаще всего это mysql:

Кодировка windows 1251 в сайтостроении Нередко при смене веб-хостинга возникает проблема: разные кодировки информации в базе данных и в шаблонах страниц. Из-за этого одна сгенерированная страница может одновременно содержать пару кодировок. Если информация на веб-сайте представлена в кодировке виндовс 1251, то и чтение из базы данных должно осуществляться при помощи таблицы, в которой представлена win 1251 кодировка.

Для согласования расшифровки надо выполнить возможность mysql_query(«SET NAMES cp1251») – это означает, что преобразование из машинного кода будет осуществляться согласно таблице cp1251.

Кодировка windows 1251 в htaccess

При создании веб-сайта, предварительно настроив кодировки в шаблонах и базах данных, все равно может всплыть проблема некорректного выведения информации в браузере.

Для того чтобы для веб-ресурса была задана кодировка виндовс-1251, надо найти(или создать) файл .htaccess. Это файл, который хранит в себе дополнительные параметра и описания конфигураций web-сервера.

В нем для установки кодировки следует прописать следующие строки:

  • DefaultLanguage ru;
  • AddDefaultCharset windows-1251;
  • php_value default_charset «cp1251».

Таким образом, для корректного выведения текста должны совпадать его кодировка и таблица кодов, при помощи которой браузер будет расшифровывать символы. Для текстов, написанных на славянских языках, необходима win 1251 кодировка. Важно помнить, что элементы страниц и баз данных должны быть описаны при помощи одной таблицы кодов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *