Меню сайта
Анонсы
mIRC скриптерам Опытным скриптерам
Категории
services [4]
help
о Mirc [16]
Другое [3]
Ircnet.ru [4]
сеть
IRC [11]
Мини-чат
Случайное фото
emotion
+++

К нам присоединилось:
Сегодня: 0
Вчера: 0
За последние 7 дней: 0
За последние 30 дней: 0
Отправить SMS и MMS
SMS
Beeline МТС Мегафон

ММС
Beeline МТС Мегафон
Главная » Статьи » Irc » IRC

Кодировки
Перекодировка кириллицы 
На российских серверах запущена система перекодировки кириллицы, предназначенная для того, чтобы люди, пишушие в разных кодировках (Windows-1251, KOI-8), могли без проблем видеть сообщения друг друга. 
Когда Вы подключаетесь к серверу IRC, Вы используете один из доступных портов. Стандартным для IRC является порт 6667, однако все российские серверы позволяют использовать порты от 6660 до 6669. Каждый из портов сервера IRC связан с определенной кодировкой. Клиенты, которые пишут в этой кодировке, должны подключаться на соответствующий порт. При этом сообщения, которые посылает клиент, посылаются другим клиентам перекодированными в соответствии с установками этих клиентов. Например, если клиент, подключенный к порту, где используется Windows-1251, посылает сообщение в какой-либо канал, то другому клиенту, находящемуся на этом же канале и подключенному к порту, где используется KOI-8, это сообщение посылается перекодированным в KOI-8, клиенту, подключенному к порту, где используется транслит - перекодированным в транслит и т.п.

Всего поддерживается 3 кодировки: Windows-1251, KOI-8 и транслит. Транслит - это способ общения на русском языке, когда буквы кириллицы заменяются латинскими буквами, схожими по звучанию, или сочетаниями латинских букв, если соответствующая буква отсутствует в латинском алфавите. Раньше он был фактическим стандартом общения в IRC, поскольку транслит гарантирует, что Ваш собеседник увидит написанное Вами сообщение неизмененным и сможет понять его. Сейчас все больше людей использует кириллицу, но все равно транслит в IRC - довольно частое явление.

К сожалению, перекодировка работает только на российских серверах - администраторам зарубежных серверов нет дела до наших проблем с кодировками. Для того, чтобы не создавать хаоса для пользователей зарубежных серверов, которые пишут кириллицей (их не так уж мало), все сообщения от пользователей российских серверов пересылаются пользователям зарубежных сетей в одной кодировке - Windows-1251, которая была выбрана в качестве основной кодировки кириллицы. Такой выбор кодировки обусловлен тем, что в Windows-1251 все буквы русского алфавита в ней расположены подряд и в алфавитном порядке. Порядок букв в KOI-8 был выбран не случайно, а для минимизации возможных проблем при потере старшего бита, однако, сейчас эта проблема встречается довольно редко.

Итак, на зарубежные серверы все сообщения пересылаются в кодировке WIndows-1251, и, соответственно, все сообщения, пришедшие от пользователей зарубежных серверов, предполагаются написанными в кодировке Windows-1251.

Правила, которые использует сервер при перекодировке кириллицы, таковы:
Если пользователь использует кодировку Windows-1251, то его сообщения посылаются другим пользователям, использующим Windows-1251, без перекодировки, а использующим KOI-8 и транслит - с соответствующей перекодировкой. Сообщения, приходящие такому пользователю от других пользователей с кодировками Windows-1251 и транслит, не перекодируются, приходящие от пользователей с кодировкой KOI-8 - перекодируются в Windows-1251.

Если пользователь использует кодировку KOI-8, то его сообщения посылаются пользователям, использующим KOI-8, без перекодировки, а использующим Windows-1251 и транслит - с соответствующей перекодировкой. Сообщения, приходящие такому пользователю от других пользователей с кодировками KOI-8 и транслит, не перекодируются, приходящие от пользователей с кодировкой Windows-1251 - перекодируются в KOI-8.

Если клиент использует кодировку транслит, то в его сообщениях не должно быть символов кириллицы. Если они встречаются, то сообщение никуда не посылается, а пославшему сообщается об ошибке. Так сделано потому, что в этом случае невозможно определить, в какой кодировке были написаны буквы кириллицы в сообщении - Windows-1251 или KOI-8. Сообщения, приходящие от других клиентов с кодировкой транслит, не перекодируются, приходящие от клиентов с кодировками Windows-1251 и KOI-8 - перекодируются в транслит.

Серверы используют сокращенные названия кодировок: win - Windows-1251, koi8 - KOI-8, trans - транслит. При подсоединении к российскому серверу IRCNet Вы можете увидеть сообщение "Your encoding is set to XXX", где XXX - используемая кодировка. Первоначальный выбор кодировки определяется номером порта, к которому Вы подключаетесь. На всех серверах существует единое соответствие портов и кодировок: 
Windows-1251 -- 6660, 6663, 6666, 6667 
KOI8-R -- 6662, 6664, 6668 
Транслит -- 6661, 6665, 6669

Для изменения кодировки после подсоединения к серверу существует команда ENCODING. В большинстве IRC-клиентов ее можно активизировать, набрав /quote encoding. Если дать эту команду без параметров, то она сообщает текущую используемую кодировку, а форме /quote encoding XXX - устанавливает кодировку в XXX, где XXX - сокращенное название кодировки.

Как можно заметить, описанная система перекодировки доставляет определенные неудобства тем, кто пользуется зарубежными серверами и пишет в KOI-8. Однако полностью избежать неудобств нельзя просто потому, что мы не можем установить какую-либо систему перекодировки на зарубежные серверы. Мы ориентировались на то, что пользователей, пишуших в KOI-8, все-таки меньше, чем пишущих в Windows-1251, и они, как правило, более грамотны и быстрее смогут настроить перекодировку в своем IRC-клиенте, которая позволяла бы им нормально принимать сообщения, посланные в кодировке Windows-1251. Практически все IRC-клиенты имеют возможность задавать такую перекодировку. Например, в ircII и его родственниках - EPIC, BitchX и т.п. - достаточно набрать команду /set translation russian_win. При этом сообщения от сервера, посланные в Windows-1251, будут перекодированы клиентов в KOI-8 и в таком виде показаны, а сообщения, написанные пользователем, будут перекодированы из KOI-8 в Windows-1251 и в таком виде посланы на сервер.

К сожалению, наши призывы к зарубежным пользователям KOI-8 были услышаны лишь отчасти. Существует целая группа каналов (#rusunix, #fidorus и т.п.), традиционные хозяева которых не пожелали ничего настраивать, выражая таким, на наш взгляд, неадекватным способом свое неприятие кодировки Windows-1251. В результате на этих каналах принято выставлять на сервере кодировку Windows-1251, а на самом деле писать в KOI-8. При пересылке на зарубежные серверы такие сообщения не перекодируются, и их нормально видят пользователи зарубежных серверов, пишущие в KOI-8. Однако это достигается ценой того, что такой пользователь не может общаться на кириллице с другими пользователями, которые настроили все правильно. Нам известна эта проблема, однако пока нам кажется слишком жесткой мерой отключать от сервера за использование неправильной кодировки. Мы надеемся, что здравый смысл возобладает, и еще раз призываем всех пользователей настраивать свою кодировку правильно.

Категория: IRC | Добавил: [StingeR] (14 Марта 09)
Просмотров: 4237 | Комментарии: 2 | Рейтинг: 0.0/0 |

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Мини инфо
гость
04:47:11
Группа: Гуси

Логин:
Пароль:
Поиск по сайту
:)

456
Код нашей кнопки:
Рекомендуем :)
Лучший mIRC клиент:)
Лучший mIRC БОТ:)
Френды :)
[CooLBots] EpicNet
Статистика
Каталог webplus.info Locations of visitors to this page
Онлайн всего: 1
Гостей: 1
Пользователей: 0

Были на сайте сегодня:
Коментариев: 4524
Форум: 354/2694
Фоток: 1227
Новостей на сайте: 42
Файлов: 492
Статьи: 81
Гостевая книга: 25


Всево зарегено: 34796
Из них
Пользователей: 34476
Проверенные 311
Администраторы 5
Гл. Администраторы 3
Из них
Парней: 34608
Девушек: 170
Copyright MyCorp © 2024Хостинг от uCoz