Разное

Перевод кириллического домена: Конвертер punycode для .рф доменов

Содержание

Punycode-конвертер


Инструмент предназначен для преобразования русских доменных имён (или другой строки) в кодировку Punycode, которая используется в многоязычной системе доменных имён.
Возможно прямое и обратное преобразование.

WHOIS информацию о доменных именах (в том числе русских) можно посмотреть на странице Whois-сервис.


Суть технологии многоязычных доменов заключается в преобразовании имен из UNICODE в ASCII
совместимый код (ACE — ASCII Compatible Encoding) на стороне клиента,
и отправлении в систему DNS в преобразованном виде.


ASCII совместимый код (ACE) служит для того,
чтобы представить строки состоящие из символов набора UNICODE с помощью латинских букв нижнего
регистра и цифр, то есть с помощью символов, которые допускаются для имён доменов в традиционной системе DNS.
Для использования в многоязычной системе имён (iDNS) применяется алгоритм Punycode.


Допустим, Вы зарегистрировали домен на русском языке: хостинг-беларуси.рф
Тогда данное доменное имя в различных представлениях будет выглядеть так:


IDN (Unicode): хостинг-беларуси.рф


Punycode (ACE): xn—-8sbcgmofwni4adjeyt.xn--p1ai


Процесс работы будет следующим. Клиент запрашивает домен хостинг-беларуси.рф (вводит имя в адресной строке браузера). Это имя преобразуется в последовательность символов Punycode: xn—-8sbcgmofwni4adjeyt.xn--p1ai
Далее запрос на разрешение имени xn—-8sbcgmofwni4adjeyt.xn--p1ai в IP-адрес отправляется на соответствующий DNS-сервер и DNS-сервер возвращает ответ.

Преобразование необходимо, поскольку не все существующие DNS-серверы поддерживают обработку доменных имен в формате IDN.

Таким образом, к сайту можно обратиться, используя либо имя IDN (в этом случае преобразование имени в Punycode осуществляется на стороне клиента непосредственно в браузере), либо непосредственно Punycode.

Поделитесь Punycode-конвертером с друзьями и знакомыми:

IDN конвертер национальных доменов


Конвертер преобразует IDN домены, состоящие из символов национального алфавита, в Punycode-представление, состоящее из символов ASCII. Так, например, кириллический домен РОССИЯ.РФ имеет вид XN—h2ALFFA9F.XN—P1AI. Инструмент конвертирует IDN домены в XN— и обратно. Конвертер IDN также конвертирует и ссылки.

IDN конвертер онлайн


Внимание! JavaScript отключен.
Без включенной поддержки JavaScript функция IDN конвертер доменных имён работать не будет.
Включите в своём браузере поддержку JavaScript и обновите страницу.

  • IDN: ASCII / Punycode
  • IDN: Национальный вид

Помощь. Ниже представлено описание, как пользоваться конвертером IDN доменов. Какие можно вводить имена доменов и можно ли вводить несколько доменов.

Как вводить имя домена


Имя домена можно вводить как РОССИЯ.РФ так и в виде XN—h2ALFFA9F.XN—P1AI. Можно использовать заглавные или прописные буквы. Можно вводить сразу несколько доменов, разделителем при этом может быть пробел, также можно вводить каждый домен с новой строки.

Ссылки с кириллическим доменом


Конвертер IDN доменов поддерживает работу со ссылками. Например, ссылка вида http://РОССИЯ.РФ/main/page9.html будет конвертирована в такой вид http://xn--h2alffa9f.xn--p1ai/main/page9.html.

Зачем нужен Punycode?


Зачем конвертировать русские домены в Punycode? Не все браузеры и поисковые системы понимают домены, написанные на национальном языке. Например, русскоязычный домен РОССИЯ.РФ не все браузеры и поисковые системы могут корректно обработать, в некоторых случаях будет ошибка 404. Но все браузеры и все поисковые системы поймут XN—h2ALFFA9F.XN—P1AI. Поэтому в ссылках рекомендуется указывать IDN домены в Punycode формате.

Например, href="http://xn--h2alffa9f.xn--p1ai/".

Robots.txt и кириллические домены


В файле robots.txt запрещается указывать домены в национальной кодировке. Имена доменов в robots.txt можно указывать только латинскими буквами, соответственно, все национальные IDN домены должны быть конвертированы в Punycode-представление. Пример, host: xn--h2alffa9f.xn--p1ai.

Комментарии (0) — IDN конвертер доменных имён


Отправить комментарий


Комментарий отправлен и ожидает модерации. Отправить новый комментарий.

Punycode: как использовать метод, паникод-конвертеры

Punycode — это метод преобразования символов, содержащихся в доменных именах, из Unicode в ACE (ASCII Compatible Encoding). Полученные на выходе символы, полностью соответствуют стандартам инфраструктуры DNS.

Зачем нужен

Система доменных имен располагает собственными правилами. Одним из них является следующее условие: домен должен состоять максимум из 26 символов, относящихся к латинскому алфавиту или цифрам. Также в доменном имени может использоваться дефис.

Процедура преобразования проходит в два этапа:

  1. Сначала анализируется исходник, из которого отбираются все символы, соответствующие кодировке ACE.
  2. Если в домене встретились символы, отличные от ACE, к итоговому слову прибавляется дефис. Далее происходит окончательная процедура преобразования.

Весь этот процесс и называется Punycode.

Где используется в доменах

Punycode приходит на помощь тогда, когда доменное имя регистрируется на языке не латинского происхождения и состоит, например, из кириллических символов.

Каким бы изначально не было доменное имя, оно будет приведено к стандартам DNS в обязательном порядке.

Например, доменное имя этого сайта зарегистрировано в зоне .рф и выглядит так:

вебмастерье.рф

Согласно правилам преобразования Punycode, итоговый вариант домена будет выглядеть следующим образом:

xn--80abcmca0c8ahk6i.xn--p1ai

Этот набор символов будет соответствовать правилам системы доменных имен и идентифицировать домен вебмастерье.рф. Если вы в браузере введете xn--80abcmca0c8ahk6i.xn--p1ai , то вы попадете именно на сайт вебмастерье.рф.

Минусы Punycode в доменах

Основным недостатком использования таких доменных имен является их внешний вид после преобразования. Многие вебмастера попросту не видят смысла в домене, который будет выглядеть в виде непонятного набора символов.

Сервисы и программы могут не воспринимать такие кодировки, что тоже накладывает ряд трудностей.

Также, на данный момент нет возможности зарегистрировать почтовый адрес, соответствующий кириллическому домену. Ведь в каждом адресе почты присутствует символ @, который доступен только в латинском варианте раскладки.

Говоря вкратце, все преимущества таких доменных имен с лихвой перекрываются техническими сложностями и ограничениями.

Сервисы конвертеры Punycode

Чтобы узнать, как будет выглядеть будущее доменное имя в итоговом варианте, можно воспользоваться специальными сервисами, которые называются Punycode-конвертерами.

Рассмотрим некоторые из них.

Конвертер HB.BY

Сайт: https://hb.by/punycode-converter.aspx

Онлайн-конвертер с простым и понятным интерфейсом. Может преобразовывать из Unicode в ACE и обратно.

Конвертер IDN

Сайт: https://handynotes.ru/tools/punycode

Этот сервис умеет конвертировать только в одну сторону. Интерфейс прост и понятен. Вводим в поле доменное имя и получаем его в формате ACE.

И так далее. Подобных сервисов предостаточно.

Заключение

Паникод служит для преобразования символов в доменном имени отличном от латинского. Мы бы не рекомендовали использовать кириллические домены, из за такой кодировки могут возникать сложности в продвижении сайта.

Работа с кириллическими доменами и URL в robots.txt

Введение

Уже более 7 лет поддерживается возможность регистрации и приобретения доменных имен в зоне .РФ. Проще говоря, адресов сайтов, которые написаны русскими символами. Для рядового обывателя подобное нововведение стало приятным дополнением, а вот для SEO специалистов доставило только неудобства.

По сей день многие сервисы и инструменты не поддерживают кириллические символы в URL адресах. Один из них — файл robots.txt. Сегодня речь пойдет именно о нем.

Кириллический домен в robots.txt

Так как файл robots.txt не поддерживает кириллические символы, необходимо перевести их в так называемый punycode. Punycode (по-русски «паникод») — это метод преобразования Unicode-символов (в нашем случае кириллицу) в ACE-последовательности, которые состоят из алфавитно-цифровых символов. Так как именно такие последовательности латинских символов поддерживаются в доменных именах.

Перевод кириллического домена в punycode возможен при помощи многочисленных online конверторов, которые предоставляют такую возможность совершенно бесплатно. Один из них — http://wwhois.ru/punycode.php. Именно его мы и приведем в качестве примера.

Создаем robots.txt для кириллического домена

Предположим, что у нас есть домен www.цифровые-ежи.рф, по которому доступен сайт на WordPress. Перед нами стоит задача создать и настроить robots.txt.

По большому счету, сам домен в файле robots.txt Вам понадобится только в инструкциях host и sitemap.xml. Поэтому, создаем пустой файл формата .txt и добавляем в него шаблонные инструкции для нашей CMS WordPress.

После этого, следуем по ссылке http://wwhois.ru/punycode.php и преобразовываем наш домен в punycode.

Далее, пользуясь инструкциями к размещению директив host и sitemap.xml добавляем уже преобразованный в punycode домен «.РФ».

У нас получился следующий файл.

User-agent: Yandex
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Host: xn—-ctbjbfhf6br3bu9d.xn--p1ai

Sitemap: http://xn—-ctbjbfhf6br3bu9d.xn--p1ai/sitemap.xml

Кириллический URL в robots.txt

Несмотря на то, что домен сайта написан на латинице, в индекс могут попасть нежелательные URL, содержащие кириллические символы. Это случается по ряду следующих причин:

  • Некоторые CMS по умолчанию прописывают кириллические символы для адресов, меток, тегов и разделов;

  • Загружаются изображения с русскоязычными названиями;

  • В латинские URL по ошибке вставляются кириллические символы;

  • Множество других причин, таких как некорректная работа компонента, неверная выгрузка товаров и т.д.

Такие URL имеют вид: http://dh-agency.ru/киррилический-урл.

Если Вы добавите в robots.txt URL подобного вида, то непременно увидите ошибку. Все дело в том, что даже такие адреса туда добавлять нельзя. Чтобы успешно работать с такого рода ссылками необходимо преобразовать их в понятную для робота последовательность символов.

Сделать это можно при помощи «online кодировщика», к примеру https://www.design-sites.ru/utility/url-encoding.php

Подобные преобразованные адреса уже поддерживаются файлом robots.txt. Не нужно путать кодировку URL  с Punycode, это разные вещи.

Подробнее о punycode

Punycode был разработан специально для преобразования доменов содержащих Unicode-символы (символы, не входящие в латинский алфавит) в последовательность ASCII.

Все дело в том, что единый стандарт доменных имен поддерживает исключительно 26 символов латинского алфавита, цифры от 0 до 9 и дефис. Для ряда языков основанных на латинице, к примеру английского, этого вполне достаточно.

Но что делать с другими языками, которые содержат множество дополнительных символов? К примеру, немецкие ä (а умлаут) или ö (о умлаут)?

Что бы решить данную задачу, была придумана система перевода доменов в однозначную ACE-последовательность (ASCII Compatible Encoding), которая в свою очередь состоит исключительно из 26 символов латинского алфавита, цифр от 0 до 9 и дефисов.

Именно такую конвертацию необходимо сделать, чтобы полноценно работать с доменными именами написанными на кириллице.

Перекодировщик кириллических доменов в xn-- (Punycode)

Сразу скажу, что кодировка в Punycode идет по принципу генерации хешей. Это значит, что тебе не удаться просто взять кириллические (русские) буквы и заменить каждую на некую комбинацию латинских символов.

Вот сам передкодировщик. Вставляете в поле кириллический домен, нажимаете кнопку Punycode и готово.

Немного информации из 2010, если никуда не спешите

Задумался сегодня над кириллическими доменами. Для тех, кто не знает, кириллические домены набираются в адресной строке браузера русскими буквами.

Ну например домен лексиум.ру

Спрашивается, для чего такие домены нужны?

Мое мнение — не нужны совсем!

НО! Они есть. Они доступны для регистрации. С вводом кирилических доменов .РФ люди все чаще будут задаваться вопросом, как писать ваш сайт? Русскими или латинскими (английскими) буквами?

А это значит, что кирилические домены в зонах .РУ, .КОМ, .НЕТ и пр., которые сейчас пустуют, все-таки начнут скупать.

Ну и скупай, —  скажете вы.  В чем проблема зайти и купить? При чем тут перекодирование?

А вот при чем… На самом деле, когда вы вводите кириллическое доменное имя в адресную строку браузера, происходит его незаметная перекодировка (не смейтесь) в последовательность латинских символов.

Так домен лексиум.ру превращается в xn--80adjurfhd.xn--j1aef

Совершенно не информативная и нечитаемая белеберда…

А как быть, если вы купили кириллический домен у регистратора и хотите подключить его на хостинг?

Простые способы перекодировки в xn-- (Punycode)

Заходите в админку хостинг-провайдера, вписываете поддержку домена, например лексиум.ру, а поддержка и не включается. Ошибку выдает! Не понимает хостинг кириллические домены…

Значит нужно вводить латинскими, как уже показывал  xn--80adjurfhd.xn--j1aef

А как перевести понятный и читаемый кириллический домен в эту Puncode-белеберду?

А сделать это можно на сайте регистратора webnames.ru

Там же, кстати, можно и купить кирилические домены.

Кстати, если ваш браузер (IE или FF) не поддерживает кириллические домены, это можно исправить установкой программы программу iClient™.

Вот ссылка:

Update 07.10.2017: Сейчас Punycode для кириллических доменов поддерживается даже мобильными браузерами, так что проблем возникать не должно.

Если требуется подключить кодировку-раскодировку (Punycode) к своему сайту. Ну мало-ли. Есть такие веб-мастера, которые хотят сваять свой собственный Punycode-кодировщик и поставить его на сайт в надежде на на резкий наплыв страждущих. Им придется поискать готовый класс и подключить его к соответствующей форме.