6 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Что такое URL адрес и как с ним работать. УРЛ со слешем или без – почему правильно именно так? Использование специальных символов в URL

УРЛ со слешем или без — почему правильно именно так?

Споры по этому вопросу — как правильно писать URL, со слешем на конце или без? — были и будут. Аргументация встречается разнообразная, и часто противоречива. А расплату за неверную запись универсального локатора ресурса (URL) воображают двух видов. Со стороны поисковиков — это якобы штрафные санкции за дубли страниц. С точки зрения производительности — якобы лишний редирект на страницу верной записи, автоматически генерируемый сервером.

Однако, разбирая технические спецификации стандартов Интернета, в частности документ ” RFC 1738 — Uniform Resource Locators (URL)”, приходится признать, что оба варианта записи адреса веб-ресурса формально правильные, и санкция за использование того или иного варианта — не более чем бзик поисковой системы или байки псевдо-SEO-шников.

С позиции лаконичности, более правильным представляется вариант «без слеша на конце» вне зависимости от того, адресует ли ваша ссылка «файл» на сервере или «папку», косвенное доказательство чему будет продемонстрировано ниже. Но и нет ни одного утверждения в документе, что иной вариант неверный или ссылается совсем на другой ресурс.

Загружать вас многостраничным переводом упомянутого RFC не стану, так как, во-первых, целью вопроса были слеши на конце URL, и во-вторых, публикация адресована простым пользователям движков, в том числе и моего, которым вся детализация не интересна, они ждут кратких разъяснений и доказательств по существу. Соответственно, я буду цитировать выдержки из сего документа в качестве доказательной базы и пояснять. Кому и это не интересно, может сразу смотреть довод в конце статьи.

Первым делом привлеку внимание к выдержке из параграфа 2. General URL Syntax (общий синтаксис URL).

То есть сам URL — это чистая абстракция. Что он может показаться нам внешне похожим на имя файла или папки, вовсе не означает физическое указание на именно такой-то файл, а не какой-нибудь другой в файловом пространстве сервера. Дальше в документе об этом заявляется прямо.

Вообще в отношении http-ссылок в принципе неверно говорить, что например

  • http://domain.com/path/subpath/filename.txt — якобы указывает на файл
  • http://domain.com/path/subpath/ — якобы указывает на папку
  • http://domain.com/path — якобы неверно указывает на папку

Мы просто привыкли так говорить, потому что удобно ассоциировать ссылки с файлами на сайте. В действительности все эти ссылки указывают на некие ресурсы. Что же скрывается за каждым ресурсом, то есть какой именно реальный файл или папка, то уже определено конфигурацией сервера.

Важно уяснить, что в ссылках нет такого понятия как «файл», «папка», «подпапка». Никакой слеш на конце или его отсутствие не значит ровным счетом ничего до тех пор, пока ссылка не пройдет трансформацию внутри сервера, и уже он сам решит, куда же на самом деле указывает ссылка. Только это решение относится к внутренней архитектуре сервера.

Далее выдержка из параграфа 2.3 Hierarchical schemes and relative links (иерархические схемы и относительные ссылки).

То есть утверждается, что в отдельных схемах адресов содержимое локатора ресурса не воспрещено подразумевать иерархическим, причем пока не оговаривалось, что иерархия эквивалентна какой-либо форме, скажем файловой.

Далее выдержка из параграфа 3.1. Common Internet Scheme Syntax (общий синтаксис сетевой схемы).

Это, кстати, ответ на вопрос, производный от рассматриваемого нами. Нередко и по такому вопросу спорят: как правильно давать ссылку на домен (хост) — без слеша в конце или со слешем?

    Как правильно http://domain.com/ или http://domain.com ?

И так и так правильно. Просто первый слеш после имени хоста предназначен для отделения имени пути от имени хоста. Тот же параграф документа сообщает об этом так:

Ни словом не обязали вас ставить этот замыкающий символ или не ставить, когда url-path равен пустой строке (как сказали бы многие из нас, когда URL ссылается в корень сайта). Никто не имеет права применить к вам штрафные санкции «за два дубля главной страницы», ибо согласно спецификации, в обоих случаях вы ссылаете URL на один и тот же ресурс.

    Продолжим еще одной выдержкой из того же параграфа.

Это лишнее подтверждение, что у каждой схемы локатора свое понятие «иерархии».

Далее выдержка из параграфа 3.2.4 Hierarchy (иерархия).

Несмотря на то, что этот параграф относится к схеме ftp, тем не менее его утверждения распространимы и на другие схемы.

Далее выдержка из параграфа 3.3. HTTP.

И наконец выдержка из параграфа 5. BNF for specific URL schemes (формальная запись для конкретных схем URL).

Здесь в квадратных скобках указаны опциональные части. Звездочка перед скобкой обозначает 0 или более повторов такого фрагмента, как указан в скобках. Вертикальную черту следует понимать как ИЛИ.

Обратите внимание, как точно по правилам формируется элемент hpath. Элементы hsegment пути разделяются слешем. Словно намекая на важную идею, что слеш делит путь на иерархические части и всегда находится внутри. В принципе не исключается, что последний элемент hsegment может являться пустой строкой (это следует из его определения), и тогда на конце URL невольно появляется закрывающий слеш.

Аналогично тому, как ссылки

адресуют посетителя в корень сайта, так и ссылки

адресуют посетителя во второй уровень иерархии ресурса. А то что некий сервер может интерпретировать слеш на конце по своему и начать внутренне редиректить скажем на файл index.html, это уже частный случай конкретной конфигурации, точно так как и редиректы с помощью mod_rewrite определяют свое понятие иерархического строения URL, в котором элементы пути могут приравниваться к параметрам запроса и вовсе не иметь общего с файловой структурой сайта (классический пример: http://domain.com/ru/path, элемент ru — это параметр текущего языка, а не папка на сайте).

Особо подчеркну, что это внутренние знания сервера, обусловленные его конфигурацией. Внешний сервис, скажем тот же поисковик, домыслов делать не может и понятия не имеет, отличаются ли и чем ссылки со слешем и без, если только сервер сайта специально не настроили так, чтобы по таким ссылкам выдавать разный контент.

На уровне реализации вопрос слешей на концах не имеет принципиального значения, чему множество подтверждений среди именитых порталов. На одних все ссылки завершают слешем, на других — без слеша. Главное чтобы контент по ссылкам не оказывался разным.

УРЛ со слешем или без – почему правильно именно так?

Споры по этому вопросу – как правильно писать URL, со слешем на конце или без? – были и будут. Аргументация встречается разнообразная, и часто противоречива. А расплату за неверную запись универсального локатора ресурса (URL) воображают двух видов. Со стороны поисковиков – это якобы штрафные санкции за дубли страниц. С точки зрения производительности – якобы лишний редирект на страницу верной записи, автоматически генерируемый сервером.

Однако, разбирая технические спецификации стандартов Интернета, в частности документ ” RFC 1738 – Uniform Resource Locators (URL)”, приходится признать, что оба варианта записи адреса веб-ресурса формально правильные, и санкция за использование того или иного варианта – не более чем бзик поисковой системы или байки псевдо-SEO-шников.

С позиции лаконичности, более правильным представляется вариант без слеша на конце вне зависимости от того, адресует ли ваша ссылка “файл” на сервере или “папку”, косвенное доказательство чему будет продемонстрировано ниже. Но и нет ни одного утверждения в документе, что иной вариант неверный или ссылается совсем на другой ресурс.

Загружать вас многостраничным переводом упомянутого RFC не стану, так как, во-первых, целью вопроса были слеши на конце URL, и во-вторых, публикация адресована простым пользователям движков, в том числе и Impera CMS, которым вся детализация не интересна, они ждут кратких разъяснений и доказательств по существу. Соответственно, я буду цитировать выдержки из сего документа в качестве доказательной базы и пояснять. Кому и это не интересно, может сразу смотреть вывод в конце статьи.

Общий синтаксис URL

Первым делом привлеку внимание к выдержке из параграфа 2. General URL Syntax (общий синтаксис URL). В каждом случае буду приводить фрагмент текста на языке оригинала и следом перевод на русский язык.

То есть сам URL – это чистая абстракция. Что он может показаться нам внешне похожим на имя файла или папки, вовсе не означает физическое указание на именно такой-то файл, а не какой-нибудь другой в файловом пространстве сервера. Ниже в документе об этом будет заявлено прямо.

Заметка Вообще в отношении http-ссылок в принципе неверно говорить, что например

  • http://domain.com/path/subpath/filename.txt – якобы указывает на файл
  • http://domain.com/path/subpath/ – якобы указывает на папку
  • http://domain.com/path – якобы неверно указывает на папку

Мы просто привыкли так говорить, потому что удобно ассоциировать ссылки с файлами на сайте. В действительности все эти ссылки указывают на некие ресурсы, никоим образом не обозначая тип ресурса. Что же скрывается за каждым ресурсом, то есть какой именно реальный файл или папка и какой тип контента будет отдан по такой ссылке, то уже определено конфигурацией сервера.

Важно уяснить, что в ссылках нет такого понятия как “файл”, “папка”, “подпапка”, “текст”, “картинка”, “html”, “скрипт”, “таблица стилей” и так далее. Никакой слеш на конце или его отсутствие не значит ровным счётом ничего до тех пор, пока ссылка не пройдёт трансформацию внутри сервера, и уже он сам решит, куда же на самом деле указывает ссылка и какой контент какого типа скрывается за ней. Только это решение относится к внутренней архитектуре сервера.

Иерархические схемы

Далее выдержка из параграфа 2.3 Hierarchical schemes and relative links (иерархические схемы и относительные ссылки).

То есть утверждается, что в отдельных схемах адресов содержимое локатора ресурса не воспрещено подразумевать иерархическим, причём пока не оговаривалось, что иерархия эквивалентна какой-либо форме, скажем файловой.

Общий синтаксис сетевой схемы

Далее выдержка из параграфа 3.1. Common Internet Scheme Syntax (общий синтаксис сетевой схемы).

Заметка Это, кстати, ответ на вопрос, производный от рассматриваемого нами. Нередко и по такому вопросу спорят: как правильно давать ссылку на домен (хост) – без слеша в конце или со слешем?

Как правильно http://domain.com/ или http://domain.com ?

И так и так правильно. Просто первый слеш после имени хоста предназначен для отделения имени пути от имени хоста. Тот же параграф документа сообщает об этом так:

Ни словом не обязали вас ставить этот замыкающий символ или не ставить, когда url-path равен пустой строке (как сказали бы многие из нас, когда URL ссылается в корень сайта). Никто не имеет права применить к вам штрафные санкции “за два дубля главной страницы”, ибо согласно спецификации, в обоих случаях вы ссылаете URL на один и тот же ресурс.

Продолжим ещё одной выдержкой из того же параграфа.

Это лишнее подтверждение, что у каждой схемы локатора своё понятие “иерархии” и способ её интерпретации.

Иерархия

Далее выдержка из параграфа 3.2.4 Hierarchy (иерархия).

Несмотря на то, что этот параграф относится к схеме ftp, тем не менее его утверждения распространимы и на другие схемы (http, gopher, prospero и так далее). Лишь в схеме file символ слеша логично обозначает то же, что и в именах файлов, например file://server_or_device/path/subpath/filename.txt .

Далее выдержка из параграфа 3.3. HTTP.

Заметка Здесь также утверждается, что можно указывать ссылку без оконечного слеша. В данном случае речь шла о ситуации, когда путь ссылки пустой – указывает на корень хоста.

Формальная запись

И наконец выдержка из параграфа 5. BNF for specific URL schemes (формальная запись для конкретных схем URL).

Здесь в квадратных скобках указаны опциональные части. Звёздочка перед скобкой обозначает 0 или более повторов такого фрагмента, как указан в скобках. Вертикальную черту следует понимать как ИЛИ.

Обратите внимание, как точно по правилам формируется элемент hpath – путь ссылки. Элементы hsegment пути – сегменты – разделяются слешем. Словно намекая на важную идею, что слеш делит путь на иерархические части и всегда находится внутри. В принципе не исключается, что последний элемент hsegment может являться пустой строкой (это следует из его определения), и тогда на конце URL невольно появляется закрывающий слеш.

Вывод

Деление пути на сегменты с помощью символа слеша подразумевает наличие непустых имён этих сегментов. Соответственно, ссылка со слешем на конце видится нелогичной (хотя и не воспрещена) в том смысле, что она вроде бы указывает на некий последний сегмент пути, но притом никак не называет этот сегмент. Точно так как нелогична (но тоже не воспрещена) ссылка http://domain.com/level1////levelX , не называющая промежуточные сегменты пути, если путь рассматривать не как набор параметров, а как иерархическую структуру.

Просторечным языком смысловое наполнение двух ссылок можно пояснить так:

  • http://domain.com/level1/level2 – адресует в дефолтную начальную точку второго уровня иерархии
  • http://domain.com/level1/level2/ – адресует в неопределённую точку внутри второго уровня иерархии, то есть как бы на сервер возлагают задачу, что “мы обращаемся ко второму уровню иерархии, а ты сам определи, какую точку считаешь в этом уровне дефолтной начальной”.

Несмотря на оконечный слеш во второй ссылке, она всё же адресует во второй уровень иерархии, а не в третий, потому что ссылка явно не назвала имя третьего уровня.

Из всего сказанного выше следует, что аналогично тому, как ссылки

адресуют посетителя в корень сайта, так и например ссылки

адресуют посетителя во второй уровень иерархии ресурса. А то что некий сервер может интерпретировать слеш на конце по-своему и начать внутренне редиректить на дефолтную начальную точку уровня – скажем на файл index.html , это уже частный случай конкретной конфигурации. Точно так как и в реализации системы человеко-понятных URL все записи редиректов с помощью серверного модуля mod_rewrite определяют своё (присущее конкретному движку) понятие иерархического строения URL, в котором элементы пути могут приравниваться к параметрам запроса и вовсе не иметь общего с файловой структурой сайта (классический пример: http://domain.com/ru/path , элемент ru – это параметр текущего языка, а не папка на сайте).

Особо подчеркну, что это внутренние знания сервера, обусловленные его конфигурацией, а также установленным на сайте движком. Внешний сервис, скажем тот же поисковик, домыслов делать не может и понятия не имеет, отличаются ли и чем ссылки со слешем и без, если только сервер сайта специально не настроили так, чтобы по таким ссылкам выдавать разный контент.

К сведению

На уровне реализации вопрос слешей на концах не имеет принципиального значения, чему множество подтверждений среди именитых порталов. На одних все ссылки завершают слешем, на других – без слеша. Главное чтобы контент по ссылкам не оказывался разным, и ещё для Яндекса нужно прописать 301-й редирект с тех ссылок, которыми вы не пользуетесь (скажем оканчивающихся слешем), на те, которыми пользуетесь. Дело в том, что по неподтверждённым утверждениям службы поддержки Яндекса, этот поисковик якобы может ошибаться и не “склеивать” (запоминать в своих знаниях) или с некоторым запозданием склеивать слеш-без-слешевые адреса в один.

Вот пример реализации такого редиректа с помощью корневого файла .htaccess :

Гуглу (опять же по сведениям, не подтверждённым экспериментом) эти редиректы не важны, так как он будто бы умеет склеивать такие адреса правильно и без редиректов.

Помните Есть немало людей, считающих себя SEO-специалистами. Но не каждый из них таким является. Более того, темой SEO часто спекулируют без должных знаний и оснований, просто в расчёте на то, что и вы неосведомлены в этой области, поэтому легко поверите в любую “лапшу”. Когда вам говорят, что какая-то ваша страница “вылетела из индекса”, воспользуйтесь очень хорошей рекомендацией Яндекса: Узнавать об ошибках индексирования, если таковые возникают, можно в сервисе Яндекс.Вебмастер. В этом сервисе всегда можно увидеть список ваших страниц, находящихся в поиске и список страниц, по какой-то причине исключённых из поиска. Похожий сервис есть и у Гугла. Доверяйте этим знаниям, а не мнению псевдо-специалистов, которые где-то что-то краем уха слышали, и на том основании рекомендуют вам делать так, как им кажется единственно правильным.

Что ещё почитать по теме SEO

Вот Детальное изучение вопроса, который многие годы беспокоит начинающих сеошников – можно ли на одной странице сайта использовать несколько тегов H1. Исследование опубликовано в марте 2020 года, там даны подтверждающие ссылки на спецификацию стандарта HTML.

Вот Очень интересная публикация Малоизвестные факты SEO, вышедшая в апреле 2017 года. Там представлено большое исследование со множеством скриншотов, которое начиналось с целью проверить справедливость нескольких популярных суждений в области поискового продвижения и на понятных примерах донести результаты до обычного владельца сайта. То же исследование попутно демонстрирует молодому читателю ряд очевидных, обыденных, и скорее даже неприметных, но всё же удивительных особенностей органической выдачи в поисках Google и Yandex.

Вот Хотя следующая ссылка почти не касается SEO, всё же станет привлекательной для seo-мастеров, находящихся сейчас в поиске дополнительных заказов. Под ссылкой размещено коммерческое предложение, ребята нашли любопытный способ использования сайта. Частному бизнесу предлагают создание рекламного щита онлайн на основе какой-то специальной темы, под управлением которой сайт, а точнее его первый экран выглядит словно бы баннерная растяжка на билбордах наружной рекламы. На смартфоне повернул экран, растяжка стала вертикальной и занимает всю площадь экрана, повернул назад, стала горизонтальной и снова на весь экран. А под первым экраном есть текстовый придаток, куда пользователи обычно не скролят, но поисковик хорошо видит этот текст. Так вот самые шустрые буратины регионального бизнеса покупают себе эти недорогие онлайн билборды в качестве выгодной альтернативы контекстной рекламе и контекстно-медийной сети Яндекса и Гугла. А чтобы по-максимуму тусоваться в местном поисковом индексе, на продвижение своего щита готовы стегнуть денег сразу на кучу seo-текстов, что пахнет некислой суммой. Судя по слухам, заказы на 30 килорублей проскакивают, и так как ребята аутсорсят их партнёрам сеошникам, тут можно навести мосты партнёрства и получать хороший приработок.

Что такое URL адрес и как с ним работать

Заблудиться можно не только в лесу, но и в онлайне. И тому виной может стать неверный путь или адрес, ведущий к ресурсу. Вы не знаете, что такое URL адрес? Тогда прежде, чем пускаться в дальнейшее путешествие по виртуальному пространству, давайте разберемся с системой электронных адресов.

Что такое URL

URL является общепринятым стандартом записи адреса и указания на расположение ресурса в интернете. С английского его название ( Uniform Resource Locator ) переводится как единый указатель ресурсов. Можно встретить более раннюю расшифровку аббревиатуры URL — Universal Resource Locator ( универсальный локатор ресурсов ). Но оба значения скорее дополняют понятие URL , чем перечат друг другу.

Основной формат записи структуры URL адреса выглядит так:
://:@:/?#
— чаще всего имеется в виду протокол.
логин – логин пользователя, используемый для авторизации на ресурсе.
пароль – пароль пользователя для авторизации.
хост – доменное имя хоста.
порт – порт хоста, используемый во время подключения.
URL – путь, по которому находится запрашиваемый ресурс на сервере.
параметры и якорь – значение переменных и идентификатор на определенном ресурсе.

Передача значения переменных в строке запроса возможна лишь с помощью метода GET .

Рассмотрим формат URL адреса страницы запрашиваемого ресурса на практических примерах. На клиентской стороне URL отображается в адресной строке браузера:

Чаще всего встречаются такие варианты:

  • http:// ru.wikipedia.org/wiki/Заглавная_страница – для передачи запроса используется http ( протокол передачи гипертекста );
  • https://ru.wikipedia.org/wiki/Заглавная_страница — в качестве способа передачи используется https . Является защищенной формой протокола http , использующего шифрование ( SSL или TLS );
  • fttp://wikipedia.org/wiki/file.txt – протокол передачи файлов fttp ;
  • http://mail.ru/script.php?num=10&type=new&v=text – передача значений переменных в строке запроса с помощью метода GET .

Любой формат URL адреса представляет собой, прежде всего, символьную строку. В ее состав могут входить:
2; Латинские буквы.
2; Арабские цифры (0-9).
2; Зарезервированные символы («+», «=», «!» и другие).
2; Специальные символы – на них остановимся более подробно.

Использование специальных символов в URL

Конечно, таких уж слишком «специальных» символов в URL не используют. Но несколько есть:

  • ? – служит для отделения в строке запроса блока с передаваемыми параметрами;
  • & — отделяет передаваемые параметры друг от друга;
  • = — отделяет в параметре переменную от ее значения;
  • : — служит для отделения протокола от остальной части URL;
  • # — символ используется в локальной части адреса. Позволяет обратиться к определенной части запрашиваемой страницы;
  • @ — указывается в регистрационных данных пользователя и при передаче данных с помощью протокола mailto.

Но все это лишь теория. Поэтому перед тем, как узнать остальное, рассмотрим небольшой практический пример.

Наглядный пример

Возьмем для наглядности вот такую простую форму регистрации:

Вот ее код:

Первой строкой в начале формы мы прописали для нее файл обработчика (php) и метод передачи данных через URL адрес сервера:

Теперь приведем код файла обработчика (1.php) :

Введем данные в форму и отправим их для обработки на сервер. Вот что мы получим в итоге:

Обратите внимание на формат URL в адресной строке на первом скриншоте. После введения данных и нажатия на кнопку « Отправка данных » значения всех полей отправляются для обработки на сервер. А нас перенаправляет на страницу 1.php , где размещен код обработчика.

Перед тем, как посмотреть на результат обработки, взгляните на адресную строку на втором рисунке. В ней отображаются значения полей, переданных на обработку с помощью метода GET.

Для того чтобы скрыть данные, отправляемые на сервер, используется метод POST. Тогда приведенный выше URL будет выглядеть следующим образом:

Формат URL адресов на сайтах

Чаще всего на сайтах используется древовидная система URL . То есть правильный URL адрес состоит из нескольких вложенных друг в друга элементов, последний из которых и является нужной веб-страницей.

Для наглядности возьмем конкретный URL , являющейся одним из разветвлений адреса нашего сайта:

https://www.internet-technologies.ru/templates//page_2.html

Разберем его по частям:

  • www.internet-technologies.ru – эта часть является доменным именем сайта. Если набрать его в адресной строке браузера, то оно выведет на главную страницу сайта. В большинстве случаев это файл index. html ;
  • templates – данная часть адреса указывает на определенный раздел сайта. В нашем случае это раздел с шаблонами;
  • page_2.html – является конечным элементом URL , ведущего на веб-страницу тематического раздела ресурса.

Чаще всего URL адреса основных разделов полностью отображают карту сайта. Но не все так просто обстоит с переадресацией на сайтах, развернутых на основе популярных движков ( CMS ).

Особенности построения URL в WordPress

В WordPress , как и в любом движке, построенном на php , генерация всех страниц сайта происходит динамически. То есть одна часть берется из одного шаблона, другая генерируется « на лету » на основе нескольких.… Но такая летучесть имеет один существенный недостаток – наличие кусков передаваемых параметров в URL .

Причем это ущемляет не только эстетическую составляющую отображения адресов, но и неоднозначно воспринимается поисковиками. А это может негативно влиять на продвижение сайта:

Поэтому лучше использовать на своем сайте чистые URL адреса. Но где взять их, если CMS система не предусматривает возможности их редактирования.

Самый простой способ настройки отображения URL в WordPress – это использование специализированных плагинов:

  • Cyr-To-Lat – преобразует русские символы в адресах в латиницу;
  • Permalink Editor – добавляет дополнительные опции для настройки через админку (раздел «Постоянные ссылки»);
  • .html on pages – убирает расширение html c конца URL .

Ну а если и это не помогает, то нужно лезть собственными руками в само сердце CMS . Но это уже тема другого и более обширного по объему материала.

ИТ База знаний

Полезно

— Узнать IP – адрес компьютера в интернете

— Онлайн генератор устойчивых паролей

— Онлайн калькулятор подсетей

— Калькулятор инсталляции IP – АТС Asterisk

— Руководство администратора FreePBX на русском языке

— Руководство администратора Cisco UCM/CME на русском языке

— Руководство администратора по Linux/Unix

Навигация

Серверные решения

Телефония

FreePBX и Asterisk

Настройка программных телефонов

Корпоративные сети

Протоколы и стандарты

Популярное и похожее

Погружение в Iptables – теория и настройка

Создание доменного пользователя и ввод компьютера в домен

Бесплатные облачные хранилища для пользователей и разработчиков

Передача файлов по RDP – это просто

Snom 870 UC edition

URL и URI – в чем различие?

Разве это не одно и то же?

4 минуты чтения

В чем разница между URI и URL? Мы все используем много URL-адресов ежедневно. Иногда мы их набираем, иногда мы просто переходим на один URL из другого.

Для начала давайте расшифруем аббревиатуры:

  • URI – Uniform Resource Identifier (унифицированный идентификатор ресурса)
  • URL – Uniform Resource Locator (унифицированный определитель местонахождения ресурса)
  • URN – Unifrorm Resource Name (унифицированное имя ресурса)

Многие считают, что http://google.com или http://yandex.ru – это просто URL-адреса, но, однако мы можем говорить о них как о URI. Фактически, URI представляет собой расширенный набор URL-адресов и нечто, называемое URN. Таким образом, мы можем с уверенностью заключить, что все URL являются URI. Однако обратное неверно.

Почему? Как это работает?

Твое имя, скажем, “Джон Доу” – это URN. Место, в котором вы живете, например, “Улица Вязов, 13” – это уже URL. Вы можете быть идентифицированы как уникальное лицо с вашим именем или вашим адресом. Эта уникальная личность – это уже URI. И хотя ваше имя может быть вашим уникальным идентификатором (URI), оно не может быть URL-адресом, поскольку ваше имя не помогает найти ваше местоположение. Другими словами, URI (которые являются URN) не являются URL-адресами.

Вернемся в интернет:

  • URI – имя и адрес ресурса в сети, включает в себя URL и URN
  • URL – адрес ресурса в сети, определяет местонахождение и способ обращения к нему
  • URN – имя ресурса в сети, определяет только название ресурса, но не говорит как к нему подключиться

Как вы видите – первые две сточки в вашем браузере отобразились как ссылки и по ним можно перейти, однако по третьей сточке нельзя, потому что непонятно как и куда.

Как это можно показать наглядно:

Что такое URI?

URI обозначает Uniform Resource Identifier и по сути является последовательностью символов, которая идентифицирует какой-то ресурс. URI может содержать URL и URN.

URI содержит в себе следующие части:

  • Схема (scheme) – показывает на то, как обращаться к ресурсу, чаще всего это сетевой протокол (http, ftp, ldap)
  • Иерархическая часть (hier-part) – данные, необходимые для идентификации ресурса (например, адрес сайта)
  • Запрос (query) – необязательные дополнительные данные ресурса (например, поисковой запрос)
  • Фрагмент (fragment) – необязательный компонент для идентификации вторичного ресурса ресурса (например, место на странице)

Общий синтаксис URI выглядит так:

URI = scheme “:” hier-part [ “?” query ] [ “#” fragment ]

Что такое URL?

Теперь, когда мы знаем, что такое URI, URL тоже должен быть достаточно понятным. Всегда помните – URI может содержать URL, но URL указывает только адрес ресурса.

URL содержит следующую информацию:

  • Протокол, который используется для доступа к ресурсу – http, https, ftp
  • Расположение сервера с использованием IP-адреса или имени домена – например, wiki.merionet.ru – это имя домена. https://192.168.1.17 – здесь ресурс расположен по указанному IP-адресу
  • Номер порта на сервере. Например, http://localhost: 8080, где 8080 – это порт.
  • Точное местоположение в структуре каталогов сервера. Например – https://wiki.merionet.ru/ip-telephoniya/ – это точное местоположение, если пользователь хочет перейти в раздел про телефонию на сайте.
  • Необязательный идентификатор фрагмента. Например, https://www.google.com/search?ei=qw3eqwe12e1w&q=URL, где q = URL – это строка запроса, введенная пользователем.

[protocol]://www.[domain_name]:[port 80]/[path or exaction resource location]?[query]#[fragment]

Так как определить, является ли что-то URI или URL?

Что ж, если вы хотите знать, является ли это «что-то» URI или URL, вы всегда должны считать его как URI, потому что все URL являются URI.

Сравнение лицом к лицу: URI против URL

Давайте сделаем некоторое параллельное сравнение, чтобы все, что мы обсуждали до сих пор, было подкреплено, и вы никогда не запутаетесь в неправильном использовании URI и URL.

URL адрес что это такое

Автор: admin · Опубликовано Июнь 28, 2016 · Обновлено Май 8, 2018

Практически каждый работающий в Интернете пользователь встречает в сети упоминания о URL, URL-адресах, приглашениях перейти на какой-либо линк и воспользоваться ссылкой. Для тех, кто не знаком или плохо знаком с данными понятиями, я решил написать материал, в котором расскажу, что это такое URL адрес, как использовать URL, на какие части делится УРЛ, а я также поясню, как найти нужную ссылку в сети.

Поиск URL адреса

Что это такое URL

URL — это адрес, указывающий путь к интернет ресурсу, на котором размещены различные виды файлов (документы, картинки, видео, аудио и др.). Аббревиатура URL расшифровывается как «Uniform Resource Locator» (Единый Указатель Ресурсов), по-русски она обычно произносится как «урл», «ю-ар-эл», «у-эр-эл», часто используется просто слово «ссылка».

Помню, искал некоторое время назад что это такое URL адрес, для того чтобы грамотно рассказать братику все тонкости понятия. И самому стало интересно, когда появился данный термин.

Автором понятия URL считается британец Тим Бернес-Ли, а само изобретение (1990г.) ознаменовало качественный скачок в развитии интернет технологий. Сейчас URL является идентификатором адресов практически всех ресурсов в сети, при этом сам термин URL постепенно заменяется более обширным термином URI (Uniform Resource Identifier – Единый Идентификатор Ресурсов).

URL постов в социальных сетях

  • Чтобы получить URL заметки Вконтакте нажмите на дату публикации заметки, а потом скопируйте ссылку с адресной строки вашего браузера (кликаем правой клавишей мыши на адрес в адресной строке браузера, а затем нажимаем «Копировать»).

URL-ссылка поста в ВК

URL-ссылка поста в Фейсбуке

На какие части делится URL-адрес

Классический пример URL-адреса выглядит примерно так:

http://адрес_сайта/папка/страница.html

Как видим, адрес URL делится на несколько частей:

Первая часть (http://) определяет используемый протокол. Проще говоря, она говорит о методе, который будет использоваться для получения доступа к нужному ресурсу.

Используемый в данном URL протокол «HTTP» расшифровывается как «HyperText Transfer Protocol», и применяется он в абсолютном большинстве случаев. Но можно найти URL c использованием другие протоколов, к примеру, FTP (File Transfer Protocol – протокол для передачи файлов), HTTPS (HyperText Transfer Protocol Secure – безопасная, зашифрованная версия HTTP), mailto (адрес электронной почты) и другие.

Всего же видов протоколов URL насчитывается несколько десятков ftp, http, rtmp, rtsp, https, gopher, mailto, news, nntp, smb, prospero, telnet, wais, xmpp, file, data и др, но используются обычно несколько основных, перечисленных мной чуть выше.

Расшифровка URL адреса

Вторая часть (адрес_сайта) – это имя домена. Технически это просто линия символов, букв или комбинация слов, позволяющая людям легко запоминать адрес любимой страницы. В ином случае ссылки на ресурсы выглядели бы как http://192.168.384.656, запомнить такое сочетание цифр было бы на порядок труднее, нежели имя http://droidov.com.

Третья часть (папка/страница.html) обычно указывает на какую-либо страницу ресурса, к которой пользователь хочет получить доступ. Она может быть просто в виде названия, или в виде пути к определённому файлу через набор папок, последние обычно разделяются слешом (/). Расширение интернет страниц может быть разным – php, htm, html, shtml, asp и ряд других.

Визуально данные пояснения можно посмотреть на видео:

Используемая перед названием домена аббревиатуры www (World Wide Web – всемирная паутина) не является обязательной, вы можете использовать адрес сайта и без неё, сайт обязательно откроется.

Особенности использования URL адреса

Поисковые системы рекомендуют разработчикам создавать информативные адреса страниц, чтобы название страницы говорило пользователю и поисковому роботу о сути материала, расположенного на странице.

Если указанный пользователем URL не верен, то система покажем нам ошибку 404 с примечанием «Страница не найдена!». Значит, пользователь набрал или не правильный, или устаревший адрес страницы, потому при наборе адреса необходимы точность, аккуратность и внимание. Я бы рекомендовал при наборе URL использовать буфер обмена, скопировав адрес страницы через функции «копировать/вставить». Можно также попробовать набрать урезанный URL адрес в виде только основного имени сайта (без папок и страниц), а уже на главной странице сайта поискать переход на нужную нам страницу.

Значок URL ссылки используемый в Интернете

Недостатки URL

После описания, что это URL ссылка давайте разберём все недостатки УРЛ. Наряду с преимуществами, позволяющими легко вести навигацию в интернете, у URL есть свои недостатки. Это работа только цифрами, латинскими буквами и некоторыми символами, кириллица же обычно должна быть перекодирована (URL Encoding) в два этапа, на первом из которых каждый кириллический символ преобразовывается в два байта, а потом каждый из байтов переписывается с использованием шестнадцатеричной системы.

Кроме того, в адресе рекомендуется использовать преимущественно маленькие буквы (некоторые Unix-системы их заглавные варианты будут воспринимать как разные символы, что может привести к ошибке открытия страницы), также в адресах URL запрещается использовать пробелы.

Как найти URL адрес. Закладки.

Для поиска требуемого URL адреса можно воспользоваться поисковыми системами, в которых необходимо прописать ключевые слова вашего поиска. К примеру, если нужен какой-либо фильм – тогда ввести его название, или имена актёров, если музыка – имена исполнителей и название композиции. Нажав «Поиск» вы получите множество сайтов с URL адресами, кликнув на которые вы можете найти нужный результат.

URL страницы, на которой вы находитесь в данный момент, размещается в адресной строке вашего браузера, расположенной вверху.

Для запоминания URL адреса нужной страницы используйте панель закладок вашего браузера. К примеру, в популярном браузере Mozilla Firefox иконка закладок в виде звёздочки расположена справа сверху на уровне адресной строки. Кликнув на неё, вы получите возможность набрать имя для вашей закладки, а также папку, куда складывать закладки (обычно я использую специальную панель закладок, позволяющая по одному клику получать доступ к любой из них).

Заключение

Использование URL здорово облегчило работу в сети Интернет, позволив множеству пользователей легко и быстро получать доступ к нужным сайтам. Если у вас остались вопросы после прочтений статьи “URL адрес что это такое” пишите их в комментариях к статье.

Всё, что сегодня нужно – это вбить название сайта и его расширение в адресной строке, после чего пользователь получает практически мгновенный доступ к ресурсу. И всё это без необходимости запоминать достаточно сложный ряд трёхзначных цифр, всё делается легко, быстро, эффективно – в общем, то, что нужно, не правда ли.

Что такое URL адрес сайта? Параметры и допустимые символы URL

Параметры и допустимые символы URL адреса сайта

В одной из предыдущих статей я описывал человеко-понятные урл — ЧПУ URL и разное отношение поисковиков к ним. В данной статье хотелось бы рассмотреть само понятие УРЛ, так как оно является основополагающим для всего Интернета.

URL (Uniform Resource Locator) — переводится с английского как Унифицированный указатель ресурса, или Единообразный (универсальный) локатор ресурса, т.е. это путь, по которому можно найти любой файл и каталог в сети Интернет.

URL адрес страницы сайта состоит из следующих элементов: протокол://полное доменное имя/(папка(и))/имя ресурса (файла). В расширенном варианте УРЛ может выглядеть так:

схема://логин:пароль@хост:порт/(папка(и))/имя ресурса (файла)?параметры#якорь

Основные параметры Урл:

  • в качестве схемы выступает обычно какой-нибудь протокол, обычно это http(s), ftp и множество других (skype, nfs)
  • логин-пароль нужны для прохождения одного из способов авторизации пользователя на сервере. Если авторизации не требуется, эти параметры не указываются
  • хост — полное доменное имя или IP-адрес компьютера в сети. Например, для Яндекса — это Yandex.ru
  • порт — на каком порту сервера будет производиться подключение к нему. В большинстве случаев, данный параметр не указывается, т.к. по умолчанию подразумевается порт 80, которым обычно пользуются браузеры. Попробуйте к любому URL адресу сайта подставить «:80», ничего нового не произойдёт — будет совершён переход на адрес «без порта». Например http://www.google.ru:80 перекинет на http://www.google.ru.
  • далее идёт или сразу имя файла (например, page.php), или сначала 1 и более каталогов, а потом имя файла. Если имя файла отсутствует, то открывается т.н. индексный файл — index.php (index.html, index.jsp и множество других расширений).
  • после имени файла могут указываться дополнительные параметры — после знака вопроса (?). Между параметрами ставится знак амперсанда (&). К примеру, выглядеть это может так: http://www.bing.com/account/web?sh=5&ru=%2f . Самих параметров может быть много, они имеют вид переменная=значение и обрабатываются на сервере с помощью языков серверного программирования
  • якорь в URL подставляется после решётки (#) и указывает на элемент открываемой страницы, причём браузер обычно автоматически производит прокрутку до того html-элемента, id которого равно якорю. Например, на созданных на WordPress сайтах при клике на «Читать далее» как раз это и происходит:

Пример из WordPress’а

Допустимые символы URL

В URL адресе допустимы только латинские буквы, арабские цифры и ограниченный набор знаков препинания:

Также возможны запятые (,) и точки с запятой (;), но используются они редко и обычно кодируются, как и все остальные символы (русские буквы, пробелы и т.п.). Яркий пример закодированных урл’ов — статьи Википедии — http://ru.wikipedia.org/wiki/%D0%95%D0%B6.

Правила кодирования нелатинских букв (в т.ч. кириллицы) и прочих не допустимых символов URL: сначала буква кодируется в UTF-8 (кодировку Unicode) — получается 2 байта из каждого символа. Затем каждый из этих байтов преобразуется в шестнадцатиричную систему счисления и перед ним ставится знак процента (%), получается что-нибудь такое: %D0%95%D0%B6 (по-русски будет «еж»). Недопустимые знаки препинания кодируются так:

Кодирование символов в адресах. Справка из Википедии (кликабельно)

Среди УРЛ выделяют относительные и абсолютные, а также статические и динамические URL адреса страниц сайта. Об этом будет рассказано в следующих статьях.

голоса
Рейтинг статьи
Читать еще:  Как Узнать Местоположение по IP Адресу? Сервис Определения
Ссылка на основную публикацию
Статьи c упоминанием слов: