Проверка корректности ссылок на сайте

Что такое битые ссылки?

Ничто так не раздражает посетителей и не портит впечатления о сайте, как неработающие ссылки в тексте страниц (их еще называют "битыми ссылками") . "Битая" ссылка - это ссылка на несуществующую страницу, документ, изображение. Переходя по битой ссылке пользователь, в лучшем случае, видит сообщение о том что страница не найдена. В худшем случае он видит служебную страницу сервера.
Чем плохи битые ссылки? Переходя по битой ссылке посетитель, как правило, уже не возвращается на сайт. Особенно если это новый посетитель, который у Вас на сайте впервые. Самая плохая черта битых ссылок - их скрытость. Вы можете постоянно ходить по сайту удобными Вам путями и не замечать битых ссылок, на которых постоянно спотыкаются Ваши посетители.

Почему возникают битые ссылки?

Хотим мы того или нет, Интернет постоянно изменяется. Добавляются новые страницы и файлы, удаляются старые. И если на небольшом сайте корректность всех ссылок достаточно несложно поддерживать путем "ручной" проверки всех ссылок, то с ростом размера сайта эта проблема становится все более и более актуальной. И уж совсем пессимистичной становится картина когда Вы начинаете ссылаться на другие сайты - если на своем сайте Вы еще можете контролировать удаление и перемещение документов, то происходяшее на других сайтах нам не подвластно.
Основные причины возникновения битых ссылок:

  • Удаление старых страниц и документов. Удаляя что-либо на сайте не стоит забывать что в других разделах Вашего сайта могут быть ссылки на удаляемый документ.
  • Изменения на внешних сайтах. Вы разместили ссылку на сторонний сайт. Через неделю этот сайт сменил структуру, переехал на другое имя или просто удалил тот документ, на который Вы ссылались.
  • Автоматическое обновление данных. Если на Вашем сайте настроено автоматическое обновление данных из внешнего источника (к примеру, синхронизация товаров в интернет-магазине со складским ПО), задача поддержания актуальности ссылок становится как нельзя более важной - малейший сбой в алгоритме обновления может привести к массовым негативным последствиям и владелец сайта должен быть первым кто об этом узнает.
  • Редизайн и переработка сайта. Переработка сайта - это кропотливая работа, требующая особой внимательности и терпения. Иногда можно просто не заметить ссылку на уже не существующую страницу.

Это всего лишь самые распространенные причины появления битых ссылок, на практике их гораздо больше. Бороться с самими причинами практически невозможно, поэтому необходимо периодически проверять сайт на наличие таких ссылок и удалять их либо исправлять.

Как найти битые ссылки?

Можно пройтись по всему сайту и понажимать по всем увиденным ссылкам. Это неплохой метод для сайта из пяти страниц, но что делать когда количество страниц переваливает за несколько сотен, а то и тысяч? Ручная проверка явно не эффективна.
Существует несколько автоматизированных решений:

  • Инструментарий вебмастера Яндекс и Google
    Действительно, ведущие поисковики предоставляют отчет по найденым битым ссылкам. Но насколько этот отчет актуален? Как правило, поисковик полностью перепроверяет сайт раз в несколько недель. Это означает что о новых битых ссылках Вы будете узнавать далеко не сразу. И уж тем более не сможете получить оперативной картины - все ли в порядке на Вашем сайте именно сейчас, а не месяц назад.
  • Специализированное программное обеспечение
    Существует целый ряд разного рода программ, так или иначе проверяющих сайты на битые ссылки. Большинство из них платные (например, Semonitor) и весьма не дешевые. Но имеется прекрасная бесплатная программа для проверки ссылок на вашем сайте - Xenu's Link Sleuth (подробнее об этой программе вы можете прочитать в серии заметок, опубликованной на нашем сайте). Недостатком использования такой программы является только то, что проверка ведется с Вашего компьютера, а, значит, используется Ваш интернет-канал. В лучшем случае это приведет к замедлению работы компьютера, в худшем Вы получите весьма ощутимый счет за израсходованный трафик.
    Другие программы:
    • "http://linkchecker.sourceforge.net/" Отличается высокой скоростью работы - почти 10000 ссылок проверяет с локального сервера за несколько секунд! В Fedora имеется в репозиториях. На сайте проекта можно скачать версию для Windows.
    • "Shadow Web Analyzer" - продукт платный, хотя можно скачать пробную (trial) версию.
    • "Link Evaluator" - плагин к браузеру Mozilla.
  • Интернет-сервисы по проверке битых ссылок
    Преимущества: Проверка осуществляется с сервера сервиса и не зависит ни от Вашего компьютера ни от Вашего интернет-канала. Вам не нужно ничего скачивать и устанавливать, не нужно разбираться с новыми программами.
    Недостатки: Некоторые бесплатные сервисы обычно проверяют ограниченное число ссылок, а полную проверку предлагают осуществить за некоторую плату. Но этот недостаток присущ не всем сервисам, он отсутствует, например, у сервисов, которые вы найдете по двум первым ссылкам в приведенных ниже примерах.
    Другой недостаток: вам придется довольно долго ждать, пока сервис завершит опрос сайта. При этом нельзя разрывать соединение с сервисом, чтобы не потерять результаты.
    Примеры Интернет-сервисов:
    • http://validator.w3.org/checklink Если вы хотите только найти "битые" ссылки, то проставьте галочку "Hide redirect". Чтобы просматривался весь сайт, а не только заглавная страница, задайте глубину просмотра, отличную от 0. Ждать окончания проверки придется достаточно долго (если сайт не маленький). В результате получите список проверенных страниц с указанием "битых" ссылок для каждой страницы.
    • "http://www.graffity.biz/products/link_checker/" Отличный и притом бесплатный сервис. К тому же после анализа сайта выдает файл Sitemap.xml (смотри раздел "Карта сайта и файл Sitemap.xml"). Недостаток заключается в том, что для сайтов с большим числом страниц непосредственно на экране найти битые ссылки очень трудно, массив выдаваемой информации просто огромен (например, это имеет место для моего сайта http://rus-linux.net, у которого больше 6 тысяч страниц).
    • Badlinks.ru" - сервис автоматического поиска битых ссылок. Все что нужно, это указать адрес сайта и тип проверки. По завершении процесса отчет будет отправлен Вам по электронной почте. Если Ваш сайт большой и часто обновляемый, Вы можете заказать регулярную проверку - с указанной периодичностью робот выполнит проверку и уведомит Вас о результатах. Стоимость тестовой проверки (максимально проверяется 20 страниц) бесплатна, полная проверка - 30 рублей, регулярные проверки от 350 рублей в год.
    • Build your Site Map online - сервис, позволяющий получить бесплатно список битых ссылок и файл Sitemap.xml (но бесплатно обрабатывается не более 500 страниц).

Что делать, если на сайте появились битые ссылки?

Конечно, исправлять!

  • Если ссылка внутренняя, то просто соответствующим образом ее подправить (если соответствующая страница еще существует) либо удалить (если страница удалена), не забыв исправить текст, в котором эта ссылка использовалась. Как правило, большинство внутренних битых ссылок исправляется при помощи стандартных средств редактирования и не требуют вмешательства в программную часть сайта.
  • Если ссылка была на внешний ресурс, то вначале имеет смысл поискать ресурс с помощью поисковиков - может быть страница просто перемещена. Часто полезные ресурсы копируются на других сайтах и можно найти альтернативный адрес для нужного вам ресурса. Если ничего не найдено - опять же редактируем текст на своем сайте, убирая битую ссылку.
  • Можно обратиться к сторонним специалистам. Существует несколько сайтов поиска разработчиков (например, www.free-lance.ru и www.weblancer.net), при помощи которых можно найти специалиста для исправления битых ссылок. Очевидно, придется оплатить их работу. Стоимость работы напрямую зависит от внутреннего устройства сайта и может быть опеределена только прикидочно. В среднем стоимость дня работы среднего разработчика (на разовых проектах) колеблется от $50 до $120. Обычно на исправление нескольких битых ссылок требуется от получаса до 3-4 часов. Хотя никаких эксклюзивных знаний для этой работы не требуется, опыт и аккуратность весьма важны, поэтому особенно экономить не рекомендуется.
    Что может потребоваться разрабочику для исправления битых ссылок: доступ к сайту по FTP либо SSH, доступ к базе данных (в принципе не обязательно - можно найти и в коде сайта, но это дополнительное время).

И не забудьте повторно проверить сайт по окончании работ, может быть вы удалили далеко не все битые ссылки.

Проверять сайт на наличие битых ссылок необходимо регулярно, только в этом случае вы сможете вовремя избавляться от балласта, который, во-первых, мешает вашим читателям, а во-вторых, снижает доверие поисковых систем к вашему сайту. Первая чистка может занять довольно значительное время и потребует существенных трудозатрат, но в дальнейшем устранение неисправностей будет проходить быстрее.

Полезные ресурсы

Загляните на досуге

Счетчики

Рейтинг@Mail.ru

LiveInternet

Rambler's Top100