Выбрать главу

9 специализированных поисковиков, которые по-своему лучше Google

Олег Нечай

Опубликовано 15 ноября 2013

Google — это самая крупная и самая популярная в мире поисковая система. Ежедневно на сайтах Google, доступных примерно на 200 языках, регистрируется более 50 миллионов поисковых запросов, при этом, под данным Alexa, основной сайт Google.com является самым популярным ресурсом интернета. Однако, несмотря на всемирное признание и несомненный успех, Google далеко не так хороша в качестве поисковой системы, как может показаться. 

Всё дело в универсальности: невозможно одинаково хорошо искать в блогах и в научных статьях, в цифровых изображениях и кулинарных рецептах. Именно поэтому существует множество не столь известных специализированных поисковых систем, которые работают исключительно с какой-то одной категорией данных, но делают это на высочайшем уровне. Более того, многое из находимого такими поисковиками вообще невозможно отыскать при помощи Google и других универсальных систем: они просто не видят такую информацию, которая к тому же нередко умышленно закрыта для подобных «веб-пауков». Поговорим о нескольких таких «узких профессионалах», способных, возможно, открыть для вас ту сторону интернета, о которой вы и не подозревали.

1. Поиск среди удалённых из Google и заблокированных страниц

Не для кого не секрет, что правительства многих стран пытаются повлиять на то, какой сетевой контент доступен на территории их государств. Это может объясняться как чисто политическими соображениями, так и требованиями законодательства о противодействии терроризму и детской порнографии и, конечно же, влиянием лоббистов крупных правообладателей. Критерии запретов могут быть как вполне разумными, так и совершенно произвольными: всё зависит и от общего состояния правосознания в стране, и от вменяемости самих правоохранителей.

Поисковая система Google в большинстве случаев идёт навстречу мотивированным требованиям национальных правительств и удаляет из результатов поисковой выдачи сайты и страницы, доступ к которым через локализованные версии поисковика должен быть запрещён. Между тем удаление адреса из результатов поиска Google и даже блокировка URL и IP-адреса на уровне местного провайдера вовсе не означает, что такой ресурс исчез из интернета или больше недоступен.

Классическое средство обхода подобных ограничений — браузер Tor, основанный на системе альтернативной обычной «луковой» маршрутизации. Один из новейших пакетов, включающих в себя клиент Tor (Vidalia) и браузер Firefox Portable c расширением foxyproxy, носит вполне «говорящее» название PirateBrowser

От других подобных пакетов он отличается тем, что не предназначен для полностью анонимного сёрфинга: PirateBrowser использует сеть Tor исключительно для обхода местных блокировок тех или иных страниц и сайтов, подставляя произвольные IP-адреса вместо настоящих. С его помощью вы можете зайти на заблокированную страницу, если уже знаете её адрес, либо поискать её, например, через основной сайт Google.com или какие-то другие его локальные версии.

В PirateBrowser уже встроены настройки для некоторых стран, включая Иран, Северную Корею, а также (сюрприз!) Великобританию, Нидерланды, Бельгию, Финляндию, Данию, Италию и Ирландию. Разумеется, ничто не мешает внести в систему и собственные настройки. К сожалению, в отличие от «полноценного» Tor, PirateBrowser доступен только в версии для Windows.

2. Поиск среди несуществующих версий страниц

Многие из нас пользовались кешем Google или «Яндекса», чтобы посмотреть недавно изменённую или удалённую страницу в том виде, в каком она была изначально опубликована в Сети. Обычно такой кеш доступен в поисковой выдаче довольно короткое время, ведь поисковый робот настроен на отслеживание и учёт всех изменений, чтобы выдавать наиболее актуальную версию интернет-ресурса.

Поэтому, если вы хотите знать, как выглядел тот или иной сайт месяц, год, а тем более несколько лет назад, вам придётся воспользоваться другим средством, а именно веб-сервисом «что-тоАрхива Интернета», который носит название Wayback Machine, то есть вроде «Машины времени». Некоммерческая организация «Архив Интернета» с 1997 года собирает копии веб-страниц, мультимедийный контент и программное обеспечение, размещаемое в Сети, и делает эти копии доступными бесплатно для всех желающих. При помощи Wayback Machine вы сможете найти не только версию знакомого вам сайта многолетней давности, но и даже те страницы, которых давно не существуют и которые попросту удалены из «обычного» интернета. На сегодня в архиве присутствует около 366 миллиардов страниц, и очень велика вероятность того, что среди них окажется та, что нужна именно вам.