Выбрать главу

Самая большая база данных в мире

Наверное, самая большая база данных сегодня – это совокупность web-страниц в Интернете. «Всемирную паутину» заполняют не только порнографические изображения, журнальные статьи и реклама всевозможной продукции, в ней находится также поразительное количество персональной информации: личные домашние странички, сообщения электронной почты и публикации в группах новостей. Эти записи могут быть автоматически исследованы для поиска разоблачений, случайного признания вины и других видов потенциально ценной информации.

Еще до взрывоподобного роста Всемирной паутины студент, впоследствии преподаватель Аризонского университета Рик Гейтс [Rick Gates], заинтересовался исследованием возможностей Интернета как базы данных. В сентябре 1992 года он создал Internet Hunt,[p18] «мусорщика», ежемесячно выискивающего информацию в Сети. Первые поиски были направлены на розыск фотографий с метеорологических спутников и текстов речей Белого дома. Искатель пользовался особой популярностью среди библиотекарей, которые в то время были озабочены проблемой создания удобного «справочника Интернета».

В июне 1993 года Гейтс решил осуществить поиск другого рода. Основной целью было найти как можно больше информации о человеке по его адресу электронной почты.

В течение недели группа из 32 искателей собрала 148 различных фрагментов информации о жизни Росса Стэплтона [Ross Stapleton].[70] Компьютер Мичиганского университета сообщил, что Стэплтон имеет степень бакалавра по русскому языку и литературе и по информатике. Компьютер Аризонского университета сообщил, что он имеет кандидатскую степень в области управления информационными системами. Компьютер информационного центра сети американского Министерства обороны [US Military's Defense Data Network (DDN) Network Information Center] раскрыл текущие и предыдущие адрес и номер телефона Стэплтона. Полученная с Gopher-сервера[p19] конференции «Профессионалы в области информатики за социальную ответственность» [Computer Professionals for Social Responsibility] брошюра сообщила, что Стэплтон был одним из выступающих и что он является аналитиком Управления научных и оборонных исследований [Office of Scientific and Weapons Research] Центрального разведывательного управления США.

Но наиболее ценную информацию группа смогла собрать из публикаций, сделанных самим Стэплтоном. Просканировав сообщения, отосланные им в список рассылки COM-PRIV (по иронии судьбы он как раз посвящен вопросам приватности), группа узнала, что Стэплтон использует операционную систему OS/2 и не имеет факс-аппарата. Группа узнала также, что Стэплтон сотрудничал с Джорджтаунским университетом, где был адъюнкт-профессором и читал курс «Информационная эпоха». Они узнали, что Стэплтон подписан на Arlington Journal, Chronicle of Higher Education и Prodigy. Он является членом Американской ассоциации развития славистики [American Association for the Advancement of Slavic Studies, AAASS]. Его членский номер в Cleveland Freenet был #ak287.

Из предисловия к тезисам диссертации Стэплтона «Персональные компьютеры в странах СЭВ» [Personal Computing in the СЕМА Community] исследователи узнали, что родителей Стэплтона звали Том и Ширли. Из заголовка другого посланного им почтового сообщения им удалось установить, что он помолвлен и что имя его возлюбленной – Сара Грей. Они также откопали запись выступления Стэплтона на II конференции «Компьютеры, свобода и приватность» [Second Conference on Computers, Freedom and Privacy].[71]

«Оглядываясь немного назад и оценив результаты поиска в целом, можно сказать, что имеется ужасающе большое количество информации о ком-нибудь, которое может быть найдено, даже если ограничиться только свободно доступными публичными сетями, – писал Рик Гейтс в отчете о результатах поиска. – Я надеюсь, что люди помнят об этом, когда отправляют сообщения в списки рассылки и группы новостей. Они вносят свой вклад в единое информационное пространство Сети, и все, что они высказывают в ограниченной дискуссии по [закрытой] теме, будет доступно еще долгое время».

Противоположный эффект, возникающий при пользовании глобальной базой данных, заключается в том, что в ней легко найти информацию о человеке с уникальным или необычным именем. Например, в феврале 1998 года я попробовал найти в Интернете словосочетание «Tom and Shirle». Поисковая система HotBot нашла слово «Тот» на 1 833 334 страницах, а слово «and» – на 63 502 825 страницах. Но слово «Shirle» нашлось только на 333 страницах, а фраза «Tom and Shirle» – только на шести, все из которых были копиями отчета Гейтса, написанного в июне 1993-го.

«Я был приятно удивлен количеством информации, которое я произвел и которую они смогли найти, – сказал Стэплтон, когда я брал у него интервью при написании этой главы. – Я бы не сказал, что что-нибудь из найденного во время этого поиска меня тревожит». Но Стэплтон опасался, что у кого-нибудь из ЦРУ может вызвать недовольство тот факт, что он раскрыл свое имя и имя работодателя в таком количестве общественных форумов. «Это только вопрос времени, когда кто-нибудь спросит меня на работе: „Эй, что ты сделал?“»

Пожалуй, наиболее примечательным в этом поиске было то, что возможность сбора подробной информации о человеке только лишь по открытым источникам перестала быть чем-то необычным. Исследование онлайновых источников информации вкупе с использованием поддерживаемых рекламой поисковых систем типа Yahoo, Lycos и AltaVista[p20] сделало возможным очень легко собирать такие подробные досье. И конечно, некоторые сервисы, в особенности DejaNews[p21] и HotBot, прямо рекламируют такую возможность.

Эра публичных заявлений

Постинги в форумы электронной почты, группы новостей и онлайновые чаты являются разновидностями публичных заявлений. Большинство людей, решивших занять свое место в киберпространстве, рано или поздно начинают делать такие заявления. И эти заявления не похожи ни на какие другие, произносимые когда-либо в человеческой истории. В прошлом публичные заявления часто терялись. Конечно, они могли быть записаны, но эти записи было не так-то просто найти, если они вообще были доступны. Раздраженный фермер мог выступить на городском собрании, и его имя записалось в протоколе, но через десять лет, если кто-нибудь захотел порыться в прошлом этого фермера, он вряд ли нашел бы материалы этого выступления, особенно если этот фермер переехал в Сиэтл и начал новую жизнь, поступив программистом в Microsoft. Письма, написанные в газеты в 50-е, 60-е, 70-е и 80-е годы XX века, конечно, были опубликованы для всеобщего обозрения, но маловероятно, что их поместили в компьютерные банки данных, проиндексировали и сделали постоянно доступными из любой точки земного шара.

Это новое поколение публичных заявлений имеет в первую очередь количественные отличия от всего, что было раньше. Все они могут быть мгновенно отысканы и просмотрены потенциальным работодателем, человеком, с которым у вас только что состоялась первая встреча, или коллегой, который хочет причинить вам вред. Как только вы сделали заявление, вы сразу же теряете контроль над ним: вернуть его назад уже невозможно.

Именно возможность поиска привела к появлению нового типа абсолютной подотчетности. Очень просто использовать поиск в Интернете для составления списков людей, замеченных в употреблении ЛСД, запятнавших себя расистскими высказываниями в печати или причастных к организации профсоюзов. Стэплтон говорит: «Какому-нибудь сотруднику службы по работе с персоналом очень просто сказать: „Посмотрите, Джо здесь высказался, что скайдайвинг[p22] – это круто. Должны ли мы дальше держать его в штате, понимая, что он может разбиться? А Джейн здесь представляет стиль жизни, который не нравится нашему президенту. Мы не должны продвигать ее в интересах общего дела“. Я не занимаюсь общественной деятельностью, о которой не хотел бы писать. Если я что-то делаю, я должен быть очень осторожным».

вернуться

p18

Hunt (англ.) – искатель, охотник.

вернуться

p19

Gopher – название устаревшего протокола и программы для работы с информацией в Интернете. После начала распространения технологии WWW практически не используется.

вернуться

p20

Для поиска на русском языке больше подходят российские системы: Yandex, Rambler, Aport, которые индексируют русскую часть Интернета и учитывают словоформы русского языка.

вернуться

p21

Портал DejaNews позднее был приобретен поисковой системой Google, поэтому поиск в архивах конференций (в том числе и русскоязычных) можно осуществить по адресу http://groups.google.com.

вернуться

p22

Skydiving (англ.) – упражнения в воздухе в свободном падении.