Что ж, с момента начала сноуденовских разоблачений минул месяц — и картина рисуется замечательная. С одной стороны, Европа продолжает накручивать сама себя и в последние дни дошла до организации полномасштабного расследования вскрывшейся слежки США за европейскими гражданами, а также предложений отказаться от пользования американскими интернет-ресурсами и даже прекращения, если понадобится, воздушного сообщения между США и ЕС. С другой, как выяснилось, следят за простыми людьми не только США, но и Франция, и Англия (совместно с АНБ тихо врезавшаяся в трансатлантический оптоволоконный бэкбон). А Германия и «большинство других западных стран» (по Сноудену) если и не имеют собственных систем слежки, то сотрудничают с АНБ ради получения информации из той самой базы данных, существование которой так разозлило их политиков.
Таким образом, разбор отдельных инцидентов теряет смысл: как и предполагалось, рыльце в пушку у всех. На первый план выходит аспект, месяц назад недооценённый. АНБ, ФБР, DGSE, MI-5 и MI-6, а с ними, вероятно, и другие спецслужбы интересуются прежде всего метаинформацией. Когда Сноуден только начинал публикацию секретных материалов, официальные лица в США, если помните, пытались смягчить социальный резонанс, обращая внимание публики именно на тот факт, что часто речь идёт о сборе «всего лишь метаданных». Однако при ближайшем рассмотрении выясняется, что именно они наиболее ценны. Но что же это за данные такие?
Википедия определяет метаданные как «информацию об информации». Попросту говоря, применительно к нашему случаю это любые косвенные сведения о состоявшемся контакте двух лиц: кем и с кем был установлен контакт, когда, где, сколько длился, какой была тема и тому подобное. Формально метакатегория дробится как минимум на структурную метаинформацию (описывающую строение данных) и описательную (собственно о данных). А при желании выделяются и более мелкие части. Но для нас сейчас важнее не теория, а практика: чем такие сведения могут быть полезны практически?
Лично мне памятны примеры Второй мировой войны, когда, пожалуй, впервые анализу метаинформации стали уделять такое же внимание, как и непосредственно информации о противнике. Знание времени, места отправления, автора шифрованных радиопередач позволяло предположить как минимум смысл и частичное содержание текста. А это, например, компенсировало жёсткую нехватку вычислительных мощностей при расшифровке сообщений, пропущенных через знаменитую Энигму (в замечательной «Книге кодов» Саймона Сингха история описывается в мельчайших деталях). И даже если вскрыть шифровку не удавалось, учёт метаинформации всё равно приносил пользу, раскрывая направление движения частей противника, схему их взаимодействия и т. п.
Сегодня, когда «жить громко» — нормальное и даже ожидаемое для среднестатистического индивида поведение, а сбор и обработка информации легки и дёшевы как никогда, игнорировать метаданные просто грех. Увидеть, какие вкусности извлекаются таким «непрямым» путём, можно, воспользовавшись веб-сервисом Immersion, построенным сотрудниками MIT. Этот сервис работает в паре с Gmaiclass="underline" вы предоставляете доступ к своей переписке, Immersion собирает и анализирует метаинформацию о ваших письмах, не читая собственно текста, после чего генерирует наглядный социальный граф. Не имея понятия, о чём именно вы переписывались с вашими друзьями и знакомыми, Immersion легко рассортирует письма по важности для вас, найдёт пересечения ваших контактов и таким образом сделает видимыми сообщества, в которых вы (возможно, сами того не подозревая) участвуете. И в целом даст пищу для размышлений на тему того, с кем вы общаетесь, почему, каково качество этих связей, стоят ли они того, чтобы их активизировать, и прочее, и прочее.