Почему Mapa76? 24 марта 1976 года в Аргентине произошел переворот, который длился до 1983 года. В этот период примерно 30 000 человек бесследно исчезли, тысячи погибли, и около пятисот детей родилось в неволе из–за действий военной диктатуры. Более тридцати лет спустя число людей в Аргентине, осужденных за преступления против человечности, совершенные в годы диктатуры, достигло 262 человек (по состоянию на сентябрь 2011 года). Сейчас идет 14 судебных процессов, и еще в отношении 7 определены даты начала рассмотрения дел. В различных открытых судебных делах фигурируют 802 человека.
Эти процессы генерируют огромное количество данных, которые весьма сложны в обработке и для исследователей, и для журналистов, и для правозащитных организаций, и даже для судей, прокуроров и всех остальных. Данные появляются совершенно разным образом, и следователи и исследователи зачастую не могут воспользоваться преимуществами обработки их программными средствами при их интерпретации. В конечном итоге, это означает, что факты зачастую упускаются из виду, а гипотезы часто получаются ограниченными. Mapa76 – это расследовательский инструмент, предоставляющий открытый доступ к этой информации в журналистских, юридических, судебных и исторических целях.
Чтобы подготовиться к хакатону, мы создали платформу, которую разработчики и журналисты могли использовать для общения и взаимодействия в день мероприятия. Мартин Сарсале разработал несколько базовых алгоритмов для извлечения структурированных данных из простых текстовых документов. Некоторые библиотеки также были взяты с DocumentCloud.org и использованы в проекте, но таковых было немного. Платформа позволяла автоматически анализировать и извлекать имена и фамилии, даты и места из текстов – и давала возможность пользователям изучать ключевые факты о различных случаях (даты рождения, места арестов, предполагаемые места исчезновения, и так далее).
Нашей целью было предоставить платформу для автоматического извлечения данных по приговорам и решениям судов времен военной диктатуры в Аргентине. Мы хотели найти способ автоматически (или, по крайней мере, полуавтоматически) показывать ключевые данные, связанные с делами 1976–1983 годов, основанными на письменных свидетельствах, аргументах и приговорах. Извлеченные данные (имена, фамилии, места и даты) собираются, хранятся и могут быть проанализированы, просеяны и улучшены исследователем. Также их можно использовать при помощи карт, графиков и инструментов сетевого анализа.
Проект позволяет журналистам и следователям, работникам прокуратуры и свидетелям отслеживать историю жизни человека, включая ход их пленения, и последующего исчезновения или освобождения. Там, где информация отсутствует, пользователи имеют возможность прошерстить огромное количество документов в поисках информации, которая, возможно, может иметь отношение к делу.
Для того, чтобы собрать хакатон, мы сделали публичное объявление через Hacks/Hackers Buenos Aires, в котором тогда было около 200 членов (на момент написания главы их уже 540). Мы также вступили в контакт со многими ассоциациями защиты прав человека. На встрече присутствовали около сорока человек, включая журналистов, представителей правозащитных организаций, разработчиков и дизайнеров.
Во время хакатона мы определили задачи, которые разные типы участников могли бы пытаться решать независимо, чтобы способствовать тому, чтобы процесс шел мягко и безболезненно. Например, мы попросили дизайнеров поработать над интерфейсом, который сочетал бы карты и графики и временные шкалы, мы попросили разработчиков поискать способы извлечения структурированных данных и алгоритмы для устранения возможности различного толкования названий, а журналистов мы попросили посмотреть, что произошло с конкретными людьми, сравнить разные версии материалов и прошерстить документы, чтобы рассказать истории о конкретных случаях.
Возможно, основной проблемой, которая у нас была после хакатона, было то, что наш проект был очень уж амбициозным, наши краткосрочные цели требовали больших затрат и усилий, а скоординировать слабо соединенную сеть добровольцев довольно сложно. Практически у каждого вовлеченного в проект была основная отнимающая время работа, многие также участвовали в других эвентах и проектах. У Hacks/Hackers Buenos Aires было 9 встреч в 2011 году.
Сейчас проект активно развивается. Существует ядро команды в виде четырех человек, работающих с более чем десятью сотрудниками, участниками коллективной работы. У нас имеется открытый список рассылки, список постоянных адресатови хранилище кодов, посредством которых абсолютно любой может участвовать в проекте.
— Мариано Блейман, Hacks/Hackers Buenos Aires
Освещение волнений в Великобритании в Guardian Datablog
Рис 42. Волнения в Великобритании: каждый подтвержденный инцидент(The Guardian)
Летом 2011 года Великобританию охватила волна беспорядков. В то время политики полагали, что эти события категорически не связаны с проблемами бедности и нищеты, а те, кто грабили, были просто преступниками. Более того, премьер–министр вместе с ведущими политиками из числа консерваторов обвинил социальные сети в том, что они становятся причиной беспорядков, предположив, что на этих платформах имело место подстрекательство, и что эти волнения организовывались через Facebook, Twitter и Blackberry Messenger (BBM). Раздавались даже призывы временно закрыть социальные сети. И так как правительство не инициировало расследование причин беспорядков, газета Guardian в сотрудничестве с Лондонской школой экономики реализовала ставший прорывом проект «Истолковывая беспорядки»(Reading the Riots), чтобы ответить на этот вопрос.
Газета вовсю использовала журналистику данных, чтобы дать возможность общественности лучше понять, кто занимался грабежами и почему. Более того, они также работали с другой группой ученых, возглавляемой профессором Робом Проктером в Университете Манчестера, чтобы лучше понять роль социальных медиа, которые сама Guardian активно использовала для своих материалов во время беспорядков. Команду создателей проекта Reading the Riots возглавлял Пол Льюис (Paul Lewis), редактор спецпроектов Guardian. Во время самих беспорядков Пол вел репортажи с мест событий в городах по всей Англии (в том числе через аккаунт в Твиттере, @paullewis). Эта вторая команда обработала более чем 2,6 миллиона твитов о беспорядках. Основной целью работы с этой социальной сетью было посмотреть, как в Твиттере циркулировали слухи, определить ту функцию, которую выполняли разные пользователи в распространении информационных потоков, чтобы увидеть, использовалась ли эта платформа для подстрекательств, и изучить другие формы организации.
В плане использования журналистики данных и визуализации данных полезно различать два ключевых периода: период собственно самих беспорядков и те способы, которыми данные помогали создавать сюжеты и материалы тогда, когда разворачивались волнения; и потом второй период гораздо более интенсивных исследований двух групп ученых, работающих с Guardian, по сбору данных, их анализу и глубокому изучению выводов. Результаты первой фазы проекта «Истолковывание беспорядков» были опубликованы в неделю активного освещения темы в начале декабря 2011 года. Ниже приведен ряд ключевых примеров того, как в оба этих периода использовался метод журналистики данных.
Фаза один: Беспорядки как они произошли
Посредством использования простых карт команда Guardian показала места, в отношении которых имелась подтвержденная информация о том, что там зарождались беспорядки, и за счет смешения и наложения данных о терпимых гражданами лишениях на данные о том, где зарождались беспорядки, газета смогла начать развенчивать основной политический посыл о том, что никакой связи с бедностью и нищетой не было. В обоих этих примерах использовались готовые, имеющиеся в наличии стандартные инструменты для составления карт, а во втором примере объединение данных о местоположениях с другим набором данных позволило начать устанавливать новые связи и проводить новые параллели.