Выбрать главу

Ориентирование в больших базах данных

Рис 88. Каждая смерть на каждой дороге в Великобритании в 1999–2010 годах.(BBC)

В то время как некоторые визуализации данных очень эффективны, когда нужно взять знакомую, известную информацию и представить ее в совершенно новом свете, что происходит, когда у вас имеется совершенно новая информация, в которой люди хотят ориентироваться? Век данных приносит с собой потрясающие новые открытия практически каждый день, начиная с великолепного географического анализа фотографий FlickrЭрика Фишера (Eric Fischer), и заканчивая публикацией властями Нью–Йорка тысяч ранее недоступных и конфиденциальных оценок учителей.

Эти наборы данных приобретают максимальную силу, когда пользователи получают возможность копаться в них и дойти в своей детализации до той информации, которая будет иметь максимальное отношение непосредственно к ним.

В начале 2010 года New York Times получила доступ к обычно имеющим частный, скрытый характер записям и документам Netflix о том, в каких районах какие чаще всего брали в прокат фильмы. И хотя Netflix отказалась раскрыть точные цифры, New York Times смогла создать привлекательную интерактивную базу данных, которая позволяет пользователям просматривать прокатные данные по фильмам из топ–100 в 12 крупнейших метрополиях страны, разбитые по почтовым индексам. При этом по каждому коммьюнити можно смотреть, где именно какой фильм был более популярен — визуально это отображено при помощи цветов разной степени насыщенности.

К концу того же года New York Times опубликовала результаты проводящейся раз в десять лет переписи населения США  — всего через несколько часов после того, как эти результаты были обнародованы. Интерфейс, сделанный в Adobe Flash, предложил целый ряд возможных вариантов визуализаций и позволил пользователям просматривать информацию со степенью подробности вплоть до каждого конкретного избирательного участка в стране (коих насчитывается 8,2 миллиона), и увидеть, как распределяются на этих участках жители по расовому признаку, по уровню доходов и по уровню образования. При этом степень детализации данных была настолько высокой, что при просмотре информации в первые часы после публикации создавалось впечатление, что вы, возможно, первый человек в мире, который изучает данный конкретный уголок базы данных.

Аналогичное достойное похвалы использование визуализации в качестве интерфейса базы данных можно отметить в расследовании трагических инцидентах со смертельным исходом на дорогах, проведенном ВВС, а также в многочисленных попытках быстро проиндексировать масштабные массивы не всегда структурированных данных, таких как, например, публикации Wikileaks военных отчетов по Ираку и Афганистану.

Рисовать в своем воображении альтернативное развитие событий

Рис 89. Бюджетные прогнозы, сравнение с действительностью(New York Times)

В New York Times «дикобразоподобный график» Аманды Кокс (Amanda Cox) оказавшихся трагическим образом слишком оптимистичных прогнозов по бюджетному дефициту СШАза последние годы показывает, что порой бывает так, что то, что произошло, менее интересно, чем то, что не произошло. График температуры Кокс показывает всплеск бюджетного дефицита после десятилетия войн и налоговых льгот, и великолепно иллюстрирует, насколько нереалистичными могут стать прогнозы на будущее.

Бреет Виктор (Bret Victor), давний разработчик интерфейса для продуктов Apple (и создатель теории под названием «Отменить математику» (проект Kill Math), позволяющей использовать визуализацию для удобного представления количественной информации — получился нтерактивный интерфейс, где даже самые сложные уравнения не просто понятны каждому, но и являются новой формой искусства), создал прототип своего рода реагирующего документа . В его примере идеи экономии электроэнергии включают в себя доступные для редактирования исходные условия и положения, в соответствии с которыми даже такой простой шаг как выключение света в пустых комнатах может помочь американцам сэкономить энергию, которую производят от двух до сорока (!) работающих на угле электростанций. Изменение процентных показателей в середине текстового абзаца вызывает соответствующие изменения в остальном тексте на странице!

Если вы хотите ознакомиться с другими примерами и предположениями, то вот список различного использования визуализаций, карт и интерактвной графики, составленный Мэтью Эриксоном (Matthew Ericson) из New York Times.

Когда не использовать визуализацию данных

В конечном итоге эффективная и качественная визуализация данных зависит от качества, чистоты, точности и значимости информации. Ровно как хорошие цитаты, ценные факты и описанию способствуют созданию качественных материалов в рамках повествовательной журналистики, визуализация данных может быть хороша ровно настолько, насколько хороши данные, ее наполняющие.

Когда вашу историю можно рассказать лучше при помощи текста или мультимедиа

Порой бывает так, что одни только данные не могут рассказать историю самым убедительным и наглядным образом. И хотя тут может помочь простой график, иллюстрирующий тенденции или итоговую статистику, текстовый комментарий или описание фактов, связывающих данные с их последствиями в реальном мире, может оказаться более непосредственным, оперативным и впечатляющим, имеющим ударную силу для читателя.

Когда у вас очень мало отправных точек

Как гласит известное изречение, «цифры в отрыве от всего, сами по себе, ничего не значат». И как обычно отвечают редактора в ответ на цитирование статистики — «а по сравнению с чем?» Какова тенденция — понижательная или повышательная? Каковы нормальные показатели? В общем, с чем сравнивать–то?

Когда у вас очень незначительная изменчивость в ваших данных, отсутствует четкая тенденция или выводы

Порой вы собираете и организуете ваши данные в Excel или аналогичном позволяющем строить графики приложении, и обнаруживаете, что информация «зашумлена» и насыщена помехами — много колебаний или относительно плоская тенденция. Поднимаете ли вы в таком случае ось икс до какой–то величины, отличной от нуля, ровно под самое низкое значение, с целью придать графику немного более адекватную форму? Нет! Похоже, у вас имеются неоднозначные, нечеткие, двусмысленные или сомнительные данные, и вам нужно больше копать и анализировать.

Когда карта — не карта

Когда пространственный элемент невыразителен или неубедителен, или отвлекает внимание от более актуальных числовых тенденций, таких как, например, изменение во времени или демонстрация схожих элементов в неблизких областях.

Не забывайте о таблицах

Если у вас сравнительно мало отправных точек, но есть информация, которая может пригодиться некоторым из ваших читателей, рассмотрите такой вариант как просто изложение данных в форме таблицы. Это ясный и легкий для прочтения метод, который не создает нереалистичных ожиданий «сюжета». На самом деле, таблицы могут быть очень эффективным, действенным и элегантным способом изложения основной информации.