— Брайан Суда, (optional.is)
Разные графики рассказывают разные истории
В современном цифровом мире, с перспективой погружения в 3D–опыт, мы склонны забывать о том, что так долго писали исключительно чернилами по бумаге. Сейчас мы думаем об этом статичном и плоском способе как о некоем гражданине второго сорта, но на самом деле на протяжении тех сотен лет, когда мы писали и печатали, нам удалось достичь невероятного уровня богатства знаний и опыта в области представления данных на бумаге. И хотя интерактивные графики, визуализации данных и инфографика и являются последним писком моды, они отказываются от лучших наработок и методов, которым мы научились. И лишь когда мы бросаем взгляд в историю совершенных и искусно выполненных графиков и диаграмм, мы можем осознать этот багаж знаний и использовать его в новой среде.
Некоторые из самых известных графиков и диаграмм появились из необходимости лучше объяснять малопонятные и непрозрачные таблицы данных. Уильям Плэйфэйр (William Playfair) был шотландским полиглотом, который жил в конце 1700–х — начале 1800–х годов. Он единолично представил миру многие из тех же видов графиков и диаграмм, которые мы до сих пор используем и сегодня. В своей книге 1786 года — «Коммерческий и политический атлас» (Commercial and Political Atlas), Плэйфэйр представил гистограмму, столбчатый график, чтобы ясно показать количественные показатели импорта в Шотландию и экспорта из нее новым, визуальным способом.
Рис 90. Ранние гистограммы и столбчатые графики(Уильям Плэйфэйр)
Потом он продолжил популяризировать разные графики, представив в своей книге 1801 года под названием «Статистический конспект» (Statistical Breviary) то, что мы ныне называем круговой, секторной диаграммой. Нужда в этих новых формах графиков и диаграмм возникла из торговой области, но с течением времени появились и другие графики и диаграммы, благодаря которым удавалось даже спасать жизни. В 1854 году Джон Сноу (John Snow) создал свою ныне ставшую знаменитой «Карту распространения холеры в Лондоне», добавив маленькую черную полоску к каждому адресу, по которому был зарегистрирован случай заболевания. Со временем можно было заметить очевидную увеличенную плотность вспышки заболевания, и принять меры к решению проблемы.
Рис 91. Карта распространения холеры в Лондоне(Джон Сноу)
С течением времени
Шло время, и те, кто работал с этими графиками и диаграммами, становились все смелее и смелее, и начинали все больше экспериментировать, приводя это средство отображения информации к тому виду, в котором мы знаем его сейчас. Андре–Мишель Герри (André–Michel Guerry) был первым, кто опубликовал идею карты, где разные регионы окрашивались в разный цвет в зависимости от чего–либо, поддающегося измерению. В 1829 году он создал первую хороплет–карту, взяв регионы во Франции и заштриховав их по уровню преступности. Сегодня мы видим подобные карты, представляющие позиции разных регионов на выборах, кто за кого голосовал, распределение богатства, и многие другие связанные с географическими параметрами переменные. Идея выглядит такой простой, но даже сегодня сложно освоить и понять ее, если она не использована с умом.
Рис 92. Хороплет–карта Франции, демонстрирующая уровень преступности(Андре–Мишель Герри)
Есть много инструментов, которые хороший журналист должен понять и иметь в своем арсенале для создания визуализаций. В том, что касается графиков и диаграмм, важно не бросаться с головой в рискованное предприятие, а заложить отличную основу. Все, что вы создаете, должно исходить из серии элементарных графиков, схем и диаграмм. Если вы способны овладеть основами, то потом вы можете перейти к построению более сложных и продвинутых визуализаций, которые будут состоять из этих базовых элементов.
Двумя основными видами графиков и схем являются гистограммы, сиречь столбчатые графики, и линейные диаграммы. Хотя они и очень похожи в своих вариантах и сценариях использования, они также могут сильно различаться по своему замыслу и смысловому содержанию. Давайте возьмем для примера продажи какой–нибудь компании за каждый месяц года. Мы получим 12 столбцов, представляющих суммы денег, полученные за каждый месяц.
Рис 93. Простая гистограмма: полезная для представления прерывистой, дискретной информации
Давайте посмотрим, почему в этом примере должна быть столбчатая диаграмма, а не линейный график. Линейная диаграмма очень хорошо подходит для непрерывного, сплошного, продолжительного потока данных. А наши цифры продаж — это итог за месяц, там ничего не меняется, они уже статичны. Если эти данные представить в форме столбца, то мы знаем, что в январе компания заработала 100 долларов, а в феврале 120. Если мы представим эту же информацию в виде линейной диаграммы, то тут по–прежнему будет 100 и 120 долларов по состоянию на начало каждого месяца. Но при этом, смотря на линейный график, мы автоматически представляем, что 15 числа компания заработала 110 долларов. Что неправда. Столбцы используются для дискретных, раздельных единиц измерения, а линии — когда данные носят непрерывный характер, например, температура.
Рис 94. Простой линейный график: полезный для представления непрерывной информации
Тут мы можем видеть, что в 8.00 утра температура составляла 20 градусов Цельсия, а 9.00 утра — 22 градуса. Если мы посмотрим на линию, то представим себе, что в 8.30 у нас был 21 градус, что является вполне корректным, так как температура носит непрерывный характер и каждая точка не является суммой других значений, а представляет собой точную величину на данный момент или возможное значение между двумя точными величинами.
И столбцы, и линии могут быть составными. Это отличный инструмент для представления материала, который может работать разными способами. Давайте возьмем для примера компанию, у которой имеется 3 территории, три месторасположения.
Рис 95. Сгруппированная гистограмма
Для каждого месяца у нас будет три столбца, по одному для каждого из магазинов, в общей сложности 36 за год. Если мы поместим их друг рядом с другом, мы сможем быстро увидеть, в каком месяце какой магазин принес самую большую выручку. Это интересная и убедительная история, но в тех же данных кроется и еще кое–что. Если мы поставим столбцы друг на друга, то у нас получится только один столбец для каждого месяца, и мы утратим возможность с легкостью увидеть, какой магазин больше всего принес денег, но зато мы можем увидеть, в какой из месяцев компания в целом поработала лучше всего и заработала больше всего денег.
Рис 96. Составной столбчатый график
Оба этих варианта являются убедительными и действенными способами отображения одной и той же информации, но при этом они рассказывают две разные истории, используя одни и те же первоначальные данные. Как для журналиста, для вас самым важным аспектом работы с данными является то, чтобы в первую очередь выбрать, какую именно историю вы хотите рассказать. О том ли, какой месяц — лучший для бизнеса, или о том, какой магазин может считаться флагманским, по крайней мере, по доходам? Это, конечно, простой пример, но на самом деле, в этом вся суть, это центральный момент журналистики данных: нужно задать правильный вопрос прежде, чем вы зайдете слишком далеко. Сам сюжет, сам материал будет направлять вас и обусловливать ваш выбор варианта визуализации.
Столбчатый график и линейная диаграмма — это действительно повседневные, базовые инструменты, буквально–таки хлеб насущный любого журналиста данных. Отталкиваясь отсюда, вы можете уже расширять ваш инструментарий посредством включения в него гистограмм, горизонтальных графиков, искрографиков, потоковых графиков и других инструментов, которые обладают сходными свойствами, но предназначены для слегка отличающихся друг от друга ситуаций, в том числе по количеству данных, по источникам данных, по местоположению графика в тексте.