Описание команды
Команда, которая занимается производством продуктов из области журналистики данных для сайта BBC News, состоит примерно из двадцати журналистов, дизайнеров и разработчиков.
Наряду с проектами в области данных и визуализациями, команда делает всю инфографику и интерактивные мультимедиа–решения на новостном вебсайте. Все вместе это образует набор сюжетной техники, который мы стали называть «визуальной журналистикой». У нас нет людей, которых отдельно идентифицируют как «журналистов данных», но весь редакционный персонал команды должен уметь пользоваться базовыми табличными приложениями, такими как Excel и Google Docs, для анализа данных.
Главным и ключевым для любых проектов в области данных являются технические навыки и советы наших разработчиков, а также навыки наших дизайнеров в области визуализации. И хотя все мы либо журналисты, либо дизайнеры, либо разработчики «в первую очередь», мы продолжаем упорно трудиться над увеличением степени нашего понимания и умения ориентироваться в профессиональных областях другого.
Ключевыми продуктами для исследования данных являются Excel, Google Docs и Fusion Tables. Команда также использовала, но в меньшей степени, базы данных MySQL и Access, и Solr для обработки бОльших массивов данных, а также пользовалась RDF и SPARQL для того, чтобы начать искать способы, которыми мы можем моделировать события с использованием технологий Linked Data. Разработчики также использовали и используют языки программирования по своему вкусу, будь то ActionScript, Python или Perl для сверки, разбора и, возможно, опровержения наборов данных, над которыми мы работаем. Perl используется также для решения некоторых издательско–публикационных задач.
Для изучения и визуализации географических данных мы используем Google, Bing Maps и Google Earth, а также сервис ArcMAP от Esri.
Для графиков мы используем приложение Adobe Suite, включая Adobe After Effects, Adobe Illustrator, Adobe Photoshop и Adobe Flash, хотя мы редко публикуем флэш–файлы сейчас на сайте, так как JavaScript, в частности, JQuery и другие библиотеки JavaScript, такие как Highcharts, Raphael и D3, все больше отвечают нашим требованиям в области визуализации данных.
— Белла Харрел и Эндрю Леймдорфер, BBС
Как работает группа подготовки новостных приложений в Chicago Tribune
Рис 16. Команда по новостным приложениям Chicago Tribune (Фото Брайана Бойера)
Команда подготовки новостных приложений в Chicago Tribune – это просто сборище радостных компьютерщиков, внедренных в ньюсрум. Мы работаем в тесном контакте с редакторами и журналистами, помогая: (1) проводить исследования и создавать информационные материалы, (2) иллюстрировать сюжеты в онлайне, и (3) создавать неувядающие, незабываемые веб–ресурсы для прекрасных людей Чикаго.
Это очень важно, что мы сидим в ньюсруме. Мы обычно находим работу посредством диалогов лицом к лицу с журналистами. Они знают, что мы с удовольствием поможем написать скрин–скрэпер для отвратительного правительственного вебсайта, разорвем в клочки пачку PDF–ов, или каким–нибудь еще способом превратим то, что еще не является данными, в нечто, что вы сможете проанализировать. Это своего рода рекламная продажа с целью привлечения покупателей в нашей команде – таким способом мы узнаем о потенциальных проектах в области работы с данными еще на этапе их начала.
В отличие от многих других команд и групп подготовки в этой области, наша команда была основана технологами, для которых заняться журналистикой означало серьезную перемену в развитии карьеры. Некоторые из нас приобрели магистерскую степень в журналистике спустя несколько лет работы программистами в бизнес–целях, а других взяли из сообщества открытого правительства.
Мы работаем в очень подвижной и динамичной манере. Чтобы убедиться в этом и гарантировать, что мы всегда в синхронизированном режиме и готовы к бою, каждое утро начинается с пятиминутной летучки. Мы часто программируем парами – два разработчика за одной клавиатурой – зачастую такой вариант оказывается более продуктивным, чем вариант «два разработчика за двумя клавиатурами». Процесс производства большинства проектов занимает не более недели, но иногда бывают и более длительные проекты, над которыми мы работаем недельными циклами, а потом показываем результаты нашей работы заинтересованным группам лиц – обычно журналистам и редакторам – каждую неделю. Как мантра произносятся слова «Терпи неудачу быстро» (Fail fast). Если ты делаешь что–то неправильно, то нужно узнать об этом как можно скорее, особенно когда ты пишешь программу, что называется, «в жесткие сроки»!
Существует огромный плюс в программировании итерационно, в жесткие сроки. Мы всегда обновляем наш набор инструментов. Каждую неделю мы выдаем в свет одно или два приложения, потом, в отличие от обычных фабрик и магазинов программного обеспечения, мы имеем возможность задвинуть его на самую дальнюю полку нашего мозгового склада и перейти к следующему проекту. Это та радость, которую мы разделяем с журналистами, каждую неделю мы узнаем что–то новое.
Все идеи относительно приложений поступают от редакторов и журналистов в ньюсруме. Это, я уверен, отличает нас от команд, занимающихся приложениями, в других ньюсрумах, которые часто рожают свои собственные идеи. Мы построили крепкие личные и профессиональные отношения в редакции, и парни знают, что когда у них есть данные, они приходят к нам.
БОльшая часть нашей работы в ньюсруме – это поддержка журналистов. Мы помогаем репортерам раскапывать данные, превращать PDF–файлы в таблицы, разрабатывать скрин–скрэповые сайты, и так далее. Это услуги, которые нам нравится предоставлять, потому что благодаря им мы раньше всех знакомимся с данными, с работой над этими данными, которая идет в редакции. Какая–то часть этой работы превращается в новостное приложение – карту, таблицу, или порой крупномасштабный сайт.
Ранее мы делали ссылку на приложение с опубликованного материала, и в этом случае такой вариант не давал особого трафика. Сейчас же приложения появляются где–то рядом с верхней частью главной страницы нашего сайта, и уже приложение содержит ссылку на сам материал, и такой вариант отлично работает, идя на пользу и приложению, и новостному материалу. Есть на сайте специальный раздел для результатов нашей работы, но трафик на него не очень хороший. Но это и неудивительно. «Эй, сегодня мне нужны кое–какие данные» – это не особо распространенный подход со стороны пользователей.
Нам нравится большое количество просмотров, и нам нравятся награды наших коллег, но это, тем не менее, слабая приправа к интересу. Мотивация все время должна наносить удар, воздействовать – на жизнь людей, на законы, на призвание к отчету политиков, и так далее. Написанная статья будет высказываться в поддержку тенденции и гуманизировать ее парой историй или рассказов. Но что должен делать читатель, когда мы закончим историю? В безопасности ли его семья? Обучаются ли должным образом его дети? Наша работа оправдывает себя, когда она помогает читателю найти его или ее собственную историю в массиве данных. Примеры имеющей ударную силу, эффективной и персонализированной работы, которую мы проделали, можно найти в наших приложениях «Отчеты по безопасности в домах престарелых» ( Nursing Home Safety Reports) и «Сводные таблицы школ» ( School Report Card).
— Брайан Бойер, Chicago Tribune
За кулисами в Guardian Datablog
Рис 17. Визуализированный производственный процесс Guardian Datablog (The Guardian)
Когда мы запустили проект Datablog, мы не имели понятия, кто будет интересоваться исходными данными, статистикой и визуализациями. Как сказал некто весьма высокопоставленный в моем офисе, «зачем это может кому–то понадобиться?»
Проект Guardian DatablogGuardian Datablog — который я редактирую — должен был стать небольшим блогом, предлагающим полные наборы данных, лежащих в основе наших материалов. Сейчас он состоит из первой страницы (guardian.co.uk/data); функции поиска по данным мирового правительства и глобального развития; решений в области визуализации данных из сети и от художников–графиков Guardian, и инструментов для изучения данных о государственных расходах. Каждый день мы используем таблицы Google, чтобы делиться с людьми данными, которые мы использовали в нашей работе; мы визуализируем и анализируем эти данные, потом используем их для создания сюжетов и материалов для газеты и интернет–сайта.