Выбрать главу

Рис 65. Open Data badges (Open Knowledge Foundation)

Когда автор понимает, что издание работ с общедоступными лицензиями является необходимостью, возникает вопрос: какую лицензию применить? Ответ на этот непростой вопрос зачастую будет зависеть от проекта или сообщества, на работу которого вы опираетесь, либо которому вы планируете предоставить вашу работу — используйте ту лицензию, которую использует это сообщество. Если вам нужно копать глубже, начните с открытых и свободных лицензий — означающих предоставление разрешения на использование всем желающим (может требоваться указание автора и распространение на таких же условиях). То значение, которое имеют для программного обеспечения такие понятия, как «Определение свободного программного обеспечения» и «Определение Open Source» (Открытого программного обеспечения), имеет Определение открытой информацииработы и устанавливает права, предоставляемые пользователям открытыми лицензиями.

На веб–сайте Open Knowledge (Открытая информация) вы можете найти список таких лицензий. В целом эти открытые лицензии делятся на три класса:

 Объявление всеобщим достоянием, что является лицензией, предоставляющей максимальный объем разрешений; использование работы не ограничивается никакими условиями.

 Разрешающие лицензии или лицензии, требующие указания авторства; единственным основным условием является указание автора работы.

 Копилефт, перекрестные лицензии или лицензии, предусматривающие дальнейшее распространение на тех же условиях.

Если вы используете набор данных, опубликованный другим лицом на условиях открытой лицензии, то можете считать предыдущий абзац очень кратким руководством по выполнению условий этой открытой лицензии. Чаще всего вам придется сталкиваться с лицензиями, созданными организациями Creative Commons и Open Data Commons, а также различными правительствами, во всех этих лицензиях обычно имеется раздел, в котором находятся все основные условия лицензии. Обычно лицензия указывается на странице, с которой можно скачать (или «выскрести», т. к., несомненно, веб–страницы могут содержать наборы данных) базу данных, либо на видном месте в самой базе данных, в зависимости от формата. Эти обозначения должны нанести и вы, открывая свои наборы данных.

Возвращаясь к началу, зададим вопрос: что, если нужной вам базы данных нет в Интернете или доступ к ней каким–то образом контролируется? Подумайте о том, чтобы не просто попросить доступ для себя, но и попросить открыть эти данные всему миру для их использования. Вы можете рассказать владельцам данных о том, какие замечательные вещи могут произойти с их данными, если они сделают это.

Вместе с тем, открытие данных всему миру может привести к тому, что к ним станут применимы положения о неприкосновенности личной жизни и другие норма. Действительно, тот факт, что открытие данных снимает многие технические барьеры и ограничения, связанные с авторскими правами, не означает, что вы не должны соблюдать иные применимые законы. Однако так было всегда, кроме того, существуют замечательные инструменты и меры защиты журналистов, если ваш здравый смысл подскажет вам, что эти данные необходимо исследовать.

Удачи вам! Хотя, вероятнее всего, удача больше понадобится вам для выполнения других аспектов вашего проекта, а не для регулирования (низких) правовых рисков.

Майк Линксвайер, Creative Commons

Трактование данных

Получив данные, что вы будете с ними делать? На что нужно обращать внимание? Какие инструменты использовать? В данной главе мы познакомим вас с некоторыми идеями о том, как можно повысить грамотность в сфере данных, подскажем, как работать с цифрами и статистикой, и расскажем, о чем следует помнить, работая со спутанными, некачественными и зачастую недокументированными наборами данных. Мы научимся писать статьи на основе извлекаемой из данных информации, изучим основные инструменты журналистов, работающих с данными, и рассмотрим, как использовать визуализацию данных для проникновения в суть рассматриваемой проблемы

Обретение грамотности в сфере данных за три простых шага

Рис 66. Digging into data ( JDHancock)

Как под грамотностью понимается «способность читать для получения знаний, умение писать и критически осмысливать печатный материал», под грамотностью в сфере данных понимается способность использовать данные для извлечения информации, производить связанные данные и критически осмысливать их. Грамотность в сфере данных включает в себя грамотность в сфере статистики, умение работать с большими наборами данных, понимание того, как данные были составлены, умение объединять разные наборы данных и способность толковать данные.

В Университете новостей (проект Института им. Пойнтера) проводятся занятия по математике для журналистов, на которых их учат таким вещам, как изменения процентных значений и средние показатели. Что интересно, тому же самому учат во флоридских школах (именно там находится Институт им. Пойнтера) учеников пятых классов (в возрасте 10–11 лет), о чем свидетельствует программа школьного обучения.

Тот факт, что журналистам нужна помощь в тех разделах математики, которые школьники изучают в пятых классах, показывает, как печально обстоят дела в ньюсрумах с грамотностью в сфере данных. Соответственно, не обходится без проблем. Как может журналистка, работающая в сфере данных, извлечь пользу из массива данных по изменению климата, если она не знает, что означает доверительный интервал? Как может репортер, работающий в сфере данных, написать статью о распределении доходов, если он не может отличить среднее значение от медианы?

При этом, чтобы научиться обращаться с данными, журналисту не обязательно получать диплом магистра статистики. Существует несколько простых способов, которые могут помочь лучше понять цифры и данные. Как говорит преподаватель Института им. Макса Планка Герд Гигеренцер, хорошие инструменты не гарантируют хорошую журналистику, если ими пользоваться без хороших знаний.

Даже если у вас отсутствуют какие–либо знания из области математики или статистики, вы легко можете стать журналистом в сфере данных, задав три очень простых вопроса.

1. Как были собраны данные?

Удивительный рост ВВП

Самый простой способ продемонстрировать зрелищные данные — сфабриковать их. И этот способ применяется даже к таким привлекающим всеобщее внимание данным, как показатели ВВП. Бывший посол Великобритании Крейг Мюррей пишет в своей книге «Убийство в Самарканде», что показатели роста в Узбекистане являются объектом напряженных переговоров местных властей с международными организациями. Другими словами, они не имеют никакого отношения к местной экономике.