Выбор в пользу сервиса Google Docs был сделан потому, что он позволяет полностью контролировать результаты. Мне не пришлось пользоваться каким–то сторонними аналитическими инструментами. Я мог с легкостью поместить результаты в базу данных или в таблицу. Когда вы используете специальное программное обеспечение для опросов общественного мнения, вы зачастую можете использовать только предусмотренные им инструменты. Если бы информация, которую мы хотели собрать, требовала какого–то деликатного обращения, то мы могли бы не прибегать к сервисам Google и попробовать справиться со всем своими собственными силами. А в целом оказалось очень просто разместить форму Google Form на странице Guardian, при этом пользователю было практически не видно, что именно мы используем. Так что это оказалось очень удобно.
В качестве совета журналистам, работающим в сфере данных, которые хотят использовать краудсорсинг: вы должны очень точно знать, какую информацию вы хотите получить. Задавайте вопросы, которые могут иметь очень большое количество разных ответов. Попробуйте понять демографию аудитории, к которой вы обращаетесь, чтобы понять, не является ли ваша выборка предвзятой. Если вы спрашиваете о суммах и других подобных вещах, попробуйте указать, что ответ должен быть в цифрах, что пользователи должны использовать определенную валюту т. п. Многие все равно не выполнят эти указания, но чем больше вы регламентируете этот процесс, тем будет лучше. И всегда, всегда добавляйте поле для комментариев, так как большое количество людей заполнят поля опроса, но при этом им очень хочется довести до вас свое мнение по данному вопросу. Особенно если речь идет о нарушениях прав потребителей или произволе.
— Интервью Джеймса Болла, журналиста Guardian, Марианне Баучарт, блог «Data Journalism»
Использование и обмен данными: готический шрифт, мелкий шрифт и реальность
В данном разделе мы кратко рассмотрим положения законодательства о данных и базах данных, и посмотрим, что вы можете сделать, чтобы открыть ваши данные, используя имеющиеся общедоступные лицензии и правовые инструменты. Не позволяйте ниже перечисленным преградам ослаблять ваше стремление к журналистике, посвященной данным. Обычно вы не будете сталкиваться с правовыми ограничениями при использовании данных, и вы можете легко сделать так, чтобы они не мешали другим людям пользоваться опубликованными вами данными.
Следует признать, что сейчас добывать данные стало просто, как никогда. Раньше, до эпохи широкой публикации данных в Интернете, даже если вы обнаруживали нужную вам базу данных, вы должны были просить того, у кого она находилась, предоставить вам доступ к ней, отправляя для этого письмо или совершая личный визит. Теперь ваш компьютер просит другой компьютер отправить ему нужную копию . Это, конечно, очень упрощенная схема, но в настоящее время у вас есть право на копирование, а они (лица, создавшие или опубликовавшие данные) ничего не сделали и, возможно, даже не знают, что вы скачали себе копию.
А что насчет скачивания данных какой–либо программой (называемого иногда «выскребанием») и условиями предоставления услуг? Посмотрите на предыдущий абзац: ваш браузер как раз и является такой программой. Могут ли условия предоставления услуг разрешать доступ только определенным программам? Если вы обладаете огромным количеством времени и денег на чтение таких документов и на получение юридических консультаций, то, конечно, действуйте. Однако обычно достаточно просто не делать резких движений: если ваша программа нанесет сайту какой–либо урон, то доступ к нему может оказаться просто заблокированным для вашей сети, и вполне возможно, что вы именно того и заслуживаете. В настоящее время наработана большая практика доступа к данным и «выскребания» их из Интернета. Если вы планируете такие действия, то для начала можно почитать об этом на таких сайтах, как ScraperWiki.
Получив интересующие вас данные, вы можете изучать их, сортировать, визуализировать, сравнивать и выполнять любые другие аналитические действия с вашей копией данных. Вы можете опубликовать ваш анализ, который может содержать любые данные. Популярное выражение «факты бесплатны» (как и выражение «свобода слова») имеет глубокий смысл, однако, возможно, оно является просто популярным выражением для тех, кто слишком много думает о правовой стороне баз данных или даже об управлении данных.
Что, если, являясь или стремясь быть хорошим журналистом, работающим в сфере данных, вы намереваетесь опубликовать не только ваш анализ, включающий некоторые факты или отдельные данные, но и наборы/базы данных, использованные вами в подготовке анализа и добавленные к нему? Или, может быть, вы являетесь просто смотрителем данных и никак не анализировали их — в конце концов, смотрители данных тоже нужны. Если вы используете данные, собранные каким–то другим лицом, то можете столкнуться с определенными проблемами. (Если база данных собрана полностью вами, все равно прочитайте следующий абзац для мотивации описываемого далее распространения данных.)
Вы, должно быть, знаете, как авторское право защищает творческий труд: если владелец авторского права не давал разрешения на использование работы (или если работа является общественным достоянием, или ваше использование попадает под исключения или ограничения, например, положения о добросовестном использовании), а вы ее все равно используете — распространяете, исполняете и т. д., владелец авторского права может заставить вас прекратить делать это. И, несмотря на то, что факты сами по себе бесплатны, коллекции фактов могут охраняться таким же образом, хотя соответствующие законы являются более разнообразными, чем законы об авторском праве на творческие работы. Кратко говоря, база данных может быть объектом авторского права, как творческая работа. Во многих юрисдикциях применяется принцип «труда автора», по которому сам факт создания базы данных, даже без приложения творческих усилий, делает эту базу данных объектом авторского права. В Соединенных Штатах, однако, имеется тенденция установления более высокого уровня минимальной творческой составляющей, необходимой для применения авторского права (классическим примером является дело «Feist против Rural» — спор о признании авторского права на телефонную книгу). Однако в некоторых юрисдикциях существуют права на базы данных, защищающие эти базы, при этом эти права не являются авторскими правами (хотя зачастую области, на которые эти права распространяются, пересекаются друг с другом, особенно в тех случаях, когда необходимый для признания авторского права минимальный уровень творчества практически отсутствует). Самым распространенным примером является применяемые в Европейском Союзе права на базы данных «sui generis». Так что, особенно если вы находитесь в Европе, вам может понадобиться разрешение на публикацию базы данных, полученной от другого лица.
Несомненно, эти ограничения не способствуют развитию экосистемы журналистики в сфере данных (не приносят они пользу и обществу в целом — социологи и другие исследователи уже говорили ЕС об этом еще до того, как появились права на базы данных «sui generis», и проводящиеся с тех пор исследования подтверждают их правоту). К счастью, вы, публикуя базу данных, можете снять эти ограничения (при условии, что база данных не содержит элементов, на публикацию которых вы не вправе предоставлять разрешения), в частности, предоставляя разрешения заблаговременно. Вы можете сделать это, издав вашу базу данных по общедоступной лицензии или объявив ее всеобщим достоянием — наподобие того, как это делают многие программисты, выпуская свободное программное обеспечение с общедоступными (открытыми) исходными кодами, с тем чтобы все желающие могли использовать их код (т. к. журналисты, работающие с данными, часто работают и с кодами, вам следует снять ограничения и с вашего кода, чтобы вашу коллекцию данных и аналитику можно было переопубликовывать). Можно назвать много причин, по которым вам следует открывать свои данные. Например, ваша аудитория может создать новую визуализацию или приложения, на которые вы можете затем ссылаться, как, например, делает Guardian, располагая сообществом визуализации на ресурсе Flickr. Ваши наборы данных могут быть объединены с другими наборами данных, что позволит вам и вашим читателям более широко взглянуть на изучаемую проблему. То, что сделают другие пользователи с вашими данными, может привести вас к новой статье или дать вам идеи для новой статьи либо нового проекта в сфере данных. И, конечно, все это принесет вам всеобщее уважение.