Качество публикуемых данных
Один из самых частых вопросов, возникающих у нас при изучении интернетресурсов, — насколько представленная информация корректна?
Неуверенность возрастает, как только мы переходим от простого любопытства к использованию данных для решения профессиональных задач. Могу ли я быть уверен в том, что авторы ресурса проверили опубликованную информацию? откуда она появилась? в какой степени я могу ей доверять? Сегодня не многие пользователи Интернета задумываются об источниках пространственной информации и качестве картографических данных, поэтому мы ожидаем, что уже в недалеком будущем их постигнет глубокое разочарование: лишь немногие ресурсы могут похвастаться заслуживающими доверия данными. Уже сейчас в Сети можно встретить анекдотические истории об успешно проложенных "кратчайших" маршрутах или даже о случаях элементарной дезинформации, возникающей из-за публикации устаревших картографических материалов.
Один из наиболее приемлемых вариантов оценки качества публикуемых данных — создание метаданных (данных о самих данных), где помимо специальной географической и описательной информации указывались бы такие характеристики, как точность, качество, надежность. Однако смысловая "относительность" перечисленных характеристик, с одной стороны, и многообразие стандартов метаданных, сложность их получения в автоматическом режиме и особенно субъективность при описании качества данных[См., например, Grade Finale Report (edina.ac.uk/projects/grade/GRADE_Final_Report.pdf, Do spatial data consumers really understand data quality information?; www.spatial-accuracy.org/2006/PDF/Boin2006accuracy.pdf, Spatial Data Quality By Wenzhong Shi, Peter F. Fisher and Michael F. Goodchild (Eds).Taylor and Francis, London and New York, 2002).] — с другой, не позволяют в полной мере решить проблему оценки качества публикуемых материалов.
В 2007 году Open Geospatial Consortium Data Quality Working Group (WG)[ www.opengeospatial.org.], осознавая трудности, связанные с разработкой универсального стандарта метаданных, предпринял уникальную попытку обобщить опыт, знания и экспертные мнения в области оценки качества пространственных данных.
Более чем двум тысячам специалистам в области ГИС и ДЗЗ по всему миру было предложено заполнить специальную анкету[www.surveymonkey.com/s.aspx?sm=_2ffWZCQbm2ugKS_2fW8A0MWIQ_3d_3d.] и изложить в достаточно свободной форме то, какие параметры могут быть использованы для оценки качества геопространственной информации и каким образом эта оценка может быть описана в метаданных.
Некоторые попытки по совершенствованию механизмов описания качества данных были предприняты и такими инициативными группами, как GSDI Association, CGIAR и INSPIRE. Тем не менее до сих пор метаданные являются абсолютно добровольным элементом подготовки и распространения геоданных. Большинство компаний далеко не сразу приходят к пониманию важности документирования состояния данных, и ситуация в целом остается довольно-таки печальной: чаще всего пользователь ничего не знает о качестве используемых им данных.
Авторские права и юридические аспекты
Авторские права, пожалуй, одна из самых болезненных проблем для современного веб-сообщества, не обошла она и пространственные данные. В настоящее время законодательство в области их распространения столь фрагментарно, что большинству компаний приходится действовать по принципу "все или ничего" — данные либо хранятся за семью замками в серверной части, доступной по внутренней сети ограниченному числу сотрудников компании, либо публикуются в Интернете и дальше уследить за их судьбой становится очень трудно, а чаще всего — вообще невозможно. В связи с этим компании следуют принципу "ничего" и просто-напросто не публикуют свои данные.
Более того, растет число картографических веб-сервисов, позволяющих:
1) объединять слои данных из различных источников;
2) модифицировать сами данные;
3) создавать собственные данные на основе опубликованных, и для каждого случая вообще-то необходимо определять правообладателя и особенности дальнейшего распространения и использования информации. К настоящему моменту ни один из перечисленных случаев юридически не урегулирован, что вызывает негодование поставщиков данных. Интересный анализ этой проблемы и возможное решение предложил Онсард (Н. J. Onsurd)[www.sli.unimelb.edu.au/research/SDI_research/Presentations/CommonsAndMarketMelbourne.ppt.]. Главная идея здесь сводится к созданию единой peer-to-peer системы хранения, добавления и доступа к данным с использованием Open Access Licenses (аналог GNU для ПО).