Многие данные, пока еще не нашедшие своего применения, сегодня сохраняются и будут использоваться в дальнейшем, рано или поздно создавая информацию в соединении с новыми данными. Здесь можно заметить еще одно фундаментальное и по-своему уникальное свойство данных и информации. При сложении собранных данных объем информации, который можно из них извлечь, больше, чем можно извлечь из каждой базы данных по отдельности. Пауло Коэльо говорил, что радость идет против основ математики: она умножается, когда мы ею делимся. Так вот данные, оказывается, обладают примерно таким же свойством. Подробнее об этом мы поговорим во второй главе. А сейчас пришло время рассмотреть несколько серьезных примеров применения больших данных и оценить влияние, которое они уже оказывают на экономику и нашу жизнь.
Как большие данные меняют мир
Итак, автоматизированная обработка огромных массивов данных, даже в отдельно взятых отраслях, уже сегодня дает невообразимые в недавнем прошлом результаты. Это направление активно развивают многие передовые корпорации, государства и научные сообщества, выделяя большие данные в качестве одного из ключевых векторов своего развития. Нахождение значимых корреляций и построение на основе алгоритмов причинно-следственных связей позволяет решать самые разные задачи, оптимизировать многие процессы.
Так, использование технологии больших данных в здравоохранении16 массово реализуется в развитых странах. К примеру, в США более 94% больниц уже применяют электронные карты17, ведется массовая оцифровка старых рукописных больничных карт и совмещение полученной информации в системе больших данных. Датификация электронных карт пациента позволяет по неявным корреляциям вычислять заболевания на ранних стадиях: так, система обработки больших данных, разработанная в 2013 году членами консорциума Kaiser Permanente, позволяет производить профилактику возможного развития слабоумия у некоторых пациентов с сахарным диабетом18. Получение и обработка данных с носимых устройств пациентов (пульсометры, специальные часы и т.д.) в сочетании с электронными медицинскими карточками дает возможность заранее предсказывать различные заболевания до проявления симптомов. Запись показателей человеческого организма в цифровом виде и анализ собранных больших данных является одним из наиболее перспективных направлений развития системы здравоохранения, способных защитить человечество от многих болезней, спасти миллионы жизней. Скажем, исследования одних лишь поисковых запросов позволили аналитикам компании Microsoft в 15% случаев выявлять рак поджелудочной железы на ранних стадиях19. По словам консалтинговой компании McKinsey, если американское здравоохранение по-настоящему эффективно научится использовать данные, то сможет сэкономить около $300 млрд в год, а колоссальные расходы страны в этой области снизятся на 8%20. Качественный сбор данных позволит отслеживать состояние и обслуживание пациентов, выявлять и пресекать врачебные ошибки, сократит число эпидемий и их опасность, поможет создавать новые лекарства. Оптимизация существующей системы при помощи анализа больших данных снизит затраты на работу больниц, устранит множество злоупотреблений и лишних расходов в государственных системах здравоохранения.