Разумеется, большие данные используются и в отраслях, напрямую связанных с производством.
Так, в российском сельском хозяйстве21, по прогнозам Фонда развития интернет-инициатив и ряда государственных структур, уже к 2020 году более трети аграрных предприятий будут использовать в своей работе большие данные, что позволит им сократить издержки производства до 40%. При принятии решений относительно организации производства предприниматель, работающий в области сельского хозяйства, должен руководствоваться огромным количеством факторов, таких как погода, состояние посевов и почвы, история болезней, эксплуатационные особенности техники и многое другое. Большую часть из этих данных нужно собирать и хранить годами, с объемом накопленных данных будет увеличиваться и эффективность информации, полученной в результате их обработки. Датчики современной сельскохозяйственной техники, анализирующие физические факторы, и компьютеры, совмещающие их с показателями снимков со спутников, прогнозом погоды и рядом других релевантных данных, сегодня не модная причуда, а порой единственная возможность конкурировать в сфере сельского хозяйства. Подобно тому, как индустриальный трактор, заменив собой лошадь, в свое время облегчил жизнь крестьян, многократно увеличив производительность труда, новый «информационный трактор», опирающийся на анализ больших данных (а значит, знающий, что, где и сколько сеять, поливать и собирать), выводит аграрное производство на новый уровень и делает простые индустриальные тракторы неконкурентоспособными перед их усовершенствованными при помощи больших данных аналогами. Так же, как пахотная скотина не смогла когда-то конкурировать с трактором во времена индустриальной революции.
Большие данные используются или активно внедряются практически на любом передовом промышленном предприятии. Анализ собираемых десятилетиями показателей выявляет слабые стороны товаров, предотвращает поломку продукции и средств производства. Например, в автомобильной промышленности большие данные как основу используют навигаторы и системы автопилота, за внедрение которых идет конкурентная
борьба ведущих корпораций. Компании, не использующие технологию больших данных, а главное, не собирающие и не хранящие данные со своих автомобилей, рискуют навсегда потерять конкурентоспособность и производство.
Прогноз продаж автономных автомобилем в мире, млн ед. в год.
Источник: J'son & Partners Consulting, 2017
Программа Министерства промышленности и информатизации Китая, одного из ведущих государств по применению технологий больших данных, указывает на необходимость скорейшего их внедрения в промышленное производство: «Планируется, что к 2020 году продукты и услуги, связанные с большими данными, принесут стране 1 трлн юаней, при этом совокупный прирост дохода будет в среднем увеличиваться на 30% в год... Между тем в Министерстве отмечают, что технологии больших данных еще недостаточно распространены на производстве. По словам аналитиков, большие данные могут оптимизировать работу производственного конвейера и предупредить неисправности, помочь менеджерам принимать мотивированные управленческие решения и интеллектуализировать хозяйственную деятельность»22. А по оценке General Electric, оптимизация работы оборудования за
счет анализа данных на базе Big Data в перспективе 20 лет обеспечит экономию для населения до 30%23.
В гуманитарных областях науки так же, как и в технических, передовые исследования все реже обходятся без больших данных. В науках, связанных с изучением людей и общества, традиционные опросы нескольких тысяч респондентов или узкие фокус-группы не дают и десятой доли той информации, которой располагают, к примеру, владельцы больших данных о миллионах пользователей Интернета, на чем полностью строится современная таргетинговая интернет-реклама. Во многом это обусловлено характером мировой экономики (о чем мы поговорим в следующей главе), а также тем, что Интернет является полностью датифицированной сферой, где каждое действие пользователя оставляет свой след, записывается и бережно хранится. Система интернет-рекламы, реализуемая в первую очередь информационными корпорациями Google и Facebook, и анализ больших данных тысяч характеристик пользователей позволяет рекламодателям предложить свою рекламу наиболее релевантной аудитории. В июне 2018 года конгресс США опубликовал письмо от корпорации Facebook, содержащее ответы на вопросы, которые ее глава Марк Цукерберг не смог или не успел дать во время пристрастных слушаний в Капитолии Вашингтона, вызванных скандалом с использованием этой социальной сети как инструмента для манипуляций мнением избирателей во время президентских выборов. В письме перечисляются типы данных, собираемых социальной сетью со своих пользователей. К ним относятся время, частота и длительность действий в окне с вкладкой соцсети (в том числе открыто ли оно или находится в фоновом режиме); покупки на сторонних сайтах; установленные в браузере пользователя плагины; движения мыши на устройстве пользователя; использование камеры, встроенной в приложение Facebook; метаданные фотографий (в том числе время и место съемки); установленные на устройстве пользователя приложения; имена и типы файлов на устройстве пользователя; идентификаторы из игр, приложений и других учетных записей; доступное место на диске устройства пользователя; контакты из адресной книги пользователя; в случае с Android-устройствами — журнал звонков и история SMS; ближайшие к пользователю точки доступа Wi-Fi и сотовой связи; информация мобильных и стационарных провайдеров через компьютеры, телефоны, сопряженные телевизоры и другие устройства в сети; информация об уровне заряда устройства пользователя, настройках и разрешениях; информация и фотографии других пользователей, а также частота взаимодействия и общения с ними24. И это не считая данных партнеров и другой информации, которую Facebook покупает в офлайне. Как видим, социальная сеть обладает серьезными массивами данных о каждом своем пользователе и благодаря этому имеет возможность продавать качественную нацеленную рекламу наравне с Google.