Можно привести еще много примеров того, как накопленное количество информации, ее разнообразие и скорость обработки в один момент позволяли извлекать из нее новые качественные свойства. Периодическое перетекание количества в качество есть свойство информации.
Невозможно сказать, когда точно заканчиваются «малые» данные и начинаются «большие». В некоторых отраслях, где ранее невозможно было без огромного труда собрать и записать данные, теперь благодаря современным технологиям такая возможность появилась, а их даже относительно небольшой объем порой дает потрясающий результат и описывается в публикациях и статьях в качестве примера использования технологии «больших данных». В иных же сферах объем может исчисляться терабайтами и миллиардами записей — и также хранить в себе скрытые качества. Но даже это не значит, что революция больших данных для них уже пройдена: дальнейший рост объемов, вариативности и возможностей по обработке данных рано или поздно откроет их владельцам новые полезные факты, не очевидные при анализе данных меньшего количества. Например, внедрение банком HSBC системы анализа хранящихся у него больших данных (денежных транзакций, геоданных, поведения клиентов и т.д.) за первые же две недели выявил криминальные группы и мошеннические схемы более чем на 10 миллионов долларов6.
Как уже говорилось, это является лишь этапом перетекания количества информации в качество — с увеличением объема данных (а также их количества, вариативности, точности, скорости обработки) из них можно будет извлекать все больше новой информации. В какой-то момент «большие данные» могут стать «очень большими данными», а потом «очень-очень большими» и так далее — их «размер» ограничивают лишь возможности сбора и обработки, определенные рамками технологического прогресса той или иной исторической эпохи.
В наше время созрели материальные предпосылки для целой революции больших данных. Кардинально сократилось историческое время, требуемое для перехода количества информации в качество. Революция больших данных, начавшаяся на наших глазах, состоит из множества качественных скачков перетекания «малых данных» в «большие» (а тех, что уже «большие», рано или поздно в «очень большие» и так далее) и приобретения ими новых полезных качеств. Говоря о трактовке определения больших данных, современных людей иногда сравнивают с индейцами племени пихара, живущих в лесах Бразилии. Они используют всего три числительных: одно означает «один-два», другое — «несколько», а третье — «много» или «гораздо больше».
Прежде чем приступить к описанию материальных предпосылок начавшейся революции, объясняющих данный феномен, и приводить конкретные примеры использования больших данных, отметим еще кое-что.
Революция больших данных в способах производства тесно связана с четвертой технологической революцией, о которой сейчас активно пишут многие экономисты и на пороге которой, судя по всему, уже стоит человечество. Первые три произошли в результате массового использования техники в производстве, изобретения парового двигателя и машинных способов генерации энергии, появления компьютеров. Обычно, говоря о новой технологической революции, в первую очередь подразумевают развитие искусственного интеллекта и роботизации экономики, способной в ближайшие годы заменить десятки традиционных профессий. В свою очередь искусственный интеллект очень близок с большими данными, поскольку он обучается, анализируя и интерпретируя данные. Позже мы постараемся доказать, что именно данные и феномен информации являются основной составляющей в процессе изменения типа производства и именно их нужно рассматривать в качестве главного элемента четвертой технологической революции.
Более того, как мы увидим во второй и третьей главе, начавшаяся революция в скором времени принесет человечеству новые возможности коммуникации подобно тем, какие однажды подарили нам книгопечатание, телефон или Интернет. Такие кардинальные изменения в средствах передачи информации, каждый раз изменявшие общество и ход истории до неузнаваемости, получили название информационных революций.
Таким образом, революция больших данных, заключающаяся в безостановочном перетекании количества (вариативности, валидности, скорости получения и обработки)