В 1980-х годах, когда Джон Рид сделал свое заявление, банки не имели колл-центров и интернет-банкинга – были только отделения. Даже тогда обработка данных и их важность для банков казались пророческими. К тому моменту банки прошли 1960-е и 1970-е, автоматизировав работу учетных подразделений с помощью мейнфреймов[2 - Мейнфрейм – высокопроизводительный компьютер со значительным объемом оперативной и внешней памяти, предназначенный для организации централизованных хранилищ данных большой емкости и выполнения интенсивных вычислительных работ. Прим. ред.], и уже интенсивно обрабатывали данные.
Первой и крупнейшей по обработке финансовых данных стала компания Visa, коммерческая организация, порожденная успехом BankAmericard – кредитной карты, которая ворвалась в жизнь Соединенных Штатов в 1960-х. В то время обработка счетов на бумаге и копирке сдерживала развитие промышленности, и Visa автоматизировала эти процессы. Сегодня компания обрабатывает миллиарды триллионов байт данных ежедневно.
Начиная от автоматизации банков и системы Visa с помощью крупных мейнфреймов до сегодняшнего состояния ситуация менялась постепенно и явилась результатом революционного роста вычислительных мощностей. Автоматическая обработка данных, которая использовалась при отправке человека на Луну, была более примитивной, чем та, что выполняется сегодня в вашем смартфоне.
В сравнении с банками 40-летней давности, которые только начинали автоматизировать работу своих учетных подразделений и обрабатывать операции с денежными средствами, сегодняшняя Visa обрабатывает 100 млрд операций в год, а валютные трейдеры совершают сделки на сумму около 5 трлн долларов[3 - Если не оговорено иное, валюта, упоминаемая в этой книге, – доллар США.] в день. И торговые обороты продолжают расти в геометрической прогрессии.
Эти величины отражают взрывной рост объема данных по всему миру вследствие повсеместного распространения технологий. Одной из причин подобного роста является тот факт, что большинство людей на планете имеют в своем распоряжении или мобильный телефон, или планшет, или ноутбук, или другое техническое устройство.
Сегодня мы говорим, что данные, произведенные за год, превосходят по количеству все данные, произведенные за всю предыдущую историю человечества, но что на самом деле это означает? Наилучшим образом это можно проиллюстрировать на примере полного собрания сочинений Шекспира.
Уильям Шекспир, поэт и драматург, создавал великолепные пьесы, драмы, трагедии, сонеты и поэмы. Если вы представите результаты его труда в виде компьютерного файла, то все произведения поместятся в файл объемом около 5 мегабайт. Сегодня мы производим 500 млрд произведений Шекспира ежедневно. Да, да, все правильно, 500 млрд произведений Шекспира, или, если вы предпочитаете компьютерные величины, – 2,5 эксабайта данных в день. Эксабайт – это 1018 байт, ошеломляющее количество информации!
Значительная часть этих данных неверна или бесполезна, и появляется в виде обновлений в Twitter, Tumblr, Flickr, Facebook и других социальных медиа. Тем не менее рост интернета и массовое развертывание мобильных коммуникаций привели нас к обществу, в котором каждый из семи миллиардов проживающих на планете может общаться, делиться информацией, совершать сделки и торговать друг с другом в электронном формате, один на один, в мировом масштабе.
Это метаморфозы сегодняшнего дня. Именно поэтому эксабайты данных генерируются каждый день, а сами данные становятся новым полем битвы для коммерции. От покупок до банковских операций, каждый аспект нашей жизни является объектом сбора данных. Анализ данных, их взаимосвязь и полнота становятся критичными.
Именно поэтому данные рассматриваются как новая «смазка» для механизмов бизнеса, торговли и экономики во всем мире. Именно поэтому воры нацелились на кражу данных, поскольку где данные – там деньги. Именно поэтому данные стали золотом для каждого, кто пытается завладеть долей внимания и кошельков своей целевой аудитории.
Мы живем в мире, где каждый богат данными и беден временем. Это создает настоящую проблему: как просеять все эти данные, чтобы найти золото? Как проанализировать всю эту информацию, чтобы добраться до сути? Как найти те неизвестные в данных, которые приведут к знанию? И как победить все эти байты и биты, чтобы обрести мудрость?