Всі сучасні інтернет-застосування зав'язані на бази даних: пошукач від Google, каталог (і пошукач) від Yahoo!, склад товарів на Amazon, картотека товарів і продавців на ebay, карти Mapquest, каталоги Napster. Хел Веріан торік навіть сказав, що «SQL — це новий HTML». Компаніям епохи Веба 2.0 важливо уміти працювати з БД. Так важливо, що деколи ми називаємо нові застосування не software, а рo ware.
Все це підводить нас до головного питання: хто володіє даними?
Очевидно — і тому є безліч прикладів, — що в епоху інтернету той, хто володіє БД, володіє і ринком, а значить, отримує левову частку прибутку. Монополія на реєстрацію доменних імен, надана американським урядом компанії Network Solutions (пізніше куплена Verisign), була однією з перших по-справжньому грошових операцій в Інтернеті. І якщо зберегти ринкову перевагу, контролюючи API, все важче, контроль над важливими джерелами даних забезпечити куди простіше. Особливо якщо ці джерела дорого відтворити (або вони були наповлені за допомогою користувачів сервісу).
Подивіться на копірайти на картах від MapQuest, maps.yahoo.com, maps.msn.com або maps.google.com. Скрізь буде позначка «Maps copyright Navteq, Teleatlas» або «Images copyright Digital Globe» (це новий постачальник супутникових зображень). Обидві компанії неабияк вклалися в свої БД. (Тільки Navteq, як то кажуть, витратила на створення БД з назвами вулиць і маршрутами 750 млн. доларів. Digital Globe довелося розлучитися з 500 млн. доларів, щоб запустити власний супутник, який робить знімки з вищою роздільною здатністю, ніж урядові сателіти.) Navteq дійшла до того, що почала ліпити свій логотип на автомобілі, які оснащені системами навігації, - майже як колись Intel зі своїм Intel Inside.
Дані, поза сумнівом, і є єдиний важливий компонент подібних застосувань, тоді як сам софтвер здебільшого поставляється у відкритому вигляді, а навіть якщо і ні — все одно цілком доступний.
Давайте на прикладі високо конкурентного ринку веб-картографії подивимося, як нерозуміння важливості володіння ключовими даними може погіршити конкурентоспроможність. Першою на ринку веб-карт була Mapquest в 1995 році, за нею прийшла Yahoo!, потім — Microsoft, а недавно до них приєднався і Google, — при цьому всі компанії, ліцензують у постачальників інформації, по суті, одні і ті ж дані.
Візьмемо протилежний приклад: Amazon. Спочатку його БД була побудована на регістрі коду ISBN від R.r.bowker. Бази конкурентів, відповідно, не мали істотних відмінностей. Але на відміну від Mapquest, Amazon без втоми доповнював дані, додаючи інформацію, надану видавцем, — обкладинки, зміст і навіть фрагменти з книг. Що важливіше, Amazon привернув користувачів для написання анотацій, і тепер саме Amazon — а зовсім не Bowker — є головним джерелом бібліографічної інформації для філологів і бібліотекарів, не кажучи вже про простих смертних. Також в Amazon був розроблений унікальний ідентифікатор ASIN, покриття якого ширше, ніж у ISBN.
В загальному, Amazon наздогнав і перегнав своїх постачальників інформації.
Уявіть, що так само поступила б Mapquest: привернула б користувачів до анотування карт та маршрутів і навіть до створення нових інформаційних шарів. Боротися з такою компанією конкурентам, у яких в наявності тільки оригінальні дані, що ліцензіюють, було б куди важче.
Власне цим зараз займається Google. Google Maps — це експеримент по створенню конкуренції між постачальниками даних і розробниками додатків. Спрощена модель програмування від Google привела до появи безлічі додаткових сервісів, які побудовані на поєднанні функціональності Google Maps з іншими даними, доступними в інтернеті. Так, наприклад, housingmaps.com дозволяє накладати на карти від Google рієлторські оголошення від Craigslist. На виході у нас виходить нове інтерактивне застосування, чудовий приклад змішування технологій.
У даний момент подібні гібриди в основному є іноваційними експериментами, долею хакерів. Але і підприємницька активність не за горами. Та вже можна бачити як мінімум один клас таких розробників — адже сам Google «відвів» роль джерела даних від Navteq, перетворивши себе на популярного посередника. У найближчі декілька років ми станемо свідками справжнісіньких битв між постачальниками даних і постачальниками додатків — коли обидві сторони усвідомлюють, що певна інформація може бути ключовою для побудови блоків додатків Веба 2.0.
За певні класи ключових даних — місцеположення, особисту інформацію про користувачів, календарі суспільно-значущих подій, ідентифікатори товарів і простору імен — битва вже розпочалася. Якщо відтворити набір інформації — задоволення не з дешевих, то компанія, у якої ці дані вже є, може спробувати скористатися своїм положенням і розіграти карту Intel Inside. У інших випадках переможе та фірма, чия база даних першою набере критичну масу за допомогою користувачів, — якщо, звичайно, компанія зможе обернути ці агреговані дані в системний сервіс.
До прикладу, якщо ми говоримо про мережеву ідентифікацію користувачів, то Paypal, Amazon, 1-click і мільйони користувачів систем зв'язку цілком можуть вважатися за суперників. (У цьому сенсі остання ініціатива Google, що дозволив підтверджувати акаунти на Google з телефону, виглядає як спроба розширити свою базу за рахунок телефонних систем.) З іншого боку, є такі стартапи, як Sxip, що зробили ставку на інтегровану особу і намагаються створити розподілене і просте рішення, на основі якого можна буде побудувати єдину підсистему для всього Веба 2.0. На ринку календарних довідників є EVDB, що намагається на базі wiki-подібної архітектури побудувати найбільший спільно наповнювальний календар. І хоча сьогодні ще рано робити прогнози, очевидно, що до появи додатків нового покоління приведуть ті стандарти і рішення, які дозволять ефективно обернути певні класи даних в надійні підсистеми «операційної системи інтернету».
Перш ніж йти далі, скажемо декілька слів про користувачів, які оберігають своє privacy і право на володіння інформацією як зіницю ока. У багатьох ранніх веб-додатках копірайт враховувався лише номінально. Так, права на всі перегляди, опубліковані на Amazon, належать Amazon, але компанія нікого ще не переслідувала за їх републікацію. Проте як тільки компанії зрозуміють, що контроль над даними і є їх головна конкурентна перевага, то почнуть стерегти свої дані куди відповідальніше.
Як успіх приватного софтвера привів до народження руху Free Software, так і посилення ролі приватних БД вже в наступному десятилітті приведе до народження руху за Вільну Інформацію. Ранні прояви цієї тенденції можна побачити вже зараз, в таких проектах, як Wikipedia, ліцензії Creative Commons, або в проектах програмістів типу Greasemo (дає користувачам можливість визначати, як саме відображатимуться дані на їх комп'ютерах).