Newsletter PTBRiO nr 103

Viktor Mayer-Schönberger, Kenneth Cukier, Big Data: a Revolution that will transform how we live, work, and think

Zwykła wizyta w internecie, nieróżniąca się znacząco od codziennych wizyt milionów innych internautów. Wchodzę na portal informacyjny, gdzie od razu atakują mnie reklamy mieszkań na sprzedaż. Nic dziwnego, przeglądałem ostatnio sporo stron dotyczących nieruchomości, co musiało zapamiętać Google. Chwilę później moje zdziwienie budzi oferta tabletów, która jest dopasowana nie do historii wyszukiwania, ale do treści moich ostatnich prywatnych maili. Potem loguję się na Amazon, żeby sprawdzić stan swojego zamówienia i jak zwykle od razu prezentowane jest mi kilka książek, rzeczywiście dopasowanych do moich zainteresowań. Wchodzę szybko na stronę banku, na której od razu napotykam ofertę ubezpieczenia turystycznego - nic dziwnego, w końcu kilka dni wcześniej zapłaciłem kartą w biurze podróży. Będąc na stronach banku, przy okazji zerkam na wartość posiadanych przeze mnie akcji, która w coraz większym stopniu zależy od handlu algorytmicznego, czyli transakcji dokonywanych przez komputery na podstawie automatycznych algorytmów. Na koniec jeszcze szybko piszę maila do znajomych (muszę jednak uważać z treścią, żeby za kilka lat nie okazało się, że przez klika głupich wiadomości będę miał problem z wjazdem do Stanów Zjednoczonych).

Powyższa historia pokazuje, w jak dużym stopniu zjawisko określane mianem big data wywiera wpływ na różne aspekty naszego życia w sposób od którego trudno uciec. To zjawisko jest jednak niezwykle ważne dla nas, badaczy, również z drugiego powodu - z pewnością wywiera i będzie wywierać bezpośredni wpływ na naszą branżę - pojawiają się nawet głosy, że analitycy big data zastąpią badaczy rynku. Tego gorącego w ostatnim latach tematu analizy wielkich zbiorów danych dotyczy właśnie książka Big Data: a Revolution that wil ltransform how we live, work, and think. Celem autorów, Viktora Mayer-Schönbergera, austriackiego prawnika i ekonomisty z Uniwersytetu Oksfordzkiego, oraz Kennetha Cukiera, redaktora danych z The Economist, nie było napisanie podręcznika wprowadzającego do zastosowań analiz big data, ale opis tego zjawiska w szerszym kontekście społeczno-ekonomicznym. W swojej książce starają się wytłumaczyć czytelnikowi, czym są big data oraz jaki mają i mogą mieć wpływ na funkcjonowanie społeczeństw. Na początku opisane są cztery główne zmiany w sposobach wykorzystywania i analizy danych związane z pojawieniem się big data. Pierwszą z tych zmian jest przejście od analizy danych z małych prób (small data) do analizy danych z całej populacji (podejście N=all). Drugą zmianą jest znaczne zmniejszenie uporządkowania i poprawności wykorzystywanych danych (messy data) w porównaniu z danymi uważnie zbieranymi do prób badawczych. Dwie powyższe zmiany powodują odejście od poszukiwania przyczyn na rzecz ograniczenia się do poszukiwania jedynie korelacji w danych. Czyli, jak podkreślają autorzy, big data jest od znajdywania odpowiedzi na pytanie "co?", a nie "dlaczego?" Czwartą z opisywanych zmian są procesy daneizacji (datafication), czyli zbieranie i przechowywanie danych o prawie wszystkim, jak np. o lokalizacji osoby czy o wibracjach silnika. W dalszej części książki autorzy wskazują na coraz większą wartość jaką zaczynają stanowić gromadzone dane oraz na wywoływane pojawieniem się big data zmiany w sposobie działania biznesu, rynku i społeczeństwa. W końcowych rozdziałach opisane zostały związane z big data ryzyka oraz zaproponowane zostały pomysły na ich ograniczenie. Całość napisana jest bardzo prostym i przystępnym językiem, zrozumiałym dla osób niezajmujących się na co dzień analizą danych. Lekturę ułatwiają również przejrzysta struktura książki, spójnie prowadzona narracja oraz, służące jako ilustracje przedstawianych tez, współczesne i historyczne przykłady zastosowań analizy danych.

Chociaż termin badania rynku pojawia się w książce jedynie cztery razy, a samym badaniom rynku nie jest poświęcony nawet jeden akapit, to jednak kilka z poruszonych w książce wątków jest kluczowych z punktu widzenia przyszłości branży badawczej. Pierwszym z takich wątków jest odchodzenie od uważnego zbierania danych na starannie dobranych, reprezentatywnych, małych próbach na rzecz automatycznie odkładanych, mniej dokładnych, nieuporządkowanych danych dotyczących całych populacji. Jeśli ten proces będzie zachodził dalej, to może prowadzić do spadku znaczenia badań ilościowych. Z drugiej strony szansą dla branży badawczej, często podkreślaną przez agencje i samych badaczy, jest ograniczenie rezultatów big data do odpowiedzi na pytanie "co?" W takim kontekście badania rynku miałyby odpowiadać na pytanie "dlaczego?". Pozostaje jednak wątpliwość, czy w biznesie będzie zapotrzebowanie na kosztowne i czasochłonne poznawanie przyczyn w sytuacji, w której identyfikacja korelacji może być wystarczająco dobra. Lektura tej książki nie dostarczy jednoznacznych odpowiedzi na te i inne, dotyczące badań rynku w kontekście rozwoju big data, pytania, ale z pewnością pomoże lepiej zrozumieć szanse i zagrożenia, z jakimi będzie musiała zmierzyć się branża badań rynku w najbliższej przyszłości. Podsumowując, mogę z czystym sumieniem polecić tę książkę. Z pewnością będzie ona stanowić ciekawą lekturę, zarówno z punktu widzenia badacza, jak i z punktu widzenia obywatela lub konsumenta. Zawiera bardzo dużo wiedzy, skłania do refleksji, ale ze względu na jasną strukturę, spójną narrację i przystępny język można ją czytać nawet jadąc do pracy autobusem czy metrem. Szkoda jedynie, że pomimo ukazania się książki w kilkunastu językach, wciąż brakuje polskiego tłumaczenia.

Łukasz Pyfel




Zapraszamy do zapoznania się z pozostałymi recenzjami