o serwisie | redakcja | reklama | kontakt
szukaj w serwisie
Spis treści

Indeks działów

29 czerwca 2013
Ernest Frankowski
 

Odrobina praktyki

Powiedzieliśmy powyżej sporo o potencjalnym zastosowaniu operacji na wielkich zbiorach danych. W tym momencie czytelnik zorientowany w technologiach IT znajdujących zastosowanie w biznesie powinien słusznie zwrócić uwagę, że wszystko to brzmi znajomo i że w biznesie od dawna funkcjonuje pod nazwą Business Intelligence (BI). Software'owymi przedstawicielami BI są choćby tzw. hurtownie danych. Są one niezastąpione w przejmowaniu danych z systemów ewidencyjnych, procesowaniu ich w oparciu o ideał wielowymiarowej kostki informacji i prezentowaniu pożądanych zestawień w formie konfigurowalnych co do treści i formatu raportów. Nie bez powodu zatem hurtowanie danych działają w dużych i bardzo dużych przedsiębiorstwach, a w swojej ofercie mają tego typu oprogramowanie najważniejsi i najwięksi dostawcy programów i pakietów ERP (Enterprise Resources Planning).

Tym niemniej, jest jednak subtelna różnica między BI a rozwiązaniami Big Data. Mianowicie, inny jest typ danych, na których operują narzędzia Big Data i BI, sposób ich pozyskiwania oraz efekt przetwarzania tych danych. Idąc po kolei, dane pozyskiwane z narzędzi BI są bardzo szczegółowe w zakresie przenoszonych informacji oraz bardzo konkretne (ustrukturyzowane). Jeśli zatem do BI przesyłamy dane finansowe z księgi głównej przedsiębiorstwa, wiadomo jakich informacji można się tam mniej-więcej spodziewać. Można się także spodziewać, że będą to informacje o wysokim współczynniku tzw. "cukru w cukrze" (czyli informacji w danych) oraz wysoce wyspecjalizowane (dane jednodziedzinowe – np. w zakresie HR, finansów, kontrolingowe, produkcyjne). A contrario, dane wprowadzane do narzędzi Big Data będą danymi o niższym stopniu upakowania informacją, mniej strukturalne i często wielodyscyplinowe.

Jeśli chodzi o różnice w sposobie pozyskiwania danych do Big Data i BI, to dane przetwarzane w systemach BI do systemu źródłowego są wprowadzane w sposób celowy, ujednolicony i proceduralny (co do zasady). Z kolei dane będące Big Data będą danymi z systemów rozproszonych oraz z systemów, gdzie są one gromadzone w pewnym sensie przypadkowo, często przy okazji realizacji zadań o innym charakterze niż późniejsze analizy tych danych.

Ostatnia główna różnica dotyczy efektów przetwarzania obu typów danych. Wobec „konkretności” danych będących wsadem do BI, są one idealne do podsumowań zarządczych ukierunkowanych na identyfikację trendów (czyli w kierunku przeszłości). Z kolei dane kwalifikowane jako Big Data co do zasady (biorąc pod uwagę ich skalę oraz sposób pozyskania) powinny umożliwić zamodelowanie pewnych zdarzeń lub trendów przyszłych (przewidywanych).

Ta ostatnia różnica poniekąd odpowiada również na pytanie, dlaczego Big Data są uznawane za NWR branży IT. Podmiot, który opanuje technologię prognozowania w oparciu o wielkie zbiory danych pozostawianych np. w sieci przez użytkowników serwisów społecznościowych, gier, usług lokalizacyjnych, serwisów aukcyjnych w pewnym sensie „zdobędzie panowanie nad światem” (do pewnego stopnia sztukę tę opanował Google). No, przynajmniej do momentu znalezienia kolejnej NWR.

Innym, bardziej szlachetnym przykładem zastosowania Big Data jest nauka. Choćby Wielki Zderzacz Hadronów (LHC – Large Hadron Collider) w Laboratoriach CERN pod Genewą. W tunelach ośrodka CERN ma miejsce nawet 600 milionów kolizji cząstek elementarnych na sekundę. Dane wynikające stąd do analizy są liczne w peta i eksabajtach (petabajt: PB - 1015; eksabajt: EB - 1018).

Inne ciekawe przykłady to analiza zachowań użytkowników wyszukiwarki Google. W 2010 r. niejaki Tobias Preis przeanalizował zapytania kierowane do Google przez użytkowników z 45 krajów. Opracowany został na tej podstawie tzw. „future orientation index”. Im większa jego wartość, tym większy procent zapytań o przyszłość w danym kraju kierowanych przez użytkowników do wyszukiwarki Google. Co ciekawe, autorzy analizy odkryli zależność między wzrostem PKB a wartością indeksu. W praktyce, im więcej pytań nakierowanych na przyszłość, tym bardziej rośnie PKB danego kraju.

Kolejny przykład pozwala snuć tylko domysły, ale ilość danych przetwarzanych potencjalnie przez agencję NSA (choćby w oparciu o ostatnią dyskutowaną aferę ze szpiegowaniem własnych obywateli) wskazuje, że przetwarzanie Big Data służba ta powinna mieć opanowane w wysokim stopniu.

Podkreśleniem znaczenia Big Data dla współczesnego świata jest inicjatywa obecnej administracji USA, która w 2012 ogłosiła tzw. Big Data Research and Development Initiative. Deklaracja związana z tą inicjatywą określa Big Data jako wyzwanie i nadzieję dla nauki i ekonomii. Cele zostały przed programem postawione bardzo ambitne. Od opracowania algorytmów wykluczających korki uliczne w wielkich metropoliach aż po znalezienie lekarstwa na raka.

Wielkie słowa i wielkie nadzieje. Być może za wielkie, dlatego Big Data, jak każdy wielki koncept NWR, doczekał się licznych głosów krytyki. Nadmierna wiara w wielkie zbiory danych została zakwestionowana przez wybitnych przedstawicieli środowisk biznesowych, naukowych i medycznych. Jest kilka elementów wspólnych w argumentach krytyków Big Data. Mianowicie, najczęściej podnoszą oni, że prawidłowości zidentyfikowane na poziomie makro nie zawsze muszą mieć przełożenie na procesy na poziomie mikro. Ponadto, pozostaje problem wyboru odpowiedniej próby danych do analizy (jakby to paradoksalnie przy Big Data nie brzmiało) oraz fakt, że spostrzeżenia co do przyszłości będą się sprawdzały tylko o tyle o ile przeszłość do tej przyszłości będzie podobna. A to może nigdy nie mieć miejsca na takim poziomie, aby informatyczna projekcja przyszłości w oparciu o dowolną próbę danych miała jakikolwiek sens.

A zatem, czy Big Data to ślepa uliczka, albo też kolejna moda technologiczno-biznesowa, która w czystej postaci nigdy nie znajdzie zastosowania? Akurat w tym przypadku dość łatwo udzielić sensownej odpowiedzi. Mimo wszelkich zastrzeżeń, Big Data są już naszą codziennością. Wystarczy powiedzieć, że określenie to zostało użyte po raz pierwszy w 2009 r. Od tego czasu zrobiło autentyczną karierę przechodząc drogę od idei, poprzez poszukiwanie użycia w celach komercyjnych i społecznych, aż po powstanie odpowiednich technologii i praktyczne implementacje. To, co obserwujemy jako kłopoty z wykorzystaniem praktycznym idei Big Data, jest kłopotem pojedynczych firm, które mają problem z wykorzystaniem akurat swoich wielkich zbiorów danych (z różnych powodów zresztą, od technicznych po prawne). Przy czym nie o wielkość tych danych chodzi, ale ich wspomnianą niestrukturalność.


Następna strona »


Zobacz komentarze do artykułu / 0
Wersja do druku

Przeczytaj również...

Zaloguj się, by dodać komentarz. Nie masz konta? Zarejestruj się.

Login
Hasło
Zarejestruj się
Zapomniałem hasła
  Ostatnio komentowane
  Ostatnio na forum
więcej »
strona główna | o serwisie | redakcja | reklama | kontakt