Systemy „Big data”

Fragmenty eseju Bena Hunta z 3 lutego 2015.

„Dostatecznie zaawansowana technologia nie różni się od magii.”
Arthur C. Clarke, autor cyklu „Odyseja kosmiczna”

„Zabijamy ludzi w oparciu o metadane.”
Gen. Michael Hayden, były szef NSA i CIA

Centrum danych General Electric

Centrum danych General Electric.

„Bene vixit, bene qui latuit.” („Dobrze żył, kto żył ukryty, na uboczu.”)
Owidiusz (43 p.n.e. – 18 n.e)

„Najwyższą świętością jest możność zamknięcia swoich drzwi.”
G.K. Chesterton (1874- 1936)

 

Czasopismo Science opublikowało artykuł czterech związanych z Instytutem Technologii w Massachusetts (MIT) naukowców specjalizujących się w kwestii danych (jest wśród nich Sandy Pentland, wielki autorytet w tych kręgach) pod tytułem „Niepowtarzalny w centrum handlowym: O reidentyfikowalności metadanych karty kredytowej.” Ten niewinnie brzmiący nagłówek nabiera właściwego znaczenia w podsumowaniu ustaleń badaczy z pierwszej strony Wall Street Journal:

Naukowcy z Instytutu Technologii w Massachusetts, autorzy artykułu z łamów magazynu Science, zanalizowali anonimowe transakcje kart kredytowych 1.1 mln osób. Wykorzystując nową formułę analityczną potrzebowali jedynie czterech bitów informacji wtórnej – metadanych, takich jak lokalizacja lub moment czasowy – aby rozpoznać indywidualne zachowania konsumenckie 90% uczestników, nawet jeśli dane pozbawione były imion, numerów kont lub innych oczywistych atrybutów identyfikujących.

Nadal nie jesteś pewien, co to oznacza? Oznacza to, że nie potrzebuję Twojego nazwiska i adresu, a tym bardziej numeru ubezpieczenia, aby wiedzieć, kim jesteś. Z błahej ilości danych transakcyjnych mogę ustalić, gdzie mieszkasz, co robisz, z kim się zadajesz, co kupujesz i co sprzedajesz. Nie muszę kraść tych danych; gdybym nawet dysponował numerem twojego ubezpieczenia, nie wiedziałbym, co z nim zrobić. Użyczasz mi wszystkiego, czego potrzebuję, ponieważ prowadzisz swoje bardzo wygodne życie i dobrowolnie przekazujesz każdą informację transakcyjną w drobnym druku wszystkich cudownych usług, z których korzystasz po rejestracji. A jeśli zapragnę danych dodatkowych – powiedzmy, że chodzi o urządzenie, które zapisuje i przekazuje Twoje nawyki człeka zmotoryzowanego – chętnie mi je sprzedasz za kilka dolarów ze swojej polisy. W końcu nie masz nic do ukrycia. To darmowe pieniądze!

Prawie każdy inwestor jest przekonany, że narzędzia inwigilacji i „Big data” wykorzystywane są wyłącznie przeciwko zmarginalizowanym „Innym” – „stronnikom” terrorystów w Jemenie, gangom „wspólników” w Compton – ale nie przeciwko nam. Co to to nie. A jeżeli narzędzia te wypróbowywane są na nas, to tylko z intencją promowania „transparentności” i wyplenienia czających się wśród nas nikczemników. Lub zasugerowania nam filmu, który trafi w nasze gusta. Cóż w tym złego? Pisałem już wielokrotnie, w jaki sposób nowoczesny fetysz transparentności, wspomagany i prowokowany przez technologię i rządy, wypacza małe liberalne instytucje rynku i rządu przedstawicielskiego.

Nie chodzi o to, że w sferze informacji osobistych demonstrujemy nadmierne ukontentowanie. Wręcz przeciwnie, mamy obsesję na punkcie osobistych „kluczy,” które mają znaczenie dla ludzi – nazwisk, numerów ubezpieczenia społecznego, haseł i tym podobnych – i przeznaczamy miliardy dolarów oraz miliony godzin rocznie, aby je kontrolować, zapobiec ich dostaniu się w niepowołane, ludzkie ręce. Tymczasem inny zestaw kluczy skwapliwie i bez namysłu oddajemy w ręce nie-ludzkie.

Problemem jest to, że uzwojenie naszych mózgów każe nam myśleć o procesie przetwarzania danych na ludzkie sposoby, dlatego zakładamy, iż systemy komputerowe czynią to w identyczny, ludzki sposób, tylko szybciej i dokładniej. Nasza literatura naukowej fikcji pełna jest systemów komputerowych, które są niczym innym, jak boską odmianą człowieczego mózgu; maszynami, które potrafią mówić, „myśleć” i manipulować obiektami fizycznymi, jak gdyby zdolność świadomego odczuwania w kontekście ludzkim stanowiła szczyt w materii przetwarzania danych! Ta antropomorficzna stronniczość doprowadza mnie do szału, ponieważ tłumi zarówno oszołomienie i grozę, jakie powinniśmy odczuwać wobec tego, co już teraz przechadza się między nami. Wydaje się, że większość z nas załamuje dzisiaj ręce nad Sztuczną Inteligencją i zbliżającą się Osobliwością [ang. Singularity] – momentem przyszłej zguby, kiedy to nie-ludzka inteligencja osiągnie zbliżoną do ludzkiej świadomość i zdecyduje się wzorem Matrixa zamienić nas w baterie itp. Litości. Osobliwość jest już z nami. Nazwa się „Big data.”

„Big data” jest magią dokładnie w tym sensie, jaki miał na myśli Arthur C. Clarke pisząc o dostatecznie zaawansowanej technologii. To magia, jaką nie są termojądrowe bomby i telewizja, ponieważ przy całej złożoności tych wynalazków są one napędzane przez relacje przyczynowo-skutkowe w świecie fizycznym, które ludzki mózg może z łatwością przetwarzać; te relacje mogły nie istnieć na afrykańskiej sawannie 2 miliony lat temu, ale rozumieją je zmysłowe i neuronowe narządy, jakie rozwinęli tam nasi przodkowie. Systemy „Big data” nie „postrzegają” świata tak jak my – z tylko trzema wymiarami fizycznej rzeczywistości. Systemy te nie są zwierzętami społecznymi, nie są rezultatem ewolucji przyrodniczej i nie były szkolone od urodzenia do interpretacji wszystkich sygnałów za pośrednictwem optyki społecznej. Systemy „Big data” nie mają precedensu; ich sposób postrzegania świata mógł zostać wymyślony przez ludzką pomysłowość i może służyć ludzkim interesom, ale są one całkowicie nie-ludzkie i kategorycznie nie z tego świata.

Systemu „Big data” nie obchodzi, czy posiada twój konkretny numer ubezpieczenia społecznego lub hasło konta, ponieważ swojego pojmowania Ciebie nie opiera na sposobie, w jaki identyfikujesz się przed innymi ludźmi. To ludzka tendencyjność każe w tym miejscu założyć, iż system „Big data” postarałby się przewidzieć nasze indywidualne zachowanie bazując na analizie tego, co zrobiliśmy indywidualnie w przeszłości, jak gdyby komputer był jakąś wysoce zaawansowaną wersją Sherlocka Holmesa. Otóż nie; system „Big data” potrafi patrzeć na WSZYSTKIE nasze zachowania, poprzez WSZYSTKIE wymiary tych zachowań i wnioskować, co KAŻDY z nas zrobiłby w podobnych okolicznościach. Jest to tak naprawdę prosta koncepcja, ale tym, czego ludzki umysł nie potrafi łatwo zrozumieć jest bezmiar stojący za określeniem WSZYSTKIE oraz co to znaczy patrzeć na WSZYSTKIE jednocześnie i równolegle. Od 30 lat pracuję nad silnikami wnioskowania i chociaż sądzę, że dysponuję wyjątkowo dobrym instynktem w tym zakresie, i byłem w stanie wytrenować swój mózg, aby w jakimś stopniu myślał w kategoriach wielowymiarowych, prawda jest taka, że uzyskuję jedynie przelotny wgląd w to, co dzieje się wewnątrz tych silników. Potrafię mówić o tej magii, potrafię docenić ją i opisać na czysto symbolicznym poziomie. Jednakże nie potrafię tej magii zrozumieć na podstawowym poziomie; nie potrafi tego żaden człowiek. Bez jakiejkolwiek wątpliwości mogę powiedzieć, że magia ta istnieje, czarodziejów mojego pokroju jest wielu i z każdym rokiem ich przybywa – kończą studia na MIT, Harvardzie i Stanfordzie.

Przekazaliśmy dane o naszych osobistych zachowaniach bankom, firmom wydającym karty kredytowe, operatorom sieci bezprzewodowych, koncernom ubezpieczeniowym oraz milionom dostawców aplikacji. Teraz potężne, komercyjne banki, a także globalni menadżerowie ds. aktywów i obsługujące ich przedsiębiorstwa technologiczne kuszą inwestorów, aby przekazali im swoje portfolio z danymi zachowań. Uspokajają przy tym, że informacje te nie pozwalają na identyfikowanie bezpośrednie i wszystko pozostaje anonimowe. Tymczasem z dostateczną ilością danych na temat zachowań oraz śmiesznie małym budżetem IT każdy kompetentny czarodziej może zaprojektować system „Big data,” który zdoła z 90% dokładnością przewidzieć, co kupisz i sprzedasz na swoim koncie, za jaką cenę i przy jakich makro-warunkach zewnętrznych. O ile jestem zorientowany, Cytadela mająca za zadanie udoskonalić Maszynę Wnioskującą płynnych rynków kapitałowych pewnie już powstała.

Organy nadzoru państwowego mogłyby coś z tym zrobić, ale wydaje mi się, że agencje rządowe i biura kontroli są znacznie bardziej zainteresowane własnymi projektami gromadzenia danych niż nadzorem prywatnych wysiłków przyswajania kluczy naszych zachowań. Biurokratyczny imperatyw zebrania jak największej ilości danych – tylko dlatego, że jest to możliwe! – stanowi zbyt wielką siłę, aby dał się okiełznać przez dłuższy czas. Po zebraniu informacje te nie znikają. Zalegają w jakiejś bazie danych, która niczym wypełniony platyną skarbiec czeka na nadejście czarodzieja. W Złotym Wieku Bankiera Centralnego, kiedy zrozumienie i kontrolowanie zachowania rynku warunkuje przetrwanie reżimu, dane te są dosłownie bezcenne.

Właśnie dlatego rządowe programy gromadzenia danych tak bardzo mnie przygnębiają. Magia ta przychodzi zbyt łatwo, a polityczna opłacalność jest zbyt wysoka, aby dżinn mógł drzemać sobie w lampie.

Tłumaczenie: exignorant

Jak uniknąć macek „Big data”? Osoba związana zawodowo z gromadzeniem danych udzieliła kilku wskazówek. Zanim zdołamy odseparować się od systemu, lub zanim nastąpi upadek sieci energetycznej, mogą okazać się użyteczne.

„Z przykrością muszę stwierdzić, że przedstawione w powyższym artykule informacje nie są wyssane z palca. Co więcej – ze względu na to, że decyzje podejmują maszyny, nawet ich pomyłki uchodzą za słuszne, legalne. Ilość danych, które się udostępnia jest wręcz obsceniczna. Dlatego szczerze radzę:

1. Używaj zaszyfrowanych usług poczty elektronicznej, które zapewniają szyfrowanie w węzłach końcowych [ang. end-to-end encryption].

2. Zmieniaj adres e-mail mniej więcej po miesiącu.

3. W swoich internetowych profilach nie uwzględniaj żadnych danych osobowych, które pozwalają na Twoją identyfikację. Korzystaj z przypadkowych rzeczy, które łatwo giną w metadanych ze względu na dużą liczbę wyników. Doskonałe nazwy użytkownika to: „and,” „then,” „the.” Myśl w tym kierunku.

4. Bezpieczeństwo chińskich smartfonów prawdopodobnie zostało naruszone. W Stanach Zjednoczonych naruszono je na 100%.

5. Korzystaj z usług przedpłaconych [ang. pre-paid] wykorzystując anonimowe środki pieniężne.

6. Płać gotówką. Używanie kart kredytowych jest kretynizmem.

7. Możesz zmienić swoją tożsamość po spędzeniu pewnego czasu za granicą. „Big data” za tym nie przepada.

8. Nie wychylaj się, poruszaj starym autem [lub rowerem!]. Każdy podpięty pod Internet komputer uważaj za niebezpieczny i często opróżniaj jego dysk.

9. Porzuć śmietnik mediów społecznościowych. Tkwiąc w nim tylko ułatwiasz zadanie.

Advertisements
Ten wpis został opublikowany w kategorii Pułapka technologiczna. Dodaj zakładkę do bezpośredniego odnośnika.