top of page

"Veliki Podaci" - Veliki Problemi

  • Writer: Jevđenije Đokić
    Jevđenije Đokić
  • Jun 4, 2022
  • 7 min read


Tehnologija koja vam može dati sve što poželite, istovremeno je tehnologija koja vam može oduzeti sve što imate - Den Gir, stručnjak za informacionu bezbednost


Naše tehnološke moći rastu, ali sporedni efekti i moguće opasnosti takođe su u porastu - Alvin Tofler, sociolog i futurolog


U svetu informacionokomunikacionih tehnologija, s vremena na vreme, pojave se popularni termini (buzzwords) o kojima svi pričaju. Sada su to Veliki podaci (Big Data). Upotreba velikoga početnog slova u terminu Veliki podaci (što nije u skladu sa pravopisom srpskog jezika ) ima za cilj da istakne razliku u odnosu na ’obične’ velike skupove podataka. Pridev 'Veliki' se odnosi na velike mogućnosti koje ovi podaci donose.


Iako se termin Veliki podaci često sreće, mnogi nisu potpuno sigurni šta on zapravo znači, što se može reći čak i za neke stručnjake iz oblasti informacionih tehnologija. Kao i za mnoge druge pojmove, ne postoji jedna, usaglašena, matematički precizna definicija. Pored velike količine podataka, ovde su bitne inovativne forme analize postojećih podataka i generisanja novih znanja.


Iz konkretnije, tehničke perspektive, Veliki podaci imaju tri osnovne karakteristike (poznate kao 3V):


Obim (Volume): velika količina podataka, posebno sakupljenih i uskladištenih. Obim podataka prvenstveno određuje njihovu vrednost i potencijale. Da bismo imali Velike podatke, obim mora biti zaista ogroman (izražen u terabajtovima i petabajtovima).


Raznovrsnost (Variety): različita priroda podataka, kao i način kako su strukturisani. Veliki podaci mogu da se sakupe iz tekstova, slika, audio i video zapisa (a fuzija podataka može upotpuniti delove koji nedostaju). Mogu biti strukturisani, polustrukturisani ili nestrukturisani. Podaci se mogu dobiti iz mnogo različitih izvora: od Interneta i društvenih mreža, preko kućnih uređaja, do GPS tehnologije pametnih telefona.


Brzina (Velocity): vreme potrebno za generisanje i dostupnost podataka za analizu. Podaci moraju da cirkulišu brzo i što je moguće bliže realnom vremenu jer tek onda mogu doneti konkurentsku prednost u poslovnom okruženju.


Uređaji za prikupljanje, skladištenje i obradu podataka postaju sve jeftiniji i brži, a takođe se i računarska snaga za rukovanje ovim podacima stalno povećava. Nastavlja se čovekovo nastojanje da izmeri, zapiše i analizira svet u kojem živi.


Uveden je i novi termin datafikacija kojim se opisuje proces „uzimanja svih aspekata života i njihovo pretvaranja u podatke“. Na primer, Facebook datifikuje ponašanje korisnika na mreži, senzori pretvaraju u podatke sve osobine okoline, a pametni telefoni datifikuju lične komunikacije i kretanje. Ovo dovodi do situacije skoro sveprisutnog prikupljanja i dostupnosti podataka.


Moderne digitalne tehnologije su tako omogućile ’datafikaciju društva’, utičući na sve oblasti privrede i društva, pa i na svačiji svakodnevni život.



Kao i drugi društveno-tehnički fenomeni, Veliki podaci izazivaju i utopijska i distopijska razmišljanja i zaključke. S jedne strane, Veliki podaci se vide kao moćno sredstvo za rešavanje raznih društvenih i ekonomskih problema, nudeći nove i dublje uvide u različite oblasti kao što su inovativne prakse u privredi, poboljšavanje zdravstvene zaštite, borba protiv terorizma i dugoročni uticaj klimatskih promena. S druge strane, Veliki podaci pokazuju i zabrinjavajuće manifestacije Velikog brata - zadiranje u privatnost, smanjivanje građanskih sloboda i povećana državna i korporativna kontrola društva.


Da li će nam pretraživanja obimnih podataka pomoći da stvorimo bolje alate, usluge i javna dobra? Ili će to dovesti do novog talasa invazivnog marketinga i upada u privatnost? Hoće li nam analiza podataka pomoći da razumemo onlajn zajednice i političke pokrete, ili će se koristiti za praćenje demonstranata i suzbijanje slobode govora? Da li će to promeniti način na koji proučavamo ljudske komunikacije i kulturu, ili će pak suziti paletu istraživačkih opcija i možda čak promeniti šta istraživanje uopšte znači?


Došli smo do toga da živimo u svetu u kojem ogromne količine podataka i primenjena matematika zamenjuju svaki drugi alat koji bi mogao da se koristi. Mnogi predlažu da treba da se odbace sve teorije ljudskog ponašanja, od lingvistike do sociologije i da se zaborave taksonomija, ontologija i psihologija. Jer, ko uopšte može znati zašto ljudi rade to što rade? Poenta treba da bude na tome da oni to rade, a mi to možemo pratiti i meriti sa neviđenom preciznošću. Sa dovoljno podataka, brojke govore same za sebe.


Da li je to baš tako da brojke govore same za sebe? Prečesto, Veliki podaci omogućavaju pojavu apofenije: uočavanje veza u nasumičnim, nepovezanim ili besmislenim podacima. To uočavanje obrazaca koji zapravo ne postoje, jednostavno nastaje zato što ogromne količine podataka mogu ponuditi veze koje ’zrače’ u svim pravcima. U jednom čuvenom primeru pokazano je da tehnike rudarenja podataka mogu pokazati snažnu, ali lažnu korelaciju između promena berzanskog indeksa i proizvodnje putera u Bangladešu.



Veliki deo entuzijazma oko Velikih podataka potiče iz percepcije da nam nude lak pristup ogromnim količinama podataka. Ali ovde je ključno pitanje ko ima pristup? U koje svrhe i sa kakvim ograničenjima? Samo kompanije društvenih mreža imaju pristup zaista velikim količinama podataka o društvu. Sociolog koji radi za Fejsbuk ili za Gugl imaće pristup podacima bitnim za analizu novih društvenih fenomena u digitalnom okruženju, ali ostatak naučne zajednice ne.


Pored pitanja pristupa, ovde su bitna i pitanja novih digitalnih veština. Izdvajanje, sakupljanje, preformatiranje i analiziranje velikih količina podataka sa veb stranica zahteva znanja i veštine koje generalno imaju samo oni sa računarskim iskustvom. Kada su računarske veštine pozicionirane kao najvrednije, postavlja se pitanje ko je u prednosti, a ko je u nepovoljnom položaju u takvom kontekstu. Ovo, na svoj način, uspostavlja nove hijerarhije gde je glavni kriterijum ’ko ume da čita brojeve.’


Kad god su nejednakosti eksplicitno zapisane u osnove sistema, to proizvodi klasne strukture. Moglo bi se govoriti o tri klase ljudi u oblast Velikih podataka: oni koji kreiraju podatke (svesno i nesvesno ostavljajući digitalne tragove o svojim aktivnostima ), oni koji imaju sredstva da ih prikupe i oni koji imaju stručnost da ih analiziraju. Jasno je da je poslednja grupa najmanja i najprivilegovanija. Oni su takođe ti koji određuju pravila o tome kako će se podaci koristiti i ko može da učestvuje.


Mark Gudmen je šesto poglavlje svoje knjige Zločini budućnosti (Laguna, 2017) naslovio - Veliki skupovi podataka, veliki rizik, a jedan odeljak - Mračnija strana velikih skupova podataka.


„Ono što se pomalja kao posledica velikih skupova podataka mogao bi biti trajan nadzor, ukidanje privatnosti i nicanje kriminalnih pretnji kakve niko nikada ranije nije mogao ni da zamisli. Većina ljudi ne shvata da će svaki prikupljeni podatak neizostavno procuriti. Naši današnji kompjuterski sistemi previše su nesigurni da bi bezbedno skladištili velike količine informacija koje generišemo. Do danas, najveća pretnja po velike skupove podataka bila je njihova krađa i obelodanjivanje. Ali to je bio tek početak.


Kako se budemo kretali napred, nailazićemo na opasnosti koje će biti možda i pogibeljnije – neovlašćene izmene informacija na osnovu kojih svet obavlja svoje svakodnevne aktivnosti. Iako smo se strahovito pouzdali u podatke koje grozničavo gomilamo, sama tačnost tih informacija, kao što ćemo otkriti, lako se može poremetiti, sa značajnim posledicama po sve. Jer kao što zli akteri mogu da nam pokradu podatke, isto tako mogu i da ih izmene. Ta oluja koja se sprema ostaviće nas ranjive i uzdrmaće temelje naše vere u svet koji zavisi od podataka na načine koji još nisu do kraja dokučeni.“


Juval Harari u knjizi ‘Homo deus: : Kratka istorija sutrašnjice’ (Laguna, 2018) objašnjava da je nastala jedna nova religija - religija podatka, koju on naziva dataizam.


“Dataizam tvrdi da se svemir sastoji od protoka podataka i da je vrednost svakog fenomena ili entiteta određena njegovim doprinosom obradi podataka. Može vam se ovo učiniti kao neka egzotična marginalna ideja, ali ona je zapravo već osvojila većinu zvaničnih naučnih krugova.”


„Političarima, poslovnim ljudima i običnim potrošačima dataizam nudi revolucionarne nove tehnologije i ogromnunovu moć. Naučnicima i intelektualcima obećava da će pružiti sveti gral koji nam je izmicao vekovima – jedinstvenu i sveobuhvatnu teoriju koja objedinjuje sve naučne discipline, od muzikologije preko ekonomije pa do biologije. Prema dataizmu, Betovenova Peta simfonija, skok cena deonica i virus gripa samo su tri obrasca protoka podataka koji mogu biti analizirani pomoću istih osnovnih koncepata i alatki. Ova ideja je krajnje privlačna: pruža svim naučnicima zajednički jezik, gradi mostove preko akademskih provalija i s lakoćom izvozi nova saznanja preko međunaučnih granica. Konačno će muzikolozi, ekonomisti i biolozi moći međusobno da se razumeju.


Na tom putu dataizam izvrće tradicionalnu piramidu učenja. Dosad su podaci posmatrani kao tek prvi korak u dugom lancu intelektualnih aktivnosti. Od ljudskih bića se očekivalo da iz podataka destilišu informacije, iz informacija znanje, iz znanja mudrost. Dataisti, međutim, veruju da ljudi više ne mogu da se nose s ogromnim prilivom podataka, te otuda ne mogu iz njih da destilišu ni informacije, a kamoli znanje ili mudrost. Zato bi posao obrade podataka trebalo poveriti elektronskim algoritmima, čiji kapaciteti daleko prevazilaze kapacitete ljudskog mozga. U praksi ovo znači da su dataisti podozrivi prema ljudskom znanju i mudrosti i više vole da veruju u velike skupove podataka i kompjuterske algoritme.“


Harari upozorava da je ovo trenutno vladajuća naučna paradigma i da menja naš svet preko granica prepoznatljivosti. S dataističke tačke gledišta, i čitavu ljudsku vrstu mogli bismo protumačiti kao sistem za obradu podataka, čiji su čipovi pojedinačna ljudska bića. Ako to prihvatimo, onda i čitavu istoriju možemo da shvatimo kao proces poboljšavanja delotvornosti ovog sistema.



Ako je čovečanstvo zaista jedinstveni sistem za obradu podataka, kakve rezultate ta obrada pruža? Dataisti bi rekli da će rezultat biti stvaranje jednog novog i još svrsishodnijeg sistema, nazvanog internet svega. Kad ta misija bude ispunjena, homo sapijens će nestati.

“Ako dataizam uspe da osvoji svet, šta će se desiti s nama ljudskim bićima? U početku će dataizam verovatno ubrzati humanističku poteru za boljim zdravljem, više sreće i većom moći. Dataizam se i širi tako što obećava da će ispuniti ove humanističke težnje. Da bismo dosegli besmrtnost, blaženstvo i božanske moći, potrebno je da obradimo ogromne količine podataka, koje daleko prevazilaze kapacitete ljudskog mozga. Zato će to umesto nas uraditi algoritmi. Samo što bi, kada sav autoritet bude prešao s ljudi na algoritme, humanistički projekti mogli da postanu beznačajni.”


Šta će se desiti s društvom, politikom i svakodnevnim životom kada nas nesvesni, ali visokointeligentni algoritmi budu poznavali bolje nego što sami sebe poznajemo?


“Upinjemo se da konstruišemo ‘Internet svega’ u nadi da će nam on omogućiti da budemo zdravi, srećni i moćni, ali kada on bude stvoren i pušten u rad, ljudska bića bi mogla da budu svedena od njegovih konstruktora na čipove, zatim samo na podatke, a na kraju bismo mogli prosto da se rastočimo u bujici podataka kao grumen zemlje bačen u brzu rečnu maticu. Dataizam dakle preti da će s homo sapijensom uraditi isto što je homo sapijens uradio sa svim ostalim životinjama.”


Mark Gudmen, u ranije pomenutoj knjizi, ističe da će „svi ovi izazovi postati znatno teži kada se milijarde novih predmeta ’priključe’ na Internet, a umreženi kompjuteri u obliku robota počnu da se kreću fizičkim prostorom koji dele s nama, da ne pominjemo rizike od veštačke inteligencije i sintetičke biologije.“


Smatra da, u cilju jasnog sagledavanja posledica ovolikog sakupljanja i korišćenja podataka, „moramo izvršiti uticaj na polju obrazovanja, te je stoga potrebno da se medijska pismenost uvede u sistem obrazovanja od početka. Iako se danas postavlja pitanje na čijoj strani je sistem obrazovanja, i da li je on resurs u rukama elite koja se školuje kako bi izučila i unapredila sisteme koji odgovaraju moći kapitala, ipak je on deo procesa edukacije koji nam pruža mogućnost da shvatimo i razumemo u kom smeru se kreće tehnologija obrade informacija i da utičemo na moguće zloupotrebe i posledice takve vrste korišćenja informacija.“


Comments


Budite u toku!

Hvala!

© 2020 by Tajni Začin

bottom of page