Antiikin Kreikan väärinymmärretyn sankarin Narkissoksen elämän jyrkkä alamäki alkoi jumalallisesta juonesta, jossa hänet juonittiin vilkaisemaan lammen pintaa. Tarinasta voidaan esittää monenlaisia tulkintoja, mutta pohjimmiltaan Narkissoksen elämän tuhosi liika tieto ja epätoivo, joka tiedosta syntyi.
Vastaus on yksiselitteisesti IT-maailman seuraava hype: data lake. Vakiintunutta suomennosta termille ei ole, mutta käytän tässä blogikirjoituksessa sanaa tietojärvi.
Tietojärvi kuvaa mallia, jossa tieto elää elastisesti ja määrittelemättömästi. Veden lailla tieto virtaa puroina ja jokina järveen, jossa se sekoittuu mutta samalla myös säilyy. EMC:n historia tiedon vartijana antaa aiheeseen hyvinkin luontaisen lähestymiskulman.
Lampeen katsomisen ei tässä tapauksessa kuitenkaan johda Narkissoksen tapaan synkkään itsetutkisteluun ja oman hengen riistämiseen, vaan toimii katalyyttina oleellisen tiedon syntyyn. Kun kaikkea tietojärven aineistoa päästään yhdistelemään ja käsittelemään, olemassa olevasta tiedosta voidaan jalostaa lisäarvoa.
Vaikka keskeinen kaupallinen lupaus on tiedon lisäämä ymmärrys omasta toiminnasta ja siitä tiedosta, jonka yritys omistaa, tiedon tallennuksella on myös toinen ulottuvuus. Tietojärven käsite sisältää vihjeen kaiken tiedon potentiaalisesta arvosta. Tiedon implisiittinen arvo taas muodostaa sillan tiedon tallentamisen ”ihan vain varmuuden vuoksi”.
Tiedon tallennustilan tulee siis olla halpaa ja sen hallinnolliset kustannukset on voitava minimoida. Mikäli tiedon tallentaminen on kalliimpaa kuin siitä saatava hyöty tai näköpiirissä oleva tiedon hyödyntämistarve, ei perusteita tallennuskustannusten lineaariseen kasvattamiseen ole.
Magneettisen tallennuksen ajan suurimpiä syntisiä ovat olleet tilan tuhlaajat. Ne kiittämättömät riiviöt, jotka säilövät tarpeetonta tietoa.
On hieman arveluttavaa nimetä tämä tuhlaajajoukko ison tiedon edelläkävijöiksi, mutta tiedon tallennuksen tulevaisuus on lähempänä jäsentelemätöntä tilan tuhlausta kuin kirjastovirkailijan tarkkuutta tiedon määrittämisessä, hallinnassa ja tallennuksessa.
En yritä väittää, että Deweyn desimaaliluokittelun osaajat kuuluvat menneisyyteen. Päinvastoin, luokiteltu tieto on jatkossakin minulle arvokkain yksittäinen tiedon muoto. Valitettavasti sen osuus tulee vähenemään promilleluokkaan kaikesta tallennetusta tiedosta. Haluankin todeta, että tietojärvi on ennen kaikkea strategia, prosessimalli ja elämäntapa.
On, jos niin haluat.
Kun sanon tietojärven olevan ennen kaikkea strategia, haluan korostaa, että tiedon tallentaminen ilman käyttötarkoitusta on yhtä järkevää kuin vieraskielisten kirjojen haaliminen aikomatta opetella kieltä (ellei satu omistamaan antikvariaattia).
Tietojärven rakentaminen on syytä aloittaa kartoittamalla miten tietoa voidaan käyttää. Onko yrityksessä ison tiedon hankkeita, jotka voivat hyödyntää kerättyä tietoa? Onko järjestelemättömän tiedon kerääminen järkevää tulevaisuuden kannalta? Onko yrityksellä tietostrategia?
Narkissoksen kohtaloksi koitui tieto omasta kauneudesta. Samoin hyväkin tietojärvihanke voi kaatua, jos sitä tehdään vain sen mediaseksikkyyden takia.
Helposti.
Isilon-tuoteperheen tallennusratkaisut muodostavat hyvän pohjan tietojärven perustamiselle. Isilonien hallittavuus, liityntäpinnat tiedon hyödyntämiseen ja kustannusrakenne tekevät niistä loistavan ratkaisun aloitukseen.
Dell EMC:ltä löytyy kuitenkin vieläkin merkittävämpi apu ensimmäiseen kysymykseen: Miten tietoa hyödynnetään? Kehotan tutustumaan Pivotalin ja Dell EMC:n tarjotaan tai ottamaan rohkeasti yhteyttä tiedon hyödyntämisen ja tallentamisen osalta.
Iikka Salmi