Az interneten hatalmas mennyiségű információ áll rendelkezésre. Mennyisége pedig villámgyorsan növekszik. Átlagosan percenként több mint 200 millió e-mail mozog az interneten (bár a legtöbb spam). A Twitter felhasználók több mint 300 000 új tweetet tesznek közzé. Az emberek világszerte több mint 38 000 Instagram posztot osztanak meg. A YouTube-felhasználók további 100 órányi videót töltenek fel. A Google több mint 3,6 millió webkeresést dolgoz fel. A Facebookon pedig több mint 2,2 millió dolog kap „lájkot” vagy megjegyzést.
De nem az internet az egyetlen számokkal vezérelt környezet, amely tele van információkkal. A tudósok is több információval rendelkeznek, mint valaha. A nyers tények, az úgynevezett adatok mennyiségének tanulmányozásából származik.
Például a biológusok óriási mennyiségű mérést gyűjtenek több millió sejten és mindazon belül. A csillagászok megtöltik a merevlemez-bankokat csillagokkal, galaxisokkal és energiával az űrben. A földtudósok részletes pillanatképeket állítanak össze az időjárásról, beleértve a szelek és hullámok mintáit szerte a világon.
Az IBM számítástechnikai vállalat szerint az összes rögzített adat 90 százaléka az elmúlt két évben jött létre. Ezen adatok nagy része számítógép merevlemezén, telefonján és más digitális eszközön tárolódik. Mi a helyzet a hagyományos könyvtárakkal? A Big Data szerint az olyan források, mint a könyvek és a hangkazetták az összes tárolt információ kevesebb mint két százalékát tartalmazzák. Ez Viktor Mayer-Schönbergerand és Kenneth Cukier 2013-as könyve.
Ha ezek a számok nem zavarják meg az elmédet, akkor fontold meg ezt: Egy internetes kutatócég becslése szerint háromévente a digitális adatok mennyisége majdnem megkétszereződik. Ez azt jelenti, hogy az emberek várhatóan annyi új adatot fognak előállítani 2014 januárja és 2016 decembere között, mint ma.
„A kihívás az, hogy ezeket az adatokat átvegyük és hasznos termékké alakítsuk” – mondja DJ Patil. Tudós a kaliforniai Palo Altóban, aki olyan cégek adatkezelésén dolgozott, mint a LinkedIn, egy professzionális hálózati webhely.
Az online adatok nemcsak korunk rekordját kínálják. A kutatók számítógépes programokat építenek az adatok elemzésére, rendszerezésére és feldolgozására. Ezután a statisztikusok mintákat és összefüggéseket keresnek ezekben az adatokban, hogy előrejelezzék a jövőt.