Een precieze definitie voor ‘Big data’ is er nog niet. Zoals je kunt vermoeden gaat het in ieder geval om ‘veel data’.

Wat is data?
Data zelf kun je omschrijven als een verzameling van informatie zoals getallen, tekst, video of audio. In de digitale wereld kun je deze informatie verzamelen. Bijvoorbeeld de verkoopcijfers van een online website, voorraad, reacties op een advertentie of financiën van een bedrijf. Deze data kun je analyseren en gebruiken voor bijvoorbeeld marketingdoeleinden of strategische keuzes binnen de organisatie.

Wat is veel?
Wanneer er heel veel data wordt verzameld spreek je vaak over ‘Big data’, maar wat is veel? Voor een klein bedrijf is ‘veel’ heel anders dan een groot internationaal bedrijf. Je kunt van veel uitgaan wanneer de traditionele datatechnologie de hoeveelheid niet meer goed kan verwerken.

De vijf v’s
Je kunt de vijf v’s gebruiken om big data te omschrijven:

  • Volume: De hoeveelheid data is enorm groot (zettabytes of brontobytes). Er zijn geavanceerde datasystemen nodig om de data te kunnen analyseren.
  • Velocity: De snelheid van het genereren van de data. De data speelt in op trends, gps of is real-time. De snelheid van het verwerken is hierbij van groot belang om er gebruik van te kunnen maken.
  • Variety: De data komt uit veel verschillende soorten bronnen. Bijvoorbeeld social media berichten, afbeeldingen en video’s.
  • Value: Er zijn relaties en patronen ontdekt die gebruikt worden voor voorspellingen.
  • Veracity: De betrouwbaarheid van data. Enkel de waardevolle data wordt gebruikt en de fouten zijn eruit gehaald. Ondanks dat het om een grote hoeveelheid gaat draait het bij data om kwaliteit van de gegevens en niet om de kwantiteit.