De meeste bedrijven te identificeren alle gegevens als ofwel gestructureerde of ongestructureerde. Net zoals de naam al aangeeft, gestructureerde gegevens profiteert van gestructureerd en opgezet voor snelle vragen via relatief eenvoudige look voor technieken. Ongestructureerde data heeft geen ingebouwde in kader (hoewel het kan zijn "losjes gestructureerde") en in tegenspraak vaak inspanningen om eenvoudig de look te genereren voor motoren zoeken. Gestructureerde gegevens geeft zich eenvoudig onderzoek door te profiteren van de onderneming en homogene informatie.
Zo veel Excel spreadsheets en al relationele directories, aangezien beide retrieveable type en kunnen dus snel bestaande informatie aan het individu. Alle details zijn in verhouding tot elkaar en relationele gegevensbron regeltechnieken (RDBMS) worden verbeterd om reactie individuele vragen over de details. Ongestructureerde data bevat weinig of geen bekende framework, meestal vanwege de uiteenlopende kenmerken van de gegevens. De corporate gemeenschap meldt dat 80% van alle nuttige bedrijfsgegevens sets in een ongestructureerde staat. Een e-mail geeft een voorbeeld.
Terwijl gegevens worden soms gestructureerd binnen een gegevensbron, de werkelijke voorwerpen van het begrip niet. Het is mogelijk om een coördinator informatie emailer, data, etc. te regelen, maar het is niet mogelijk om een vraag over hun artikelen voeren. Alle ongestructureerde gegevens kunnen worden ingedeeld als bitmap dingen of tekstuele dingen.
Bitmap dingen betrekken alle gegevens die niet in het midden van de terminologie zoals video, geluid en beelden, terwijl de tekstuele dingen volgens gepubliceerde terminologie over het algemeen vinden in begrip merk data bestanden en informatie, onder anderen. Om redelijk te zijn, de uitdrukking "ongestructureerde data" kan iets van een verkeerde benaming, omdat veel van het kan eigenlijk vergelijkbaar met "semi-gestructureerde data", dat echter niet snel met een RDBMS zijn.
Het obstakel van exploratie ongestructureerde data sets zowel in haar toekomstige voor de grootte en het tekort van bekende kader. RDBMSs kan niet bestaande de details in elke belangrijke soort, dus de wil om ongestructureerde data nuttig geleid tot systemen zoals Hadoop en Cloudera. "Big Data" en ongestructureerde gegevens zijn niet geassocieerd omstandigheden, maar Big Details is bijna altijd ongestructureerd.
Als een bedrijf zoals Google of Myspace heeft behoefte aan een manier om de individuele surfen