La mayoría de las empresas a identificar todos los datos como sea estructurada o no estructurada. Así como el nombre lo indica, los beneficios de datos estructurados sean estructuradas y preparadas para consultas rápidas a través de mirada relativamente simple para las técnicas. Los datos no estructurados no ha construido en el marco (aunque puede ser "poco estructurada") ya menudo contradice los esfuerzos para generar la apariencia sencilla para los motores buscan. Datos estructurados se da a la investigación simple ventaja de su empresa y la información homogénea.
Por ejemplo muchas hojas de cálculo Excel y todos los directorios relacionales, ya que ambos encuentran nuevamente por tipo y puede por lo tanto rápidamente la información a la persona existente. Todos los detalles son proporcionales entre sí y relacionales técnicas de control de origen de datos (RDBMS) se han mejorado para respuesta consultas individuales en los detalles. Los datos no estructurados contiene poco o ningún marco familiar, por lo general debido a las características divergentes de los detalles.
La comunidad empresarial reporta que el 80% de todos los datos útiles empresa establece en un estado no estructurada. Un e-mail es un ejemplo. Si bien la información a veces se estructuró dentro de una fuente de datos, los artículos reales del concepto no es. Es posible organizar un coordinador de información por envío de correo, datos, etc., pero no es posible llevar a cabo una consulta sobre sus artículos. Todos los datos no estructurados pueden clasificarse ya sea como cosas de mapa de bits o cosas textuales.
Cosas de mapa de bits implican todos los datos no se centraron en la terminología como el vídeo, el sonido y las imágenes, mientras que las cosas textuales son de acuerdo a la terminología publicada generalmente se encuentran en los archivos de datos concepto de marca e información, entre otros. Para ser razonables, la frase "los datos no estructurados" pueden ser algo de un nombre inapropiado, ya que gran parte de ella en realidad puede ser similar a "los datos semi-estructurada" que sin embargo no funciona rápidamente con un RDBMS.
El obstáculo de la exploración de datos no estructurados establece tanto en su potencial para el tamaño y el déficit del marco familiar. RDBMS no puede ya existente los detalles en cualquier tipo significativo, por lo que la necesidad de hacer los datos no estructurados útiles llevaron a sistemas como Hadoop y Cloudera. "Big Data" y los datos no