Los datos de captura de datos pueden ser capturados manualmente por sistemas ECM desde: Los documentos en papel que puede o bien ser escaneados por sus imágenes, o para obtener más detalles esenciales dentro del contenido del documento que se transcribe en una entrada de datos electrónica formar documentos electrónicos de oficina, como correspondencia, hojas de cálculo, presentaciones, etc.
creado originalmente en formato electrónico Los correos electrónicos enviados o recibidos objetos multimedia como audio o contenido de vídeo, animación e interactividad Microfilm datos también se pueden organizar para ser capturado de forma automática desde EDI o XML documentos, aplicaciones ERP, y otras aplicaciones de línea de negocio como la contabilidad o CAD. Interfaces automatizadas se pueden construir con estas fuentes. Procesamiento de documentos escaneados preliminares y faxes digitales no son de texto legible.
Para convertirlos en caracteres legibles por máquina, se utilizan diferentes tecnologías de reconocimiento de caracteres. En la actualidad, estos incluyen: reconocimiento óptico de caracteres - OCR - utilizado para convertir imágenes de documentos mecanografiados en documentos de texto con caracteres legibles y editables de caracteres manuscritos Reconocimiento - HCR - se utiliza para convertir la escritura o las letras en caracteres de texto.
La tecnología aún no se ha perfeccionado reconocimiento óptico de marcas - OMR - utilizar para leer las marcas en las casillas de verificación y otros campos predefinidos en formularios, etc. códigos de barras estandarizados, lo que permite la extracción de información a través de los lectores de códigos de barras Tanto OCR y HCR han sido mejorados continuamente utilizando características de inteligencia artificial tales como listas de comparación, la lógica, y de referencia.
Técnicas de documentos-imágenes ayudan a mejorar la calidad de las imágenes escaneadas mediante la mejora de la legibilidad y el ajuste de las imágenes que han sido capturadas en un ángulo incómodo. ECM puede entender datos capturados a través de formas externas si el sistema de captura conoce la estructura