Other escaneadas de limpieza incluyen:
Estas y otras herramientas de limpieza se puede automatizar mediante la especificación mínima y /o tamaños máximos de los elementos para ser eliminados.
Las principales tareas de procesamiento de imágenes
En el caso de documentos de texto, imágenes de documentos produce imágenes que los humanos pueden leer, pero las máquinas no pueden. Para hacer estos documentos de búsqueda mediante el uso de las palabras escritas, los caracteres de texto sobre las imágenes tienen que ser convertidos en una conversión format.This legibles por máquina se realiza mediante tecnologías como OCR (reconocimiento óptico de caracteres) e ICR (reconocimiento inteligente de caracteres).
Incluso los caracteres impresos a mano pueden ser reconocidos en cierta medida por estos technologies.This tipo de conversión también se necesita para el propósito de hacer las imágenes de los documentos editable.Once las imágenes de documentos de texto se han hecho legible por máquina, la siguiente, documento típica proceso de formación de imágenes es para indexarlos. Indexación hace que los documentos de búsqueda. La indexación de texto completo los hace buscar por cualquier palabra en la indexación document.
Full de texto ocupa un montón de espacio de almacenamiento y una alternativa es el índice por etiquetas y descripciones meta. Las etiquetas son palabras que tipifican el contenido del documento. Las descripciones dan breves resúmenes de la tramitación contenido.El de las imágenes de los documentos pueden ir aún más lejos. Sobre la base de las especificaciones programadas, los documentos se pueden clasif