- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Visión general de digitalización
- Actividades relacionadas con la digitalización
- Motores OCR
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Licencia
Guía del usuario de Document Understanding
Visión general de digitalización
La digitalización es el proceso de obtener texto legible por máquina de un archivo entrante determinado, de modo que un robot pueda comprender su contenido y actuar en consecuencia. Es el primer paso que se aplica a los archivos que deben procesarse a través del marco de Document UnderstandingTM .
El paso de digitalización tiene dos salidas:
- el texto del archivo procesado, almacenado en una variable de string, y
- el modelo de objeto de documento de ese archivo: objeto JSON que contiene información básica como el nombre, el tipo de contenido, la longitud del texto, el número de páginas, así como información detallada como la rotación de la página, el idioma detectado, el contenido y las coordenadas de cada palabra identificada en el archivo.
En el marco de procesamiento de documentos, la digitalización se realiza mediante la actividad Digitalizar documento.
Aunque esté relacionado, el paso de digitalización no es OCR.
En muchos casos, los archivos que hay que procesar son archivos PDF nativos (no escaneados), que el robot puede leer de forma programada sin aplicar el OCR.
La actividad Digitalizar documento requiere, como parte de su configuración, la selección de un motor de OCR para que, en caso de necesidad, se pueda utilizar; pero solo ejecuta el OCR en:
- archivos que sean imágenes
- los formatos de imágenes admitidos son .png, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp
- en los archivos TIFF de varias páginas, el OCR se aplica a cada página
- páginas en PDF que
- no exponen ningún contenido legible por máquina
- contienen imágenes que cubren un área significativa de la página.
- Hay un límite de tamaño de archivo de 160 MB.
- Hay un límite máximo de 500 páginas por documento.
El OCR también se aplica, siempre, si la actividad Digitalizar documento está configurada con el indicador ForzarAplicaciónOCR establecido como Verdadero. Esta opción suele recomendarse para casos de uso en los que un porcentaje significativo de archivos parece tener contenido nativo, pero el contenido leído de forma nativa no se corresponde con lo que un usuario puede ver en esos archivos.
Como cada caso de uso tiene sus propias particularidades, se recomienda encarecidamente probar todos los motores OCR disponibles con diferentes configuraciones para determinar cuál funciona mejor para tu proyecto. Otra recomendación es prestar especial atención a los argumentos del motor de OCR, como el perfil, la escala, el idioma, etc. (pueden variar de un motor a otro), de modo que se identifique la mejor configuración para cada caso de uso.