- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Licencia
Guía del usuario de Document Understanding
Información general
Hay varias formas de consumir las capacidades de Document UnderstandingTM :
- El paquete DocumentUnderstanding.Activities está disponible en Studio Web, Studio X y Studio Desktop y está preconfigurado para ti al crear una nueva automatización a partir de un archivo o si continúas tu viaje después de publicar una versión del proyecto.
- Uso del paquete IntelligentOCR, que está diseñado para proyectos Windows y Windows Legacy, y preconfigurado en la plantilla de proceso de Document Understanding.
- Uso de llamadas a la API en la nube, consumo de Document Understanding como servicio a través del lenguaje de programación de tu elección.
Si eres RPA developer, puedes utilizar DocumentUnderstanding.Activities en tus proyectos en la nube. El uso de Document Understanding te permite gestionar todos los datos sobre un documento dentro de un único objeto de entrada/salida, llamado Datos de documento. Además, las actividades de Document Understanding no requieren establecer la taxonomía de Tipos de documentos, por lo que puedes aprovechar fácilmente los modelos listos para usar.
Puedes configurar fácilmente una automatización utilizando algunas de las siguientes actividades, a través del Creador de automatización de extracción disponible en Document Understanding, Marketplace y Studio Web:
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
Ten en cuenta que las actividades de Document Understanding no admiten las siguientes capacidades, todavía: dividir, entrenar (ajuste de modelos), soporte de tenant de producción/desarrollador, soporte local y varios métodos de extracción por tipo de documento.
Si inicias nuevos proyectos de automatización que aprovechan proyectos modernos (creados utilizando la experiencia de aprendizaje activo), puedes utilizar DocumentUnderstanding.Activities.
Como RPA developer que desea probar el paquete IntelligentOCR, puedes utilizar diferentes modelos de extracción y clasificación en función de tus necesidades. Si un modelo no se ajusta a tus necesidades, puedes utilizar otros extractores o clasificadores como opción de copia de seguridad. También puedes modificar la taxonomía, el modelo de objetos de documento (DOM) y los resultados de extracción utilizando código RPA durante el runtime.
Sin embargo, se requiere una curva de aprendizaje más larga para utilizar IntelligentOCR, porque su flexibilidad implica complejidad, mientras se trabaja con varias actividades y tipos de datos.
Con IntelligentOCR, puedes integrar tu propio clasificador, extractor o motor OCR. Consulta Muestras de código de procesamiento de documentos para comprobar los ejemplos de implementación.
Puedes utilizar las llamadas a la API como alternativa al enfoque de automatización de procesos robóticos (RPA). Las llamadas a las API permiten recuperar información detallada sobre el proyecto, incluidos los extractores y clasificadores utilizados, facilitar el uso de las API de digitalización, clasificar y extraer datos de documentos utilizando modelos especializados y generativos, y validar la información digitalizada, clasificada y extraída previamente.
Para consumir las API, puedes utilizar cualquier lenguaje de programación/scripting (ya que las llamadas se realizan utilizando HTTP), incluido RPA.
Puedes acceder a las API a través de Swagger: en la barra de herramientas del servicio Document Understanding, busca en la lista desplegable de API REST y selecciona Marco.