- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
UiPath.IntelligentOCR.Activities contiene la infraestructura para habilitar los flujos de procesamiento de documentos utilizando un enfoque completo, abierto y extensible.
Al instalar el paquete UiPath.IntelligentOCR.Activities , el paquete UiPath.DocumentUnderstanding.ML.Activities se instala automáticamente para realizar la clasificación y extracción basadas en ML.
Limitación conocida
Si utilizas actividades de tipo "Esperar" que suspenden los flujos de trabajo y trabajas con variables DataTable , es crucial que las variables DataTable sean serializables. Por ejemplo, si una variable DataTable se inicializa con new System.Data.DataTable, entonces se vuelve no serializable, y esto puede hacer que la ejecución de tu proyecto falle. Para evitarlo, puedes: dejar vacío el valor predeterminado de la variable DataTable , o asignar un nombre a la variable DataTable , como: new System.Data.DataTable("MyTable").
Reemplazar versiones eliminadas
La siguiente tabla muestra las versiones del paquete que se eliminaron y la versión recomendada que se utilizará, en su lugar.
Tabla 1. Las versiones eliminadas y sus reemplazos recomendados
| Versión recomendada | |
|---|---|
| 4.3.0-vista previa | 4.4.0-vista previa |
| 2.1.0 | 2.2.0 |
| 1.4.0 | 1.5.0 |
| 1.2.0 | 1.2.1 |
Importante
- A partir de la versión v6.19.0 , al instalar el paquete UiPath.IntelligentOCR.Activities en un proyecto, el paquete UiPath.DocumentUnderstanding.ML.Activities también se instala automáticamente y no es necesario instalarlo por separado.
- Si utilizas UiPath® Studio 2023.4.4 o anterior, asegúrate de instalar la versión más reciente de Windows. NET 6.0 Desktop Runtime.
Compatibilidad de versiones
Actualizar UiPath.IntelligentOCR.Activities también requiere una actualización para el paquete UiPath.UIAutomation.Activities y para el paquete UiPath.OCR.Activities si se incluye en el proyecto.
UiPath.IntelligentOCR.Activities y UiPath.DocumentUnderstanding.Activities no deben utilizarse juntos en el mismo proyecto. El paquete UiPath.IntelligentOCR.Activities debe utilizarse para los flujos de trabajo de Windows (o heredados), mientras que el paquete UiPath.DocumentUnderstanding.Activities debe utilizarse para los flujos de trabajo multiplataforma.
Antes de utilizar la función Supervisar, ten en cuenta lo siguiente:
- Solo UiPath.DocumentUnderstanding.Activities v 2.7.0 o versiones más recientes es compatible con Monitor;
- Solo IntelligentOCR.Activities v6.20 o versiones más recientes incluyen la actividad Extractor de proyectos de Document Understanding que admite Monitor
Formatos compatibles
El paquete de actividades de IntelligentOCR puede admitir cualquiera de los siguientes tipos de archivos: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp y .pdf.
Compatibilidad con el lenguaje de proyecto C#
A partir de la versión 4.10.0, este paquete de actividades está validado para su uso en proyectos C #.
Funcionalidades
Esta sección muestra las múltiples funcionalidades del paquete Intelligent.OCR.
Digitalizar documentos
Puedes lograrlo utilizando la actividad Digitalizar documento . Esto recupera el texto de cualquier PDF o imagen, utilizando, solo si es necesario, el motor OCR de tu elección.
A medida que los documentos se procesan uno por uno, pasan por el proceso de digitalización. La diferencia con los documentos no digitales (escaneados) es que debe aplicar el motor de OCR de su elección. Los resultados de este paso son el Modelo de objeto de documento y una variable de cadena que contiene todo el texto del documento y se transmiten a los siguientes pasos.
Clasificar documentos
Puedes lograrlo utilizando la actividad Clasificar documento . Esto permite identificar qué tipo de documento es un archivo utilizando cualquier algoritmo de clasificación.
Después de la digitalización, el documento se clasifica. Si trabajas con varios tipos de documentos en el mismo proyecto, para extraer los datos correctamente necesitarás saber con qué tipo de documento estás trabajando. Lo importante es que puede usar múltiples clasificadores en el mismo ámbito, puede configurar los clasificadores y, más adelante en el marco, entrenarlos. Los resultados de la clasificación ayudan a aplicar la estrategia correcta en la extracción.
La siguiente lista muestra los clasificadores disponibles:
- La actividad Clasificador basado en palabras clave es el primer clasificador de este tipo, dirigido a la clasificación de documentos titulados.
- La actividad Clasificador inteligente de palabras clave no solo puede clasificar, sino también "dividir" los archivos que contienen varios tipos de documentos en su interior.
- La actividad Clasificador de Aprendizaje Automático puede clasificar tus archivos utilizando un potente Modelo de Aprendizaje Automático (ML), que puedes entrenar según tus necesidades.
- La actividad Clasificador generativo te permite clasificar documentos utilizando modelos generativos.
Validar la clasificación automática
Puedes lograrlo utilizando la actividad atendida Presentar estación de clasificación , que presenta una interfaz de usuario específica de procesamiento de documentos para validar y corregir las salidas de clasificación automáticas.
Especialmente para los casos en los que se requiere la división de archivos, se recomienda encarecidamente utilizar el paso de validación de la clasificación humana para garantizar que el procesamiento posterior para la extracción de datos funciona correctamente.
Una alternativa a la actividad attended está disponible mediante el uso de flujos de trabajo de larga duración, que están diseñados para habilitar de forma óptima la colaboración humano-robot. Las actividades Crear acción de clasificación de documentos y Esperar la acción de clasificación de documentos y reanudar habilitan este escenario.
Entrenar a los clasificadores
Puedes lograrlo utilizando la actividad Entrenar el alcance de los clasificadores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de clasificación capaz de aprender. Arrastra y suelta tus entrenadores de clasificadores dentro de esta actividad de Ámbito y habilítalos utilizando el asistente Configurar clasificadores para asegurarte de que tus clasificadores utilizan la información validada por humanos a través de la Estación de clasificación o la Estación de validación para mejorar su propio rendimiento.
La clasificación es tan eficiente como los clasificadores utilizados. Si un documento no se ha clasificado correctamente, los clasificadores activos lo desconocen. El marco proporciona la oportunidad de entrenar a los clasificadores para mejorar el reconocimiento de las clases de documentos.
La siguiente es una lista de los entrenadores de clasificadores disponibles:
- El Entrenador del clasificador basado en palabras clave es la actividad de entrenamiento emparejada con el Clasificador basado en palabras clave.
- El Entrenador del clasificador inteligente de palabras clave habilita el bucle de retroalimentación para el Clasificador inteligente de palabras clave.
- El Entrenador del clasificador de aprendizaje automático es la actividad de entrenamiento emparejada con el Clasificador de aprendizaje automático.
Extraer datos de documentos
Puedes lograrlo utilizando la actividad Ámbito de extracción de datos . Esto permite el uso de cualquier algoritmo de extracción de datos para identificar diferentes campos en un documento clasificado.
La extracción consiste en obtener solo los datos que le interesan de un tipo de documento determinado. Por ejemplo, extraer datos específicos de un documento de 5 páginas es bastante problemático si se quiere manipular cadenas. En este marco, puedes utilizar diferentes extractores, para las diferentes estructuras de documentos, en el mismo ámbito de extracción de datos. Los resultados de la extracción se pasan posteriormente para su validación.
La siguiente es una lista de extractores disponibles:
- El extractor basado en RegEx es un extractor de datos básico que aplica la coincidencia de expresiones regulares para identificar los mejores candidatos para un campo específico.
- El Extractor de formularios utiliza plantillas predefinidas para permitir el procesamiento de documentos estructurados y de formulario fijo.
- El extractor de aprendizaje automático aprovecha el poder de la IA y el aprendizaje automático para identificar información en documentos estructurados o semiestructurados utilizando uno de los servicios públicos de extracción de datos de UiPath® o llamando a modelos de aprendizaje automático entrenados personalizados que puedes crear y alojar en AI Center.
- El Extractor generativo te permite extraer documentos utilizando modelos generativos.
Validar los resultados de la extracción automática de datos
Puedes lograrlo utilizando la actividad atendida Presentar estación de validación , que presenta una interfaz de usuario específica de procesamiento de documentos para la validación y corrección de datos.
- The extracted data can be validated by a human user through the Validation Station. A best practice is to build logic around the decision of adding or not a human validation step, with rules depending on the specific use case to be implemented. Validation results can then be exported and used in further automation activities.
- También puedes habilitar la validación humana a través de flujos de trabajo de larga duración, optimizando la colaboración humano-robot, utilizando las actividades Crear acción de validación de documentos y Esperar a la acción de validación de documentos y reanudar.
Extractores de trenes
Puedes lograrlo utilizando la actividad Entrenar el ámbito de los extractores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de extracción de datos capaz de aprender. Arrastra y suelta tus entrenadores de extractores dentro de esta actividad de Ámbito y habilítalos utilizando el asistente Configurar extractores para asegurarte de que tus extractores utilizan la información validada por humanos a través de la Estación de validación para mejorar su propio rendimiento.
La extracción es eficiente como lo son los extractores. Si los valores de campo no se extrajeron correctamente, significa que los extractores activos los desconocían. El marco proporciona la oportunidad de entrenar a los extractores para mejorar el reconocimiento de los valores de campo.
El Entrenador de extractor con aprendizaje automático cierra el bucle de retroalimentación para la extracción de datos basada en ML, recopilando los datos necesarios para reentrenar un modelo de aprendizaje automático alojado en AI Center. Esta actividad es la compañera de la actividad Extractor con aprendizaje automático .
Exportar la información extraída
Puedes lograrlo utilizando la actividad Exportar resultados de extracción . Esto te permite exportar la estructura compleja de los datos extraídos a un DataSet simple (colección de TablasDeDatos).
Una vez que tenga su información validada, puede usarla tal como está o guardarla en un formato de tabla de datos que se puede convertir muy fácilmente en un archivo de Excel.
El paquete UiPath.IntelligentOCR.Activities es compatible con cualquier actividad de clasificación personalizada o extracción de datos que se cree en función del paquete público UiPath.DocumentProcessing.Contracts . Ofrece total flexibilidad para crear tu propio algoritmo específico para tu caso de uso, además de integrarlo con cualquier solución de terceros para la clasificación de documentos y la extracción de datos.
Las siguientes versiones del paquete se han eliminado de la transmisión oficial. Si tiene algún problema, póngase en contacto con nuestros equipos de soporte.
- Limitación conocida
- Reemplazar versiones eliminadas
- Importante
- Compatibilidad de versiones
- Formatos compatibles
- Compatibilidad con el lenguaje de proyecto C#
- Funcionalidades
- Digitalizar documentos
- Clasificar documentos
- Validar la clasificación automática
- Entrenar a los clasificadores
- Extraer datos de documentos
- Validar los resultados de la extracción automática de datos
- Extractores de trenes
- Exportar la información extraída