- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Proceso Document Understanding - Plantilla Studio
- Document Understanding
- Notas relacionadas
- About the Document Understanding activity package
- Compatibilidad de proyectos
- Datos del documento
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- About the IntelligentOCR activity package
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Mostrar Estación de Clasificación
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
About the IntelligentOCR activity package
UiPath.IntelligentOCR.Activities contains the infrastructure for enabling document processing flows using a complete, open, extensible approach.
Versión eliminada |
Versión recomendada |
---|---|
4.3.0 vista previa | 4.4.0 vista previa |
4.5.2 |
2.1.0 | 2.2.0 | 2.3.0 |
4.0.1 |
1.4.0 | 1.5.0 | 1.6.0 | 1.6.1 | 2.0.0 | 2.0.1 |
2.0.2 |
1.2.0 | 1.2.1 | 1.3.0 |
1.3.2 |
- Starting with the v6.19.0 release, when installing the UiPath.IntelligentOCR.Activities package in a project, the UiPath.DocumentUnderstanding.ML.Activities package is automatically installed as well and you do not need to install it separately.
- If you are using UiPath® Studio 2023.4.4 or earlier, make sure to install the latest version of Windows .NET 6.0 Desktop Runtime.
Updating the UiPath.IntelligentOCR.Activities also requires an update for the UiPath.UIAutomation.Activities package and for UiPath.OCR.Activities package if included in the project.
UiPath.IntelligentOCR.Activities and UiPath.DocumentUnderstanding.Activities should not be used together in the same project. The UiPath.IntelligentOCR.Activities package should be used for Windows (or Legacy) workflows, while the UiPath.DocumentUnderstanding.Activities package should be used for Cross-platform workflows.
This section shows the multiple functionalities of the Intelligent.OCR package.
Puede hacerlo utilizando la actividad Digitalizar documento . Esto recupera el texto de cualquier PDF o imagen, usando, solo si es necesario, el motor OCR de tu elección.
- A medida que los documentos se procesan uno por uno, pasan por el proceso de digitalización. La diferencia con los documentos no digitales (escaneados) es que debe aplicar el motor de OCR de su elección. Los resultados de este paso son el Modelo de objeto de documento y una variable de cadena que contiene todo el texto del documento y se transmiten a los siguientes pasos.
Puede hacerlo utilizando la actividad Clasificar documento . Esto permite identificar qué tipo de documento es un archivo utilizando cualquier algoritmo de clasificación.
Después de la digitalización, el documento se clasifica. Si trabajas con varios tipos de documentos en el mismo proyecto, para extraer los datos correctamente necesitarás saber con qué tipo de documento estás trabajando. Lo importante es que puede usar múltiples clasificadores en el mismo ámbito, puede configurar los clasificadores y, más adelante en el marco, entrenarlos. Los resultados de la clasificación ayudan a aplicar la estrategia correcta en la extracción.
The following list shows the available classifiers:
- La actividad Clasificador basado en palabras clave es el primer clasificador de este tipo y se dirige a la clasificación de documentos con título.
- La actividad Clasificador inteligente de palabras clave no solo puede clasificar, sino también "dividir" los archivos que contienen varios tipos de documentos.
- The Machine Learning Classifier activity can classify your files using a powerful ML Model, that can you can train according to your needs.
- The Generative Classifier activity allows you to classify documents using generative models.
Puede hacerlo mediante la actividad Attended estación de clasificación a la que se ha asistido, que presenta una interfaz de usuario específica de procesamiento de documentos para validar y corregir las salidas de clasificación automáticas.
- Especialmente para los casos en los que se requiere la división de archivos, se recomienda encarecidamente utilizar el paso de validación de la clasificación humana para garantizar que el procesamiento posterior para la extracción de datos funciona correctamente.
- Hay disponible una alternativa a la actividad Attended mediante el uso de flujos de trabajo de larga duración, diseñados para habilitar de forma óptima la colaboración humano-robot. Las actividades Crear Actionsde clasificación de documentos y Esperar las Actions de clasificación de documentos y Reanudar habilitan este escenario.
Puede hacerlo mediante la actividad Entrenar el ámbito de los clasificadores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de clasificación capaz de aprender. Arrastre y suelte sus entrenadores de clasificadores dentro de esta actividad de Ámbito y habilítelos usando el asistente Configurar clasificadores para asegurarse de que sus clasificadores utilicen la información validada por humanos a través de la Estación de clasificación o la Estación de validación para mejorar su propio rendimiento.
La clasificación es tan eficiente como los clasificadores utilizados. Si un documento no se ha clasificado correctamente, los clasificadores activos lo desconocen. El marco proporciona la oportunidad de entrenar a los clasificadores para mejorar el reconocimiento de las clases de documentos.
The following is a list of the available classifier trainers:
- El Entrenador del clasificador basado en palabras clave es la actividad de entrenamiento emparejada con el Clasificador basado en palabras clave.
- El Entrenador del clasificador inteligente de palabras clave habilita el bucle de retroalimentación para el Clasificador inteligente de palabras clave.
- The Machine Learning Classifier Trainer is the trainer activity paired with the Machine Learning Classifier.
Puede hacerlo mediante la actividad Ámbito de extracción de datos . Esto permite el uso de cualquier algoritmo de extracción de datos para identificar diferentes campos en un documento clasificado.
La extracción consiste en obtener solo los datos que le interesan de un tipo de documento determinado. Por ejemplo, extraer datos específicos de un documento de 5 páginas es bastante problemático si se quiere manipular cadenas. En este marco, puedes utilizar diferentes extractores, para las diferentes estructuras de documentos, en el mismo ámbito de extracción de datos. Los resultados de la extracción se pasan posteriormente para su validación.
The following is a list of available extractors:
- El extractor basado en RegEx es un extractor de datos básico que aplica coincidencias de expresiones regulares para identificar los mejores candidatos para un campo específico.
- El Extractor de formularios utiliza plantillas predefinidas para permitir el procesamiento de documentos con formularios estructurados y fijos.
- The Machine Learning Extractor leverages the power of AI and Machine Learning to identify information in structured or semi-structured documents by either using one of UiPath®'s public data extraction services or by calling custom trained Machine Learning models that you can build and host in AI Center. This activity is part of the UiPath.DocumentUnderstanding.ML.Activities package.
- The Generative Extractor allows you to extract documents using generative models. This activity is part of the UiPath.DocumentUnderstanding.ML.Activities package.
Puede hacerlo mediante la actividad Presentar estación de validación Attended , que presenta una interfaz de usuario específica de procesamiento de documentos para la validación y corrección de datos.
- Los datos extraídos pueden ser validados por un usuario humano a través de la Estación de Validación. Una práctica recomendada es crear una lógica en torno a la decisión de añadir o no un paso de validación humana, con reglas dependiendo del caso de uso específico que se vaya a implementar. Los resultados de la validación pueden exportarse y utilizarse en otras actividades de automatización.
- También puede habilitar la validación humana a través de flujos de trabajo de larga duración, optimizando la colaboración humano-robot. Las acciones Crear validación de documento y las Actions Actions a validación de documentos y reanudar
.
Puede hacerlo mediante la actividad Entrenar el ámbito de los extractores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de extracción de datos capaz de aprender. Arrastre y suelte los entrenadores de extractores dentro de esta actividad de Ámbito y habilítelos usando el asistente Configurar extractores para asegurarse de que sus extractores utilicen la información validada por humanos a través de la Estación de validación para mejorar su propio rendimiento.
- La extracción es eficiente como lo son los extractores. Si los valores de campo no se extrajeron correctamente, significa que los extractores activos los desconocían. El marco proporciona la oportunidad de entrenar a los extractores para mejorar el reconocimiento de los valores de campo.
- El Entrenador de extractor con aprendizaje automático cierra el bucle de retroalimentación para la extracción de datos basada en ML, al recopilar los datos necesarios para reentrenar un modelo de aprendizaje automático alojado en AI Center. Esta actividad es complementaria del Extractor con aprendizaje automático y forma parte del paquete UiPath.DocumentUnderstanding.ML.Activities .
Puede hacerlo utilizando la actividad Exportar resultados de extracción . Esto le permite exportar la estructura compleja de los datos extraídos a un DataSet simple (colección de DataTables).
- Una vez que tenga su información validada, puede usarla tal como está o guardarla en un formato de tabla de datos que se puede convertir muy fácilmente en un archivo de Excel.
El paquete UiPath.IntelligentOCR.Activities es compatible con cualquier actividad de extracción de datos o clasificación personalizada que se crea en función del paquete público UiPath.DocumentProcessing.Contracts . Ofrece total flexibilidad para crear tu propio algoritmo específico para tu caso de uso, así como integrarlo con cualquier solución de terceros para la clasificación de documentos y la extracción de datos.
Las siguientes versiones del paquete se han eliminado de la transmisión oficial. Si tiene algún problema, póngase en contacto con nuestros equipos de soporte.
- Importante
- Version compatibility
- Supported formats
- Support for C# project language
- Funcionalidades
- Digitalizar documentos
- Clasificar documentos
- Validar la clasificación automática
- Entrenar a los clasificadores
- Extraer datos de documentos
- Validar los resultados de la extracción automática de datos
- Extractores de trenes
- Exportar la información extraída