- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2022.10.0
- Paquetes sin conexión 2022.10.2
- Paquetes sin conexión 2022.10.4
- Paquetes sin conexión 2022.10.6
- Paquetes sin conexión 2022.10.9
- Paquetes sin conexión 2022.10.10
- Paquetes sin conexión 2022.10.11
- Paquetes sin conexión 2022.10.12
- Paquetes sin conexión 2022.10.13
- Paquetes sin conexión 2022.10.14
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Extractor basado en regex
El extractor basado en expresiones regulares es la herramienta perfecta para casos de uso sencillos, en los que, para determinados campos, los datos se encuentran siempre en un formato y contexto estrictos y predecibles. En otras palabras, si tienes un campo para el que puedes definir una expresión regular que sea consistentemente buena cuando coincide, entonces el extractor basado en expresiones regulares es una buena opción.
La actividad viene con un asistente de configuración que te ayuda a definir las expresiones regulares para los campos a los que quieres dirigir la extracción de datos de esta manera.
La actividad admite tanto los campos simples como la extracción de campos de tabla.
Se recomienda buscar otros métodos de extracción, en caso de que haya una gran variabilidad del contexto y del formato de los valores esperados. En estos casos, puede ser más adecuado un extractor de formularios o un extractor de aprendizaje automático.
Este extractor no tiene capacidad de aprendizaje (entrenamiento) y requiere una configuración de antemano.
No hay requisitos especiales para usar el extractor basado en expresiones regulares.
El extractor basado en expresiones regulares tiene dos configuraciones principales a tener en cuenta:
- el asistente Configurar expresiones regulares, que permite definir expresiones regulares para determinados campos. Este asistente también pone a tu disposición el asistente del editor de expresiones regulares, que te ayuda a crear tus expresiones regulares.
- la configuración UsarAlineaciónVisual, que permite controlar si las expresiones regulares configuradas para un extractor deben aplicarse a la salida de texto del componente de digitalización, o a una versión de texto en la que las líneas de texto se organizan visualmente y las palabras se reordenan en líneas basadas en su alineación visual.
Puedes obtener más información sobre el Asistente para la configuración de expresiones regulares siguiendo este enlace.