document-understanding
2023.4
false
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 18 de dic. de 2024

Extractor basado en regex

Qué es el extractor basado en expresión regular

El extractor basado en expresiones regulares es la herramienta perfecta para casos de uso sencillos, en los que, para determinados campos, los datos se encuentran siempre en un formato y contexto estrictos y predecibles. En otras palabras, si tienes un campo para el que puedes definir una expresión regular que sea consistentemente buena cuando coincide, entonces el extractor basado en expresiones regulares es una buena opción.

La actividad viene con un asistente de configuración que te ayuda a definir las expresiones regulares para los campos a los que quieres dirigir la extracción de datos de esta manera.

La actividad admite tanto los campos simples como la extracción de campos de tabla.

Se recomienda buscar otros métodos de extracción, en caso de que haya una gran variabilidad del contexto y del formato de los valores esperados. En estos casos, puede ser más adecuado un extractor de formularios o un extractor de aprendizaje automático.

Este extractor no tiene capacidad de aprendizaje (entrenamiento) y requiere una configuración de antemano.

Requisitos especiales

No hay requisitos especiales para usar el extractor basado en expresiones regulares.

Cómo configurarlo

Activity configuration

El extractor basado en expresiones regulares tiene dos configuraciones principales a tener en cuenta:

  • el asistente Configurar expresiones regulares, que permite definir expresiones regulares para determinados campos. Este asistente también pone a tu disposición el asistente del editor de expresiones regulares, que te ayuda a crear tus expresiones regulares.
  • la configuración UsarAlineaciónVisual, que permite controlar si las expresiones regulares configuradas para un extractor deben aplicarse a la salida de texto del componente de digitalización, o a una versión de texto en la que las líneas de texto se organizan visualmente y las palabras se reordenan en líneas basadas en su alineación visual.

Más información

Puedes obtener más información sobre el Asistente para la configuración de expresiones regulares siguiendo este enlace.

  • Qué es el extractor basado en expresión regular
  • Requisitos especiales
  • Cómo configurarlo
  • Activity configuration
  • Más información

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.