- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Extraer datos del documento
UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>
Extrae datos de un archivo de entrada o de un objeto Datos de documento, y almacena los resultados en un objeto Datos de documento.
Requisitos previos
La actividad Extraer Datos del Documento requiere objetos de entrada de tipo Datos de documento o Archivo.Un posible caso de uso para utilizar esta actividad es precederla con una actividad Clasificar documento, que genera un objeto de tipo Datos de documento.
Opciones de entrada
- Datos del documento: de la actividad Clasificar documento
- Archivo: desde las actividades Obtener archivo/carpeta u Obtener correo electrónico más reciente
Idiomas compatibles para modelos generativos
Los idiomas compatibles para los modelos generativos son los mismos que el motor OCR utilizado, que depende del proyecto. Para los proyectos predefinidos, el motor OCR utilizado es UiPath Document OCR. Para obtener más información, consulta la página Idiomas compatibles con OCR.
Modelos utilizados por la actividad
La actividad Extraer datos del documento utiliza lo siguiente:- Puntos finales públicos para modelos listos para usar.
- Modelos ML personalizados implementados en proyectos de la aplicación Document Understanding.
- Modelo de extracción generativa.
Panel del Diseñador
- Entrada: requiere que especifiques el archivo en sí o los datos del documento, en caso de que hayas utilizado otras actividades de Document Understanding antes en tu flujo de trabajo (por ejemplo, Clasificar documento).
Importante: el número máximo de páginas que puede tener un archivo es 500. Los archivos que superan este límite no pueden extraer.
- Proyecto: requiere que selecciones tu proyecto de Document Understanding en la lista desplegable. Las opciones disponibles son:
- Predefinido : tipo de proyecto clásico que utiliza modelos especializados preentrenados recomendados para escenarios estándar.
- Proyectos existentes del tenant y la carpeta a la que está conectado.
- Puedes crear un proyecto personalizado yendo a Document Understanding.
Para obtener más información, consulta Introducción a la creación de modelos.
Nota: Si has creado más de 500 proyectos en tu tenant y utilizas la actividad Extraer Datos del Documento, UiPath Studio o Studio Web no mostrará ningún proyecto más allá de los 500 iniciales.Por lo tanto, esos proyectos no se pueden utilizar.
- Extractor : después de seleccionar un proyecto, también puedes seleccionar un extractor que quieras utilizar.
- Para el proyecto predefinido, tienes dos opciones:
- Selecciona un paquete ML. Consulta Modelos listos para usar para obtener una lista de modelos preentrenados que puedes utilizar.
Nota: La actividad Extraer datos del documento anula el tipo de documento con el extractor seleccionado. Esto no es aplicable a los modelos generativos.
- Selecciona el extractor generativo.
Nota: la información enviada al extractor generativo va a una instancia de modelo LLM. Esta instancia no está disponible públicamente, no almacena los datos enviados y no los utiliza para fines de entrenamiento.Importante:
Esta característica forma parte actualmente de un proceso de auditoría y no debe considerarse parte de la autorización de FedRAMP hasta que finalice la revisión. Consulta aquí la lista completa de características actualmente en revisión.
- Selecciona un paquete ML. Consulta Modelos listos para usar para obtener una lista de modelos preentrenados que puedes utilizar.
- Para el proyecto predefinido, tienes dos opciones:
- Solicitud : este campo aparece si eliges la opción Generativo. Solicitud para identificar los campos que se extraerán, proporcionados como pares clave-valor, donde la clave representa el nombre del campo y el valor una descripción del mismo, ayudando al extractor a identificar el valor correspondiente. Selecciona el campo y obtendrás un mensaje con las siguientes opciones, proporcionadas en pares:
- Nombre del campo: requiere que introduzcas el nombre del campo que se extraerá (Ej. Fecha de vencimiento) (límite de 30 caracteres)
- Solicitud generativa : requiere que proporciones la solicitud como entrada para el extractor generativo. El número máximo de caracteres permitidos es 1000. La respuesta, resultado de la extracción, también llamada Finalización, tiene un límite de 700 palabras. Está limitado a 700 palabras. Esto significa que no puedes extraer más de 700 palabras de una sola solicitud. Si tus requisitos de extracción superan este límite, puedes dividir el documento en varias páginas, procesarlas individualmente y luego combinar los resultados.
Consejo: Para conocer las buenas prácticas sobre cómo utilizar las solicitudes generativas, consulta la página Extractor generativo - Buenas prácticas . - Versión (vista previa): utiliza esta propiedad cuando utilices un proyecto moderno de Document Understanding existente. Selecciona la etiqueta que corresponde a la versión del proyecto desde la que quieres procesar los datos. Por ejemplo, si eliges la etiqueta Producción asignada a la Versión 3, la actividad procesa los datos de la Versión 3 de tu proyecto en el entorno de producción.
El valor predeterminado para Versión es Staging. Si la etiqueta Staging no existe en tu proyecto seleccionado, el valor predeterminado es Production.
Para obtener más información sobre las versiones, consulta Publicar modelos.
- Tipo de documento (vista previa): cuando eliges una etiqueta del campo Versión , la actividad selecciona automáticamente el primer tipo de documento implementado de la versión relevante de tu proyecto elegido. Además, la actividad muestra los campos de extracción relacionados con el tipo de documento elegido.
Panel de propiedades
Entrada
- Tiempo de espera (segundos) : tiempo máximo de ejecución (en segundos) para la llamada al modelo generativo. Si la operación supera este tiempo de espera, se finaliza automáticamente para evitar retrasos o bloqueos. Esta propiedad solo se muestra si el Extractor generativo está seleccionado como extractor.
- Validación automática : utiliza esta opción para habilitar la validación automática, una capacidad que ayuda a validar los resultados obtenidos para la extracción de datos frente a un modelo generativo. El valor predeterminado para el campo Validación automática es
False
.- Umbral de confianza : este campo se vuelve visible una vez que habilitas la Validación automática. Los resultados de extracción que caen por debajo del umbral se comparan con el modelo de extracción generativa. Si coinciden, el sistema ajusta la confianza de extracción para alcanzar el valor del umbral. Los valores de umbral posibles van de 0 a 100.
Si el valor se establece en 0, no se aplica ninguna validación. Sin embargo, si estableces un valor específico (de 0 a 100), el sistema comprueba todos los resultados de extracción por debajo de este valor. Por ejemplo, si estableces un umbral de confianza del 80 %, el sistema aplicará la validación generativa a los campos con una confianza inferior al 80 %.
Nota: La validación automática solo está disponible para modelos de extracción especializados.
- Umbral de confianza : este campo se vuelve visible una vez que habilitas la Validación automática. Los resultados de extracción que caen por debajo del umbral se comparan con el modelo de extracción generativa. Si coinciden, el sistema ajusta la confianza de extracción para alcanzar el valor del umbral. Los valores de umbral posibles van de 0 a 100.
- Generar tipo de datos: si se establece en
True
, indica que la salida debe generarse en función del extractor seleccionado, dando como resultado un objetoIDocumentData<ExtractorType>
.Como alternativa, si se establece enFalse
, indica que la generación de datos debe omitirse, dando como resultado un objetoIDocumentData<DictionaryData>
genérico.Visita Datos de documento para obtener más detalles y limitaciones disponibles para los dos tipos de objetos.
Salida
- Datos del documento : todos los datos de campo extraídos del archivo. La información también se puede recibir desde Clasificar documento.
Visita Datos de documentos para saber cómo funcionan los datos de documentos y cómo consumir los resultados extraídos para campos de valor único y multivalor.
Para empezar rápidamente con las capacidades generativas de la actividad Extraer datos del documento, realiza los siguientes pasos:
- Añade una actividad Extraer datos del documento .
- En la lista desplegable Proyecto , selecciona Predefinido.
- Para Extractor, selecciona Extractor generativo.
La propiedad Solicitud aparece en el cuerpo de la actividad.
- En el campo Solicitud , proporciona tus instrucciones como pares clave-valor de diccionario, donde:
- La clave representa el nombre del campo (ejemplo: dirección de correo electrónico).
- El valor representa la solicitud generativa: la descripción utilizada por el extractor generativo para identificar el valor correspondiente.
Por ejemplo, consulta la siguiente tabla para ver una muestra de pares clave-valor:
Tabla 1. Ejemplos de pares clave-valor para el mensaje del extractor generativo Nombre del campo Solicitud generativa Nombre "¿Cuál es el nombre del candidato?" Trabajo actual "¿Cuál es el trabajo actual del candidato?" Empleador "¿Cuál es el empleador actual del candidato?" Figura 1. Solicitud de pares de clave-valor para el extractor generativo