- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Proceso Document Understanding - Plantilla Studio
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Datos del documento
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Mostrar Estación de Clasificación
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Extraer datos del documento
UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>
Extrae datos de un archivo de entrada o de un objeto Datos de documento, y almacena los resultados en un objeto Datos de documento.
La actividad Extraer datos del documento requiere una actividad que la preceda y que pueda proporcionar un objeto Datos del documento (producido como salida por otras actividades de Document Understanding, por ejemplo, Clasificar documento).
- Datos del documento: de la actividad Clasificar documento
- Archivo: desde las actividades Obtener archivo/carpeta u Obtener correo electrónico más reciente
Los idiomas admitidos para los modelos generativos son los mismos que los del motor OCR utilizado, que depende del proyecto. Para proyectos predefinidos , el motor OCR utilizado es UiPath Document OCR. Para obtener más información, consulta la página Idiomas compatibles con OCR .
Compatibilidad del proyecto: multiplataforma
Propiedades
- Proyecto: requiere que selecciones tu proyecto de Document Understanding en el menú desplegable. Las opciones disponibles son:
- Predefinido: el proyecto predeterminado
- Puedes crear un proyecto personalizado yendo a Document Understanding.
- Extractor: requiere que selecciones el extractor del proyecto seleccionado. Para el proyecto predefinido, las opciones disponibles son:
- Cualquiera de los paquetes ML encontrados aquíNota: La actividad Extraer datos del documento anula el tipo de documento con el extractor seleccionado. Esto no es aplicable a los modelos generativos.
- Generativo
- Cualquiera de los paquetes ML encontrados aquí
- Solicitud: este campo aparece si eliges la opción Generativo. Solicitud para identificar los campos que se van a extraer, proporcionada como pares clave-valor, donde la clave representa el nombre del campo y el valor una descripción del mismo, lo que ayuda al extractor a identificar el valor correspondiente.Haz clic en el campo y obtendrás una solicitud con las siguientes opciones, proporcionadas en pares:
- Nombre del campo: requiere que introduzcas el nombre del campo que se extraerá (Ej. Fecha de vencimiento) (límite de 30 caracteres)
- Solicitud generativa: requiere que proporciones la solicitud como entrada para el extractor generativo. (límite de 500 caracteres)
Consejo: Para conocer las buenas prácticas sobre cómo utilizar las solicitudes generativas, consulta la página Extractor generativo - Buenas prácticas . - Entrada: requiere que especifiques el archivo en sí o los datos del documento, en caso de que hayas utilizado otras actividades de Document Understanding antes en tu flujo de trabajo (por ejemplo, Clasificar documento).
Entrada
- Tiempo de espera (segundos) : tiempo máximo de ejecución (en segundos) para la llamada al modelo generativo. Si la operación supera este tiempo de espera, se finaliza automáticamente para evitar retrasos o bloqueos. Esta propiedad solo se muestra si el Extractor generativo está seleccionado como extractor.
Avanzado
- Validación automática : utiliza esta opción para habilitar la validación automática, una capacidad que ayuda a validar los resultados obtenidos para la extracción de datos frente a un modelo generativo. El valor predeterminado para el campo Validación automática es
False
. - Umbral de confianza : este campo se vuelve visible una vez que habilitas la Validación automática. Los resultados de extracción que caen por debajo del umbral se comparan con el modelo de extracción generativa. Si coinciden, el sistema ajusta la confianza de extracción para alcanzar el valor del umbral. Los valores de umbral posibles van de 0 a 100.
Si el valor se establece en 0, no se aplica ninguna validación. Sin embargo, si estableces un valor específico (de 0 a 100), el sistema comprueba todos los resultados de extracción por debajo de este valor. Por ejemplo, si estableces un umbral de confianza del 80 %, el sistema aplicará la validación generativa a los campos con una confianza inferior al 80 %.
Nota: La validación automática solo está disponible para modelos de extracción especializados.
Salida
- Datos del documento : todos los datos de campo extraídos del archivo. La información también se puede recibir desde Clasificar documento.
Visita Datos de documento para saber cómo funcionan Datos de documento y cómo consumir los resultados extraídos para campos de valor único y multivalor.
- Puntos finales públicos para modelos listos para usar.
- Modelos ML personalizados implementados en proyectos de la aplicación Document Understanding.
- Modelo de extracción generativa.