Actividades
Más reciente
False
Imagen de fondo del banner
Actividades de Document Understanding
Última actualización 29 de abr. de 2024

Extraer datos del documento

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Extrae datos de un archivo de entrada o de un objeto Datos de documento, y almacena los resultados en un objeto Datos de documento.

Nota:

La actividad Extraer datos del documento requiere una actividad que la preceda y que pueda proporcionar un objeto Datos del documento (producido como salida por otras actividades de Document Understanding, por ejemplo, Clasificar documento).

La actividad Extraer datos del documento recibe como entrada una de las siguientes opciones:
  • Datos del documento: de la actividad Clasificar documento
  • Archivo: desde las actividades Obtener archivo/carpeta u Obtener correo electrónico más reciente

Los idiomas admitidos para los modelos generativos son los mismos que los del motor OCR utilizado, que depende del proyecto. Para proyectos predefinidos , el motor OCR utilizado es UiPath Document OCR. Para obtener más información, consulta la página Idiomas compatibles con OCR .

Compatibilidad del proyecto: multiplataforma

Propiedades

  • Proyecto: requiere que selecciones tu proyecto de Document Understanding en el menú desplegable. Las opciones disponibles son:
    • Predefinido: el proyecto predeterminado
    • Puedes crear un proyecto personalizado yendo a Document Understanding.
  • Extractor: requiere que selecciones el extractor del proyecto seleccionado. Para el proyecto predefinido, las opciones disponibles son:
    • Cualquiera de los paquetes ML encontrados aquí
      Nota: La actividad Extraer datos del documento anula el tipo de documento con el extractor seleccionado. Esto no es aplicable a los modelos generativos.
    • Generativo
  • Solicitud: este campo aparece si eliges la opción Generativo. Solicitud para identificar los campos que se van a extraer, proporcionada como pares clave-valor, donde la clave representa el nombre del campo y el valor una descripción del mismo, lo que ayuda al extractor a identificar el valor correspondiente.Haz clic en el campo y obtendrás una solicitud con las siguientes opciones, proporcionadas en pares:
    • Nombre del campo: requiere que introduzcas el nombre del campo que se extraerá (Ej. Fecha de vencimiento) (límite de 30 caracteres)
    • Solicitud generativa: requiere que proporciones la solicitud como entrada para el extractor generativo. (límite de 500 caracteres)
    Consejo: Para conocer las buenas prácticas sobre cómo utilizar las solicitudes generativas, consulta la página Extractor generativo - Buenas prácticas .
  • Entrada: requiere que especifiques el archivo en sí o los datos del documento, en caso de que hayas utilizado otras actividades de Document Understanding antes en tu flujo de trabajo (por ejemplo, Clasificar documento).

Entrada

  • Tiempo de espera (segundos) : tiempo máximo de ejecución (en segundos) para la llamada al modelo generativo. Si la operación supera este tiempo de espera, se finaliza automáticamente para evitar retrasos o bloqueos. Esta propiedad solo se muestra si el Extractor generativo está seleccionado como extractor.

Avanzado

  • Validación automática : utiliza esta opción para habilitar la validación automática, una capacidad que ayuda a validar los resultados obtenidos para la extracción de datos frente a un modelo generativo. El valor predeterminado para el campo Validación automática es False.
  • Umbral de confianza : este campo se vuelve visible una vez que habilitas la Validación automática. Los resultados de extracción que caen por debajo del umbral se comparan con el modelo de extracción generativa. Si coinciden, el sistema ajusta la confianza de extracción para alcanzar el valor del umbral. Los valores de umbral posibles van de 0 a 100.

    Si el valor se establece en 0, no se aplica ninguna validación. Sin embargo, si estableces un valor específico (de 0 a 100), el sistema comprueba todos los resultados de extracción por debajo de este valor. Por ejemplo, si estableces un umbral de confianza del 80 %, el sistema aplicará la validación generativa a los campos con una confianza inferior al 80 %.

    Nota: La validación automática solo está disponible para modelos de extracción especializados.
Salida
  • Datos del documento : todos los datos de campo extraídos del archivo. La información también se puede recibir desde Clasificar documento.

    Visita Datos de documento para saber cómo funcionan Datos de documento y cómo consumir los resultados extraídos para campos de valor único y multivalor.

Nota: Los datos enviados al Extractor generativo se enviarán a una instancia de Modelo LLM no disponible al público, no saldrá de él y, una vez procesados, no se almacenarán ni se utilizarán para el entrenamiento.
Nota: La actividad Extraer datos del documento utiliza:
  • Puntos finales públicos para modelos listos para usar.
  • Modelos ML personalizados implementados en proyectos de la aplicación Document Understanding.
  • Modelo de extracción generativa.
.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.