Actividades - Extractor generativo

activities

latest

false

Actividades de Document Understanding

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Extractor generativo: buenas prácticas

Buenas prácticas para extraer datos de documentos utilizando solicitudes generativas dentro de los flujos de trabajo de actividades de Document Understanding.

Nota:

Para mejorar la estabilidad, el número de solicitudes se limita a un máximo de 50.
La respuesta, resultado de la extracción, también llamada Finalización, tiene un límite de 700 palabras. Este está limitado a 700 palabras. Esto significa que no puedes extraer más de 700 palabras de una sola solicitud. Si tus requisitos de extracción exceden este límite, puedes dividir el documento en varias páginas, procesarlas individualmente y luego combinar los resultados posteriormente.

Utiliza un lenguaje preciso

Imagina que le haces a cuatro o cinco personas diferentes la pregunta que te gustaría hacer en el mensaje generativo. Si puedes imaginar a estas personas dando respuestas ligeramente diferentes, entonces tu lenguaje es demasiado ambiguo y debes reformularlo para hacerlo más preciso.

Especifica un formato de salida

Para que tu pregunta sea más específica, pide al extractor que devuelva la respuesta en un formato estandarizado. Esto reduce la ambigüedad, aumenta la precisión de la respuesta y simplifica el procesamiento posterior.

Por ejemplo, si pides a la solicitud generativa que obtenga una fecha, especifica cómo quieres que se devuelva la fecha: return date in yyyy-mm-dd format. Si solo necesitas el año, especifica: return the year, as a four digit number.

También puedes utilizar este enfoque para los números. Por ejemplo, puedes especificar: return numbers which appear in parentheses as negative o return number in ##,###.## format para estandarizar el separador decimal y el separador de miles para facilitar el procesamiento posterior.

Proporciona las opciones esperadas

Un caso especial en formato sería cuando la respuesta es una de un conjunto conocido de posibles respuestas.

Por ejemplo, en un formulario de solicitud puedes preguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Esto no solo simplifica el procesamiento posterior, sino que también aumenta la precisión de la respuesta.

Paso a paso

Para maximizar la precisión, desglosa las preguntas complejas en pasos simples. En lugar de preguntar What is the termination date of this contract?, deberías preguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.

Hay muchas formas de desglosarlo. Incluso puedes escribir tu solicitud como un pequeño programa informático, como el siguiente:

Execute the following program:

Find termination section or clause

Find termination date

Return termination date in yyyy-mm-dd format

Stop
Execute the following program:

Find termination section or clause

Find termination date

Return termination date in yyyy-mm-dd format

Stop

Definir lo que quieres en un estilo similar a la programación, incluso llegando a utilizar la sintaxis JSON o XML, obliga al modelo generativo a utilizar sus conocimientos de programación, lo que aumenta la precisión al seguir las instrucciones.

Evita los problemas aritméticos o lógicos

No le pidas al extractor que realice sumas, multiplicaciones, restas, comparaciones o cualquier otra operación aritmética, porque puede cometer errores básicos, además de ser muy lenta y costosa en comparación con un sencillo flujo de trabajo para robots, que nunca cometerá un error, y es además mucho más rápido y barato.

No le pidas que siga lógicas de tipo si-entonces-si no, por la misma razón que antes. El flujo de trabajo del UiPath Robot es mucho más preciso y eficiente con este tipo de operaciones.

Tablas

Actualmente, el extractor generativo no admite campos de columna. Aunque es posible que puedas extraer tablas más pequeñas a través de preguntas regulares y analizar su salida, ten en cuenta que esto es solo una solución y viene con restricciones. No está diseñado ni recomendado para extraer tablas genéricas arbitrariamente grandes.

Extraer datos de las tablas es un reto para el extractor generativo, porque la tecnología de IA generativa opera en cadenas lineales de texto y no comprende la información visual bidimensional de las imágenes.

Para la extracción de tablas utilizando modelos generativos, puedes utilizar la capacidad de UiPath IXP™, Extracciones generativas para documentos complejos y no estructurados.

Nivel de confianza

Los modelos de IA generativa no proporcionan niveles de confianza para las predicciones. Sin embargo, el objetivo es detectar errores, y los niveles de confianza no son más que una forma posible de lograr ese objetivo, y ni siquiera la mejor. Una forma mucho mejor y más fiable de detectar errores es hacer la misma pregunta de varias maneras diferentes. Cuanto más diferente sea la formulación de la pregunta, mejor. Si todas las respuestas convergen hacia un resultado común, la probabilidad de que se produzca un error es muy baja. Si las respuestas no son las mismas, entonces la probabilidad de error es alta.

Por ejemplo, puedes repetir la misma pregunta dos, tres o incluso cinco veces (dependiendo de lo crucial que sea para evitar errores no detectados en tu procedimiento), combinando las sugerencias mencionadas en combinaciones variadas. Si todas las respuestas son coherentes, puede que no sea necesaria la revisión humana. Sin embargo, si alguna de las respuestas difiere, puede ser necesaria la revisión manual por parte de una persona en Action Center.

En esta página

Utiliza un lenguaje preciso
Especifica un formato de salida
Proporciona las opciones esperadas
Paso a paso
Evita los problemas aritméticos o lógicos
Tablas
Nivel de confianza

¿Te ha resultado útil esta página?

AnteriorCrear precontratación en Workday basada en CV

Sig.Clasificador generativo: buenas prácticas

Utiliza un lenguaje preciso​

Especifica un formato de salida​

Proporciona las opciones esperadas​

Paso a paso​

Evita los problemas aritméticos o lógicos​

Tablas​

Nivel de confianza​