UiPath Documentation
activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Actividades de Document Understanding

Extractor generativo: buenas prácticas

Nota:
  • Para mejorar la estabilidad, el número de solicitudes se limita a un máximo de 50.
  • La respuesta, resultado de la extracción, también llamada Finalización, tiene un límite de 700 palabras. Este está limitado a 700 palabras. Esto significa que no puedes extraer más de 700 palabras de una sola solicitud. Si tus requisitos de extracción exceden este límite, puedes dividir el documento en varias páginas, procesarlas individualmente y luego combinar los resultados posteriormente.

Utiliza un lenguaje preciso

Imagina que le haces a cuatro o cinco personas diferentes la pregunta que te gustaría hacer en el mensaje generativo. Si puedes imaginar a estas personas dando respuestas ligeramente diferentes, entonces tu lenguaje es demasiado ambiguo y debes reformularlo para hacerlo más preciso.

Especifica un formato de salida

Para que tu pregunta sea más específica, pide al extractor que devuelva la respuesta en un formato estandarizado. Esto reduce la ambigüedad, aumenta la precisión de la respuesta y simplifica el procesamiento posterior.

Por ejemplo, si pides a la solicitud generativa que obtenga una fecha, especifica cómo quieres que se devuelva la fecha: return date in yyyy-mm-dd format. Si solo necesitas el año, especifica: return the year, as a four digit number.

También puedes utilizar este enfoque para los números. Por ejemplo, puedes especificar: return numbers which appear in parentheses as negative o return number in ##,###.## format para estandarizar el separador decimal y el separador de miles para facilitar el procesamiento posterior.

Proporciona las opciones esperadas

Un caso especial en formato sería cuando la respuesta es una de un conjunto conocido de posibles respuestas.

Por ejemplo, en un formulario de solicitud puedes preguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Esto no solo simplifica el procesamiento posterior, sino que también aumenta la precisión de la respuesta.

Paso a paso

Para maximizar la precisión, desglosa las preguntas complejas en pasos simples. En lugar de preguntar What is the termination date of this contract?, deberías preguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.

Hay muchas formas de desglosarlo. Incluso puedes escribir tu solicitud como un pequeño programa informático, como el siguiente:

Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir lo que quieres en un estilo similar a la programación, incluso llegando a utilizar la sintaxis JSON o XML, obliga al modelo generativo a utilizar sus conocimientos de programación, lo que aumenta la precisión al seguir las instrucciones.

Evita los problemas aritméticos o lógicos

No le pidas al extractor que realice sumas, multiplicaciones, restas, comparaciones o cualquier otra operación aritmética, porque puede cometer errores básicos, además de ser muy lenta y costosa en comparación con un sencillo flujo de trabajo para robots, que nunca cometerá un error, y es además mucho más rápido y barato.

No le pidas que siga lógicas de tipo si-entonces-si no, por la misma razón que antes. El flujo de trabajo del UiPath Robot es mucho más preciso y eficiente con este tipo de operaciones.

Tablas

Actualmente, el extractor generativo no admite campos de columna. Aunque es posible que puedas extraer tablas más pequeñas a través de preguntas regulares y analizar su salida, ten en cuenta que esto es solo una solución y viene con restricciones. No está diseñado ni recomendado para extraer tablas genéricas arbitrariamente grandes.

Extracting data from tables is a challenge for the Generative extractor, because the Generative AI technology operates on linear strings of text and does not understand visual two-dimensional information in images.

For table extraction using generative models, you can use the UiPath IXP™ capability, Generative Extractions for Unstructured and Complex Documents.

Nivel de confianza

Los modelos de IA generativa no proporcionan niveles de confianza para las predicciones. Sin embargo, el objetivo es detectar errores, y los niveles de confianza no son más que una forma posible de lograr ese objetivo, y ni siquiera la mejor. Una forma mucho mejor y más fiable de detectar errores es hacer la misma pregunta de varias maneras diferentes. Cuanto más diferente sea la formulación de la pregunta, mejor. Si todas las respuestas convergen hacia un resultado común, la probabilidad de que se produzca un error es muy baja. Si las respuestas no son las mismas, entonces la probabilidad de error es alta.

Por ejemplo, puedes repetir la misma pregunta dos, tres o incluso cinco veces (dependiendo de lo crucial que sea para evitar errores no detectados en tu procedimiento), combinando las sugerencias mencionadas en combinaciones variadas. Si todas las respuestas son coherentes, puede que no sea necesaria la revisión humana. Sin embargo, si alguna de las respuestas difiere, puede ser necesaria la revisión manual por parte de una persona en Action Center.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado