Actividades
Más reciente
False
Imagen de fondo del banner
Actividades de Document Understanding
Última actualización 29 de abr. de 2024

Extractor generativo: buenas prácticas

Nota: para mejorar la estabilidad, limita el número de indicaciones a no más de 30 por llamada.

Utiliza un lenguaje preciso

Imagina que le haces a cuatro o cinco personas diferentes la pregunta que te gustaría hacer en el mensaje generativo. Si puedes imaginar a estas personas dando respuestas ligeramente diferentes, entonces tu lenguaje es demasiado ambiguo y debes reformularlo para hacerlo más preciso.

Especifica un formato de salida

Para que tu pregunta sea más específica, pide al extractor que devuelva la respuesta en un formato estandarizado. Esto reduce la ambigüedad, aumenta la precisión de la respuesta y simplifica el procesamiento posterior.

Por ejemplo, si pides a la solicitud generativa que obtenga una fecha, especifica cómo quieres que se devuelva la fecha: return date in yyyy-mm-dd format. Si solo necesitas el año, especifica: return the year, as a four digit number.
También puedes utilizar este enfoque para los números. Por ejemplo, puedes especificar: return numbers which appear in parentheses as negative o return number in ##,###.## format para estandarizar el separador decimal y el separador de miles para facilitar el procesamiento posterior.

Proporciona las opciones esperadas

Un caso especial en formato sería cuando la respuesta es una de un conjunto conocido de posibles respuestas.

Por ejemplo, en un formulario de solicitud puedes preguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Esto no solo simplifica el procesamiento posterior, sino que también aumenta la precisión de la respuesta.

Paso a paso

Para maximizar la precisión, desglosa las preguntas complejas en pasos simples. En lugar de preguntar What is the termination date of this contract?, deberías preguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Hay muchas formas de desglosarlo. Puedes incluso escribir tu solicitud como un pequeño programa informático:
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: StopExecute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir lo que quieres en un estilo similar a la programación, incluso llegando a utilizar la sintaxis JSON o XML, obliga al modelo generativo a utilizar sus conocimientos de programación, lo que aumenta la precisión al seguir las instrucciones.

Evita los problemas aritméticos o lógicos

No le pidas al extractor que realice sumas, multiplicaciones, restas, comparaciones o cualquier otra operación aritmética, porque puede cometer errores básicos, además de ser muy lenta y costosa en comparación con un sencillo flujo de trabajo para robots, que nunca cometerá un error, y es además mucho más rápido y barato.

No le pidas que siga lógicas de tipo si-entonces-si no, por la misma razón que antes. El flujo de trabajo del UiPath Robot es mucho más preciso y eficiente con este tipo de operaciones.

Tablas

La extracción de datos de las tablas es un desafío para el extractor generativo. La tecnología de IA generativa opera en cadenas lineales de texto y no entiende la información bidimensional visual de las imágenes. No puede extraer campos de tabla como se define en el Gestor de taxonomía, pero puede extraer texto y tablas de los documentos.

Para extraer datos de las tablas de forma óptima, puedes elegir al menos dos enfoques:
  • Pide al extractor generativo que devuelva las columnas por separado y luego reúne las filas tú mismo en un flujo de trabajo. Podría preguntar: Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…]
  • Pídele que devuelva cada fila por separado, como un objeto JSON. Podrías preguntar: Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.

Nivel de confianza

Los modelos de IA generativa no proporcionan niveles de confianza para las predicciones. Sin embargo, el objetivo es detectar errores, y los niveles de confianza no son más que una forma posible de lograr ese objetivo, y ni siquiera la mejor. Una forma mucho mejor y más fiable de detectar errores es hacer la misma pregunta de varias maneras diferentes. Cuanto más diferente sea la formulación de la pregunta, mejor. Si todas las respuestas convergen hacia un resultado común, la probabilidad de que se produzca un error es muy baja. Si las respuestas no son las mismas, entonces la probabilidad de error es alta.

Para obtener los mejores resultados, recomendamos hacer la misma pregunta 5 veces, combinando las recomendaciones anteriores de distintas maneras. Si las 5 respuestas son idénticas, puede que no sea necesaria la revisión humana. Si una respuesta es diferente, puede que siga habiendo una alta probabilidad de que las otras 4 respuestas sean correctas. Sin embargo, si 2 o más respuestas son distintas, entonces se necesitará la revisión manual humana en Action Center.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.