activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 5 de dic. de 2024

Extractor generativo: buenas prácticas

Nota:
  • Para mejorar la estabilidad, el número de solicitudes se limita a un máximo de 50.
  • La respuesta, resultado de la extracción, también llamada Finalización, tiene un límite de 700 palabras. Está limitado a 700 palabras. Esto significa que no puedes extraer más de 700 palabras de una sola solicitud. Si tus requisitos de extracción superan este límite, puedes dividir el documento en varias páginas, procesarlas individualmente y luego combinar los resultados.

Utiliza un lenguaje preciso

Imagina que le haces a cuatro o cinco personas diferentes la pregunta que te gustaría hacer en el mensaje generativo. Si puedes imaginar a estas personas dando respuestas ligeramente diferentes, entonces tu lenguaje es demasiado ambiguo y debes reformularlo para hacerlo más preciso.

Especifica un formato de salida

Para que tu pregunta sea más específica, pide al extractor que devuelva la respuesta en un formato estandarizado. Esto reduce la ambigüedad, aumenta la precisión de la respuesta y simplifica el procesamiento posterior.

Por ejemplo, si pides a la solicitud generativa que obtenga una fecha, especifica cómo quieres que se devuelva la fecha: return date in yyyy-mm-dd format. Si solo necesitas el año, especifica: return the year, as a four digit number.
También puedes utilizar este enfoque para los números. Por ejemplo, puedes especificar: return numbers which appear in parentheses as negative o return number in ##,###.## format para estandarizar el separador decimal y el separador de miles para facilitar el procesamiento posterior.

Proporciona las opciones esperadas

Un caso especial en formato sería cuando la respuesta es una de un conjunto conocido de posibles respuestas.

Por ejemplo, en un formulario de solicitud puedes preguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Esto no solo simplifica el procesamiento posterior, sino que también aumenta la precisión de la respuesta.

Paso a paso

Para maximizar la precisión, desglosa las preguntas complejas en pasos simples. En lugar de preguntar What is the termination date of this contract?, deberías preguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Hay muchas formas de desglosarlo. Incluso puedes escribir tu solicitud como un pequeño programa informático, como el siguiente:
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: StopExecute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir lo que quieres en un estilo similar a la programación, incluso llegando a utilizar la sintaxis JSON o XML, obliga al modelo generativo a utilizar sus conocimientos de programación, lo que aumenta la precisión al seguir las instrucciones.

Evita los problemas aritméticos o lógicos

No le pidas al extractor que realice sumas, multiplicaciones, restas, comparaciones o cualquier otra operación aritmética, porque puede cometer errores básicos, además de ser muy lenta y costosa en comparación con un sencillo flujo de trabajo para robots, que nunca cometerá un error, y es además mucho más rápido y barato.

No le pidas que siga lógicas de tipo si-entonces-si no, por la misma razón que antes. El flujo de trabajo del UiPath Robot es mucho más preciso y eficiente con este tipo de operaciones.

Tablas

Actualmente, el extractor generativo no admite campos de columna. Aunque es posible que puedas extraer tablas más pequeñas a través de preguntas regulares y analizar su salida, ten en cuenta que esto es solo una solución y viene con restricciones. No está diseñado ni recomendado para extraer tablas genéricas arbitrariamente grandes.

Extraer datos de las tablas es un reto para el extractor generativo, porque la tecnología de IA generativa opera en cadenas lineales de texto y no comprende la información visual bidimensional de las imágenes. Sin embargo, puedes aún extraer datos de tablas, eligiendo entre al menos 2 enfoques diferentes, descritos en los siguientes ejemplos:
  • Un enfoque es pedir al extractor generativo que devuelva las columnas por separado y luego unir las filas tú mismo en un flujo de trabajo. En este caso, podrías preguntar: Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…]
  • Otro enfoque es pedirle que devuelva cada fila por separado, como en un objeto JSON. En este caso, podrías preguntar: Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.

Nivel de confianza

Los modelos de IA generativa no proporcionan niveles de confianza para las predicciones. Sin embargo, el objetivo es detectar errores, y los niveles de confianza no son más que una forma posible de lograr ese objetivo, y ni siquiera la mejor. Una forma mucho mejor y más fiable de detectar errores es hacer la misma pregunta de varias maneras diferentes. Cuanto más diferente sea la formulación de la pregunta, mejor. Si todas las respuestas convergen hacia un resultado común, la probabilidad de que se produzca un error es muy baja. Si las respuestas no son las mismas, entonces la probabilidad de error es alta.

Por ejemplo, puedes repetir la misma pregunta dos, tres o incluso cinco veces (dependiendo de lo crucial que sea para evitar errores no detectados en tu procedimiento), combinando las sugerencias mencionadas en combinaciones variadas. Si todas las respuestas son coherentes, puede que no sea necesaria la revisión humana. Sin embargo, si alguna de las respuestas difiere, puede ser necesaria la revisión manual por parte de una persona en Action Center.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.