activities
latest
false
Actividades de Document Understanding
Last updated 29 de oct. de 2024

Extractor generativo: buenas prácticas

Nota:
  • Para mejorar la estabilidad, el número de solicitudes se limita a un máximo de 50.
  • La respuesta, resultado de la extracción, también llamada Finalización, tiene un límite de 700 palabras. Está limitado a 700 palabras. Esto significa que no puedes extraer más de 700 palabras de una sola solicitud. Si tus requisitos de extracción superan este límite, puedes dividir el documento en varias páginas, procesarlas individualmente y luego combinar los resultados.

Utiliza un lenguaje preciso

Imagina preguntar a cuatro o cinco personas diferentes la pregunta que quieres hacer en el mensaje generativo. Si puedes imaginar a estas personas dando respuestas ligeramente diferentes, entonces tu lenguaje es demasiado ambiguo y debes reformularlo para hacerlo más preciso.

Por ejemplo, si le das a la solicitud una solicitud general, como "Extraer toda la información personal del paciente como pares clave-valor separados por comas", se espera que el modelo encuentre cierta información por sí mismo.

Teniendo en cuenta la solicitud anterior, el modelo debe averiguar la siguiente información por sí solo:
  • Donde la información personal está en el documento.
  • Qué es personal y qué no es personal (que es muy ambiguo).
  • Lo que el usuario espera obtener como "clave", y cuál es el valor de cada clave, y cuál es el formato exacto que espera el usuario.
  • ¿Debería usar corchetes? ¿O solo cada par clave-valor en una línea separada?
Hay numerosos pasos y muchas formas diferentes de responder a la solicitud, y como la IA generativa es fundamentalmente no determinista, cuanto más larga sea la respuesta, mayor será la probabilidad de que la respuesta sea diferente cada vez, incluso si la temperatura del modelo es establecido en cero.
Para evitar el problema descrito anteriormente, divide tu solicitud amplia, con una respuesta potencialmente larga, en otras preguntas más sencillas, que generarán una respuesta corta. Por ejemplo, puedes dividir tu solicitud de solicitud general en las siguientes solicitudes más pequeñas:
  • "Extraer el nombre del paciente"
  • "Extraer el apellido del paciente"
  • "Extraer la dirección del paciente, incluyendo la ciudad, el estado y el código postal"
  • "Extraer la fecha de nacimiento del paciente"
Si divides tu solicitud en más pequeñas, obtienes una mayor precisión y resultados mucho más consistentes y reproducibles, con una menor necesidad de analizar largas cadenas de texto producidas por la IA.

Especifica un formato de salida

Para que tu pregunta sea más específica, pide al extractor que devuelva la respuesta en un formato estandarizado. Esto reduce la ambigüedad, aumenta la precisión de la respuesta y simplifica el procesamiento posterior.

Por ejemplo, si pides a la solicitud generativa que obtenga una fecha, especifica cómo quieres que se devuelva la fecha: return date in yyyy-mm-dd format. Si solo necesitas el año, especifica: return the year, as a four digit number.
También puedes utilizar este enfoque para los números. Por ejemplo, puedes especificar: return numbers which appear in parentheses as negative o return number in ##,###.## format para estandarizar el separador decimal y el separador de miles para facilitar el procesamiento posterior.

Proporciona las opciones esperadas

Un caso especial en formato sería cuando la respuesta es una de un conjunto conocido de posibles respuestas.

Por ejemplo, en un formulario de solicitud puedes preguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Esto no solo simplifica el procesamiento posterior, sino que también aumenta la precisión de la respuesta.

Paso a paso

Para maximizar la precisión, desglosa las preguntas complejas en pasos simples. En lugar de preguntar What is the termination date of this contract?, deberías preguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Hay muchas formas de desglosarlo. Incluso puedes escribir tu solicitud como un pequeño programa informático, como el siguiente:
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: StopExecute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir lo que quieres en un estilo similar a la programación, incluso llegando a utilizar la sintaxis JSON o XML, obliga al modelo generativo a utilizar sus conocimientos de programación, lo que aumenta la precisión al seguir las instrucciones.

Evita los problemas aritméticos o lógicos

No le pidas al extractor que realice sumas, multiplicaciones, restas, comparaciones o cualquier otra operación aritmética, porque puede cometer errores básicos, además de ser muy lenta y costosa en comparación con un sencillo flujo de trabajo para robots, que nunca cometerá un error, y es además mucho más rápido y barato.

No le pidas que siga lógicas de tipo si-entonces-si no, por la misma razón que antes. El flujo de trabajo del UiPath Robot es mucho más preciso y eficiente con este tipo de operaciones.

Tablas

Actualmente, el extractor generativo no admite campos de columna. Aunque es posible que puedas extraer tablas más pequeñas a través de preguntas regulares y analizar su salida, ten en cuenta que esto es solo una solución y viene con restricciones. No está diseñado ni recomendado para extraer tablas genéricas arbitrariamente grandes.

La extracción de datos de las tablas es un desafío para el extractor generativo. La tecnología de IA generativa opera en cadenas lineales de texto y no entiende la información bidimensional visual de las imágenes. No puede extraer campos de tabla como se define en el Gestor de taxonomía, pero puede extraer texto y tablas de los documentos.

Para extraer datos de forma óptima de tablas, puedes elegir al menos dos enfoques, incluido el siguiente:
  • Pide al extractor generativo que devuelva las columnas por separado y luego reúne las filas tú mismo en un flujo de trabajo. Podría preguntar: Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…]
  • Pídele que devuelva cada fila por separado, como un objeto JSON. Podrías preguntar: Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.

Nivel de confianza

Los modelos de IA generativa no proporcionan niveles de confianza para las predicciones. Sin embargo, el objetivo es detectar errores y los niveles de confianza son solo una forma posible de lograr ese objetivo, y no la mejor. Una forma mucho mejor y más fiable de detectar errores es hacer la misma pregunta de varias maneras diferentes. Cuanto más diferente sea la formulación de la pregunta, mejor. Si todas las respuestas convergen hacia un resultado común, la probabilidad de que se produzca un error es muy baja. Si las respuestas no son las mismas, entonces la probabilidad de error es alta.

Por ejemplo, puedes repetir la misma pregunta dos, tres o incluso cinco veces (dependiendo de lo crucial que sea para evitar errores no detectados en tu procedimiento), combinando las sugerencias mencionadas en combinaciones variadas. Si todas las respuestas son coherentes, puede que no sea necesaria la revisión humana. Sin embargo, si alguna de las respuestas difiere, puede ser necesaria la revisión manual por parte de una persona en Action Center.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.