- Información general
- Creación de modelos
- Validación del modelo
- Implementación del modelo
- API
- Preguntas frecuentes

Guía del usuario de Documentos complejos y no estructurados
Mejores prácticas
Esta sección contiene las mejores prácticas sobre cómo redactar buenas instrucciones de solicitud a nivel de proyecto (es decir, extracción general), a nivel de grupo de campos y a nivel de campo individual.
Estas mejores prácticas están diseñadas para LLM externos, pero aún pueden producirse problemas de OCR. Incluso con solicitudes bien diseñadas, seguir todas las directrices no garantiza que el rendimiento de la extracción satisfaga tus expectativas.
Recomendaciones generales para su taxonomía
- Claridad y simplicidad : utiliza un lenguaje claro, directo e inequívoco. Evita complicar demasiado las instrucciones que podrían confundir el modelo. Utiliza un lenguaje sencillo y mantén las oraciones cortas.
- Consistencia: mantiene una terminología coherente en los campos, grupos de campos e instrucciones para evitar confusiones.
- Proporcionar contexto : equipa el modelo con el contexto pertinente para comprender el ámbito general de la tarea. Esto podría abarcar información de la industria, tipo de documento o formato general de datos, ya que el modelo debe comprender la tarea que maneja. Si proporcionas más contexto dentro de la solicitud, aumenta la probabilidad del modelo de predecir el campo correctamente de forma coherente.
- Iterar : como refinar las solicitudes es un proceso iterativo, mantener un registro de tus borradores y sus resultados correspondientes puede proporcionar información valiosa para futuros ajustes y mejoras. Escriba una solicitud, pruebe y edite. Repite este proceso hasta que obtengas la extracción deseada.
- Evitar instrucciones negativas : no introduzcas una instrucción similar a: no omitas ninguna sección del documento. En su lugar, sustitúyalo por: asegúrese de que se cubran todas las secciones clave, como x, y, z, del documento.
- Evita el idioma repetitivo: el idioma repetitivo puede provocar redundancia, confusión e instrucciones poco claras para el modelo.
- Cuidado con la información contradictoria : asegúrate de que tu proyecto, grupo de campos e instrucciones a nivel de campo no se contradigan entre sí en términos de la información a extraer, el formato de la extracción y dónde se puede encontrar la información. Esto confundirá el modelo y dará lugar a resultados inconsistentes.
- Refuerzo de ejemplo : siempre que sea posible, refuerza la instrucción de la solicitud con ejemplos de respuestas correctas. Estas instancias pueden guiar el modelo hacia el resultado esperado.
Figura 1. Ejemplo de taxonomía

Nivel de proyecto (extracción general)
| Mejores prácticas | Detalles | Importancia | Ejemplo correcto | Ejemplo incorrecto |
|---|---|---|---|---|
| Define la industria y el tipo de documento. | Describe brevemente el sector y el tipo de documento del que se extrae la información. A continuación, especifica las características clave y la estructura esperada del tipo de documento para guiar la extracción. | Esto proporciona un contexto importante para el proceso de extracción de datos. | Instrucción: extrae información de una declaración de corretaje, que se encuentra comúnmente en la industria de servicios financieros. Los extractos de corretaje suelen constar de unas pocas secciones: descripción general de la cuenta, resumen de la cuenta, existencias de la cuenta y actividad de transacción de la cuenta. |
Instrucción: extrae los siguientes campos del documento. Explicación: este ejemplo de instrucción del proyecto no beneficia al modelo. No proporciona ningún contexto importante o características clave que ayuden a guiar el modelo. |
| Especifica si esperas varias apariciones del documento dentro de un archivo. | Indica si el documento contiene varias instancias de datos idénticos y proporciona orientación para cada instancia de extracción. En los casos de uso que pueden tener varios documentos dentro de un solo archivo, asocia un identificador único e inclúyelo como campo en cada grupo de campos. | Esto facilitará el procesamiento posterior, permitiendo una automatización más eficiente. | Instrucción: puede haber varias cuentas de corretaje dentro de un solo archivo de documento. Una cuenta de corretaje puede identificarse a través de un campo de número de cuenta único presente en cada grupo de campos. Extrae la información de la cuenta, las existencias de la cuenta y los grupos de campos de actividad de la cuenta para cada cuenta. |
Instrucción: extrae todas las instancias de datos de cada documento de la cuenta. Explicación: este ejemplo de instrucción es inadecuado, ya que no especifica cómo determinar si hay varias apariciones de un tipo de documento dentro del archivo. |
Nivel de grupo de campo
| Mejores prácticas | Detalles | Importancia | Ejemplo correcto | Ejemplo incorrecto |
|---|---|---|---|---|
| Agrupa los puntos de datos similares que quieres que se extraigan juntos en grupos de campos. | Organiza los campos relacionados en grupos lógicos. | Esto ayuda a agilizar la extracción y minimizar los errores. | El nombre, la dirección y el estado civil del propietario de la cuenta se pueden agrupar en un grupo de campos Información del propietario de la cuenta. |
Grupo de campos : información de la cuenta Campos: activos de la cuenta, fecha de la transacción, propietario de la cuenta Explicación : esta agrupación puede funcionar en una situación en la que un usuario solo quiere extraer esos tres campos. Sin embargo, si hay otros campos como el símbolo de cotización en espera y la base de coste, el diseño o la estructura de este grupo no será el más eficaz. |
| Contexto del grupo de campo | Explica cómo cada grupo de campos contribuye al significado y al propósito generales del documento. | Esto ayuda al modelo a comprender el contexto de la extracción. | Instrucción : esta sección describe los detalles clave de la cuenta del extracto de corretaje, incluido el nombre del capital, la fecha de compra, la cantidad comprada, la base de coste y el precio total pagado. Estos detalles ayudan a determinar las existencias actuales en un extracto de corretaje. |
Instrucción : extrae los siguientes campos del documento. Explicación : las instrucciones de solicitud carecen de contexto e instrucciones detalladas para el modelo. No explica el tipo de información que requiere extracción ni destaca su importancia. |
| Aprovecha la ubicación y la estructura de la información en el documento dentro de la solicitud de tu grupo de campos. |
Indica las ubicaciones probables para los datos de cada campo, por ejemplo, tabla, encabezado, cuerpo, para guiar la extracción. Note: If you are working on a document where information appears in the same section, state the section in the prompt. | Esto ayuda al modelo a centrarse en la parte correcta del documento para cada campo. | Instrucción: los datos en el nivel de campo para esta sección se encuentran muy probablemente en el encabezado del informe en la primera página debajo del título del documento. |
Instrucción : extrae la información del principio del documento. Explicación: la solicitud es vaga y no proporciona al modelo suficientes detalles sobre dónde buscar específicamente en el documento. |
| Modelar tablas utilizando grupos de campos con campos | un grupo de campos como una tabla, en la que cada columna actúa como un campo único en ese grupo. Este enfoque es clave para un modelado de datos efectivo, ya que garantiza una diferenciación clara, minimiza la duplicación de datos y aumenta la consistencia de los datos. | Este método permite una disposición de datos estructurada de forma lógica y sistemática, lo que posteriormente conduce a una mayor eficiencia durante las consultas y el análisis de datos. |
Grupo de campo: clientes Campos: nombre, dirección, número de teléfono |
Grupos de campos : nombre del cliente, dirección del cliente, número de teléfono del cliente Campos : nombre, dirección, número de teléfono Explicación: este ejemplo separa innecesariamente los detalles del cliente en grupos de campos individuales, lo que complica la gestión de datos y la hace propensa a incoherencias. |
| Crear grupos de campos principal y secundario |
Las relaciones se indican con un signo mayor que >. Un grupo de campos principal puede tener varios grupos de campos secundarios.
| Aprovechar los grupos de campos para mostrar las relaciones entre los datos dentro de los documentos es una excelente manera de mantener la organización jerárquica de los datos. |
Grupo de campos: declaración de corretaje Campos : propietario de la cuenta, tipo de cuenta Nombre de grupo de campos: Declaración de corretaje > Asignación de activos Campos: tipo de activo, por ejemplo, acciones, bonos, efectivo, porcentaje de activos totales Nombre de grupo de campos: Declaración de corretaje > Inversiones Campos: nombre de la inversión, cantidad de propiedad, precio por acción, valor total de la inversión |
Grupo de campos: propietario de la cuenta Campos: nombre, nombre de la inversión, tipo de cuenta, número de acciones, acciones, bonos Grupo de campos : Propietario de la cuenta > Dirección Campos : calle, ciudad, estado, código postal Grupo de campos : Propietario de la cuenta > Información de contacto Campos: Número de teléfono, Correo electrónico Explicación : esta es una jerarquía mal estructurada porque combina campos no relacionados bajo el mismo grupo principal, y los grupos de campos secundarios (Dirección e Información de contacto) no se relacionan lógicamente con los campos del elemento principal (Nombre de la inversión, Número de acciones, Acciones, Bonos ). Esto podría confundir al modelo de IA, ya que no refleja la organización natural de los datos dentro del documento. |
| Utiliza un campo clave para archivos que contienen varios documentos dentro de ellos | Selecciona un identificador exclusivo en el documento que te permita diferenciar los datos. Incluye este campo en cada grupo de campos. No es necesitas modificar la instrucción para este campo de un grupo de campos a otro. | La inclusión de este campo clave permite separar la información dentro del documento y elimina la confusión al procesar los datos extraídos. | Campo : número de cuenta, número de la seguridad social, número de póliza |
Campo: fecha, nombre Explicación : los nombres de campo enumerados no serían buenos campos clave, ya que no son únicos. Tanto las fechas como los nombres pueden repetirse. |
Nivel de campo
| Mejores prácticas | Detalles | Importancia | Ejemplo correcto | Ejemplo incorrecto |
|---|---|---|---|---|
| Elige los nombres de los campos con cuidado | Elige nombres claros y reconocibles para los campos que se alineen con las expectativas del usuario. Si hay un nombre universal que se utiliza en todas las variaciones del documento, asegúrate de incluirlo. | Los nombres de los campos precisos garantizan una extracción precisa y reducen la ambigüedad. | Campo: fecha del accidente |
Campo: fecha Explicación: Fecha es un término genérico y no proporciona ningún contexto sobre a qué se refiere la fecha. Esto puede provocar una extracción de datos inexacta, ya que el modelo de IA puede recoger cualquier fecha que aparezca en el documento. |
| Sé explícito y detallado con las instrucciones | Inicia el modelo indicando explícitamente lo que quieres que el modelo extraiga. Especifica el formato y la estructura exactos de los datos que se van a extraer. | Las solicitudes claras y detalladas guían el modelo para extraer exactamente lo que necesitas, en el formato que esperas. | Instrucciones: extrae la lista de todos los asesores del documento, conviértela en una lista separada por comas y ordénala alfabéticamente. |
Instrucción: obtén todos los asesores Explicación: la solicitud es vaga y no proporciona al modelo instrucciones claras sobre el resultado deseado y cómo debe formatearse. Esto puede provocar incoherencias en la información extraída, lo que dificulta el procesamiento de los resultados. |
| Proporciona ejemplos dentro de las instrucciones | Proporciona entradas de ejemplo y las salidas esperadas correspondientes para aclarar los resultados esperados. | Esto ayuda al modelo a comprender exactamente lo que estás buscando. |
Instrucción: extrae las fechas de transacción del documento. Las fechas deben estar en formato MM/DD/YYYY . Por ejemplo, si el documento indica que la transacción se completó el 1 de enero de 2021, la fecha de extracción debe ser 01/01/2021. Si la fecha de la transacción se indica en el formato MM/YYYY , extráela como el primer día de ese mes. Por ejemplo, si la fecha se presenta como 05/2021, extráela como 01/05/2021.
|
Instrucción: obtén las fechas de la transacción del documento. Explicación: la solicitud anterior no es tan efectiva porque no proporciona instrucciones explícitas sobre cómo manejar los diferentes formatos de fecha encontrados en el documento. Esta falta de claridad puede conducir a una extracción inconsistente de fechas, lo que complica la tarea de interpretar y analizar los datos. |
| Cíñete a una idea principal por instrucción de campo | Evita sobrecargar la solicitud intentando extraer grandes cantidades de datos secuenciales en un solo campo para mejorar la precisión. Cada nivel de campo debe centrarse en extraer un dato. | Esto también facilitará el procesamiento posterior. |
Campo 1: extrae el número de cuenta. Campo 2: extrae la fecha de la transacción. Campo 3: extrae el saldo de la cuenta. |
Instrucciones: extrae el número de cuenta, la fecha de la transacción y el saldo de la cuenta juntos. Explicación: la solicitud está sobrecargada con varias instrucciones que dirigen al modelo para extraer diferentes tipos de datos simultáneamente. Este enfoque podría crear resultados de extracción desordenados y dificultar el posprocesamiento. |
Nivel de tipo de campo
| Mejores prácticas | Detalles | Importancia | Ejemplo correcto | Ejemplo incorrecto |
|---|---|---|---|---|
| Elige tipos de datos con propósito |
Considera cómo quieres que se formateen los datos extraídos y asegúrate de que se alinee con los casos de uso descendentes para optimizar la extracción para la automatización.
| Seleccionar el tipo de datos adecuado permite un formato preciso y un procesamiento posterior más fácil. |
Nombre del campo: volumen de transacción Tipo de datos : número |
Nombre del campo : número de teléfono Tipo de datos : número Explicación : Usar el tipo de datos Número para un número de teléfono no es beneficioso. Aunque un número de teléfono se compone de dígitos, no es un valor numérico, lo que significa que no se realizan operaciones aritméticas con él; se describe mejor como una cadena de dígitos. Por lo tanto, utilizar un tipo de datos de Texto exacto sería la opción adecuada. |
| Solo incluye instrucciones específicas del tipo de campo en el tipo de campo. |
Cuando se proporcionan instrucciones para la extracción de datos, es crucial mantenerlas específicas para cada tipo de campo. Si hay instrucciones generales que se aplican a todos los campos de un cierto tipo, un usuario puede proporcionarlas en el nivel de tipo de campo para evitar la repetición. Por ejemplo, si todos los campos de Cantidad monetaria deben estar en USD, especifica esto en el nivel de tipo de campo. Sin embargo, algunos conjuntos de datos pueden requerir campos únicos que no cubren los tipos de campo existentes (Fecha, Texto, Cantidad monetaria, etc.). En estos casos, puedes crear un nuevo tipo de campo personalizado. Al escribir instrucciones para estos nuevos campos, especifica cómo deben formatearse los datos para garantizar que los datos extraídos cumplan con su propósito previsto. Estas prácticas mejoran la precisión y la consistencia de tus datos extraídos. |
Tipo de campo: fecha Instrucción : extrae todas las fechas asociadas a las transacciones del documento. Las fechas deben normalizarse al formato |
Tipo de campo: cantidad monetaria Instrucción: extrae el precio del artículo de la columna Precio en la tabla de elementos de la factura. Explicación : la instrucción es relevante específicamente para extraer una cantidad monetaria de un campo determinado (la columna Precio), no para cualquier otro campo basado en la cantidad monetaria. |
Ejemplos de campos y tipos de campos
Firmas
Cuando tus documentos incluyan firmas, asegúrate de aplicar las siguientes prácticas recomendadas:
-
¿Utilizar un tipo de datos booleano para un campo Firmado por X? es decir, ¿Está firmado por esta persona?, así como un campo de texto para el nombre de la persona, que suele estar impreso.
-
Si normalmente puedes encontrar firmas en una tabla o formato similar a una tabla, utiliza la opción de preprocesamiento del modelo de tabla .
-
Los fallos son más comunes en un documento con varios firmantes, incluida tanto la persona nombrada en el documento como su testigo.
-
Sea claro y descriptivo sobre lo siguiente:
- ¿Qué constituye una firma?
- ¿Qué no constituye una firma?
- ¿Quién debe firmar el documento?
- ¿Cómo detectar a la persona que debe firmar el documento?
-
Ten en cuenta los posibles casos de fallo en tus documentos e inclúyelos en las instrucciones, como se describe en el siguiente ejemplo:
Ejemplo de instrucción para un campo Firmado por el firmante
Determina si el firmante, y no el testigo, ha firmado el documento.
Solo devuelve verdadero si el documento está firmado por este firmante. Devuelve falso si no está firmado por ellos.
Es posible que las firmas no se parezcan al nombre impreso, así que busque una firma o una adición similar a una firma manuscrita en el documento en el espacio para la firma cerca del nombre del firmante específico.
Si un nombre se modifica con una adición manuscrita, esto no debe tratarse como una firma, solo como firmas explícitas.
Las firmas generalmente estarán cerca y alrededor de la palabra "Firmado por" o una variación como "Firmado como escritura", "En presencia de", etc.
Una línea de puntos no constituye una firma.
Si se trata de un grupo de campos general de Firmas, que contiene un campo Firmado que se combina con el Nombre o el Cargo del firmante, o ambos, puedes añadir las siguientes instrucciones: Asegúrate de atribuir las firmas a la persona correcta.
Una instrucción de ejemplo para un grupo de campos Firmas más amplio es la siguiente:
Ejemplo de instrucción para un grupo de campos Firmas
Información sobre las personas que firman y el estado del documento. Si hay varios bloques de firma y varias personas presentes en el documento, extráigalos todos.
Puede que no haya un bloque de firma explícito, los acuerdos y las cartas pueden haber sido firmados por la persona que lo envía, con un bloque de firma para la persona que acepta. En este caso, extrae ambos conjuntos de firmas.
Nota:Si el rendimiento sigue sin ser satisfactorio, incluso después de realizar esfuerzos persistentes para mejorarlo mediante el ajuste de las instrucciones, ponte en contacto con tu gestor de cuentas. Pueden comprobar si alguna característica de procesamiento de vista previa que pueda ayudar está disponible en tu región.
Diferencias regionales
Cantidades monetarias y separadores de coma
Un ejemplo de diferencias regionales que pueden requerir la solicitud para corregir el comportamiento predeterminado de LLM es el uso de comas como separadores decimales en ciertos países, como Alemania e India.
El siguiente ejemplo para un caso de uso de recibos alemanes muestra cómo puedes tener en cuenta la presencia de valores en un formato inesperado:
Ejemplo de instrucción
Está extrayendo datos de recibos alemanes. Los importes monetarios están todos en €, aunque puede que falte el signo €. "," es el separador decimal típico para todos los números, mientras que '.' se utiliza para formatear valores más grandes.
Para determinar si se está utilizando este formato, comprueba si hay una coma como separador final en el valor. Si no es así, es probable que el número tenga el formato alternativo de utilizar ',' para el formato y '.' para decimales.
Los importes suelen tener dos dígitos decimales (por ejemplo 8,58 es 8,58€ y 9.115,00 es 9115,00€). Espere que los artículos de una sola línea en los recibos de comestibles sean inferiores a 100 €.
Pruebas e iteración
- Crea un campo para toda la Información que quieres extraer, pero no incluyas ninguna instrucción.
- Selecciona una muestra de 2 a 3 documentos y ejecuta predicciones en cada uno de ellos. Estos documentos deben reflejar la variación presente en los documentos para los que estás creando el modelo.
- Compara las extracciones del modelo con lo que esperabas. Para los campos que no funcionaron bien, redacta una solicitud utilizando las prácticas recomendadas enumeradas anteriormente, ya que esto te servirá como tu solicitud de referencia.
- Vuelve a ejecutar las predicciones utilizando los mismos 2 a 3 documentos de ejemplo que probaste anteriormente y comprueba si ha mejorado el rendimiento de la extracción.
- Si las predicciones son incorrectas o incompletas, refina las solicitudes para añadir los detalles necesarios para mejorar el rendimiento de extracción del modelo. Si las predicciones se alinean con tus expectativas, amplía el tamaño de tu muestra de los documentos. Es crucial aumentar gradualmente estos números. Pasa de 2 a 3, luego a 10, luego a 20, 30, y así sucesivamente. Continúa hasta que te sientas seguro de que las predicciones del modelo son correctas.
- Si las instrucciones han cambiado, vuelve a evaluar los documentos vistos anteriormente para asegurarte de que las predicciones siguen siendo precisas.
- Una vez que estés satisfecho con el rendimiento del modelo, vuelve a leer el primer documento y comienza a anotar. Anotar al menos 10 documentos para obtener métricas de rendimiento de campo valiosas a través de la pestaña Medir. Esta característica te permite evaluar el rendimiento de la extracción tanto en el nivel general del proyecto como en el de campo.
- Supervisa las métricas de rendimiento para informar tu refinamiento de solicitud a gran escala. El proceso de iteración de solicitud debe producirse principalmente en el nivel de campo, donde los ajustes tendrán impactos más específicos y directos en los campos específicos que no funcionan bien. Si la puntuación de un grupo de campos no funciona bien, ajustar las instrucciones de tu proyecto y grupo de campos puede tener más impacto, ya que afectan a varios campos.