UiPath Documentation
document-understanding
latest
false
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Última actualización 29 de abr. de 2026

Conceptos clave

Familiarízate con los conceptos básicos de UiPath® Document UnderstandingTM.

Aprendizaje activo

El aprendizaje activo es nuestro enfoque moderno para crear modelos para Document UnderstandingTM.

El aprendizaje activo ofrece una experiencia interactiva en la que el algoritmo de aprendizaje puede pedir al usuario que etiquete los datos con los resultados deseados. Este proceso ayuda a reducir el tiempo y los datos necesarios para entrenar un modelo de aprendizaje automático hasta en un 80 %. La IA se utiliza para guiar el proceso, que incluye la anotación automática, que suele ser la tarea que más tiempo consume. El modelo también ofrece recomendaciones de expertos para mejorar la precisión utilizando los conjuntos de datos más informativos.

Figura 1. Cómo funciona el aprendizaje activo Diagrama que ilustra un flujo de trabajo de aprendizaje activo para mejorar un modelo de aprendizaje automático (ML). El proceso comienza con el modelo de aprendizaje automático, donde se evalúa el rendimiento. El aprendizaje activo identifica los puntos de datos más informativos para mejorar el rendimiento del modelo. Estos puntos de datos se envían al paso de anotación humana para su revisión manual. Las anotaciones se utilizan para reentrenar y reimplementar el modelo de aprendizaje automático, creando un bucle de retroalimentación para la mejora continua. Las flechas indican el flujo entre el modelo de aprendizaje automático, aprendizaje activo y anotación humana.

Al utilizar el aprendizaje activo, también puedes supervisar tus automatizaciones a través de las funciones de análisis.

Tipos de documento

Un tipo de documento se refiere a la clasificación o categorización de un documento en función de su contenido, formato, propósito u otros factores distintivos. Algunos ejemplos pueden incluir facturas, recibos, contratos, informes, historiales médicos, documentos legales y otros.

Algunos tipos de documentos tienen un contenido extremadamente estructurado, mientras que otros consisten principalmente en texto libre. En función de esto, los documentos se clasifican en tres formatos principales:

  • Estructurado: documentos diseñados para recopilar información en un formato específico. Por ejemplo, las encuestas, los formularios de impuestos, los pasaportes o las licencias son todos documentos estructurados.
  • Semiestructurado: documentos que no siguen un formato estricto y no están vinculados a campos de datos especificados. Los documentos semiestructurados incluyen facturas, recibos, facturas de servicios públicos, extractos bancarios y otros.
  • No estructurado: documentos que no siguen un modelo específico u organizado. Por ejemplo, los contratos, los arrendamientos o los artículos de noticias son todos documentos no estructurados.

Para obtener más información sobre los tipos de documentos, consulta la sección Tipos de documentos.

IA generativa

Nota:

La disponibilidad de las características depende de la plataforma en la nube que utilices. Para obtener más información, consulta la página Elegir el tipo de implementación.

La IA generativa es una forma de tecnología de IA que aprovecha los modelos de aprendizaje automático (ML) para crear y generar nuevo contenido, datos o información.

La clave para la mayoría de las tareas de IA generativas son los grandes modelos de idioma (LLM). Estos son modelos ML que se entrenan en una gran cantidad de datos de texto, diseñados para generar texto similar al humano. Los LLM también pueden comprender y responder a las solicitudes completando oraciones o párrafos de forma similar a la humana.

En el contexto de Document UnderstandingTM, la IA generativa ayuda a:

  • Extracción de información: los modelos de IA generativa pueden utilizarse para extraer información específica de documentos no estructurados o semiestructurados. Por ejemplo, puede pasar por una factura para recuperar detalles como la fecha, el importe facturado y el nombre de la empresa.
  • Clasificación de documentos: los modelos ML se utilizan para categorizar automáticamente los documentos en función de su contenido. Estos algoritmos "leen" el documento, comprenden su contexto y pueden clasificarlo en categorías predefinidas.
  • Validación de datos: la IA generativa puede comprobar la salida del modelo ML siempre que la puntuación de confianza sea demasiado baja. Si ambos modelos ML (generativo y especializado) tienen la misma salida, un humano puede omitir la validación de ese documento. Esto puede mejorar el tiempo dedicado a validar documentos, así como mejorar el rendimiento de tus modelos comprobando la salida con la ayuda de un segundo modelo generativo.

Modelos ML

Los modelos ML son como los asistentes virtuales que se han entrenado para aprender de los datos y hacer predicciones o decisiones. Estos modelos son esencialmente algoritmos que aprenden a reconocer patrones en función de los datos históricos. Cuantos más datos a los que estén expuestos, mejor podrán mejorar sus predicciones o decisiones a lo largo del tiempo.

Puedes encontrar varios modelos ML listos para usar en Document UnderstandingTM. Estos modelos te ayudan a clasificar y extraer cualquier punto de datos común de documentos semiestructurados o no estructurados, sin necesidad de configuración.

Consulta la página de tipos de documento preentrenados para obtener la lista completa de modelos preentrenados y sus campos.

Los modelos ML pueden entrenarse en la mayoría de los idiomas, siempre que el OCR reconozca el documento y el texto con alta confianza.

Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres (OCR) es una tecnología especial que se utiliza para convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes tomadas por una cámara digital, en datos editables y susceptibles de búsqueda.

La precisión de un motor de OCR con mayor frecuencia depende de la calidad del documento original. Un texto claro, bien formateado y con un tipo de letra legible suele producir los mejores resultados.

Para obtener más información sobre los idiomas compatibles con las opciones de motores OCR proporcionadas por UiPath®, consulta la página Idiomas compatibles con OCR .

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado