UiPath Documentation
document-understanding
2024.10
false
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Document Understanding modern projects user guide

Última actualización 6 de abr. de 2026

Conceptos clave

Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.

Aprendizaje activo

Active learning is our modern approach to creating models for Document UnderstandingTM.

El aprendizaje activo ofrece una experiencia interactiva en la que el algoritmo de aprendizaje puede pedir al usuario que etiquete los datos con los resultados deseados. Este proceso ayuda a reducir el tiempo y los datos necesarios para entrenar un modelo de aprendizaje automático hasta en un 80 %. La IA se utiliza para guiar el proceso, que incluye la anotación automática, que suele ser la tarea que más tiempo consume. El modelo también ofrece recomendaciones de expertos para mejorar la precisión utilizando los conjuntos de datos más informativos.

Figure 1. How does Active Learning work Diagrama que ilustra un flujo de trabajo de aprendizaje activo para mejorar un modelo de aprendizaje automático (ML). El proceso comienza con el modelo de aprendizaje automático, donde se evalúa el rendimiento. El aprendizaje activo identifica los puntos de datos más informativos para mejorar el rendimiento del modelo. Estos puntos de datos se envían al paso de anotación humana para su revisión manual. Las anotaciones se utilizan para reentrenar y reimplementar el modelo de aprendizaje automático, creando un bucle de retroalimentación para la mejora continua. Las flechas indican el flujo entre el modelo de aprendizaje automático, aprendizaje activo y anotación humana.

Al utilizar el aprendizaje activo, también puedes supervisar tus automatizaciones a través de las funciones de análisis.

Tipos de documento

Un tipo de documento se refiere a la clasificación o categorización de un documento en función de su contenido, formato, propósito u otros factores distintivos. Algunos ejemplos pueden incluir facturas, recibos, contratos, informes, historiales médicos, documentos legales y otros.

Algunos tipos de documentos tienen un contenido extremadamente estructurado, mientras que otros consisten principalmente en texto libre. En función de esto, los documentos se clasifican en tres formatos principales:

  • Structured: documents designed to collect information in a specific format. For example, surveys, tax forms, passports, or licenses are all structured documents.
  • Semi-structured: documents that do not follow a strict format and are not bound to specified data fields. Semi-structured documents include invoices, receipts, uility bills, bank statements, and others.
  • Unstructured: documents that do not follow a specific or organized model. For example, contracts, leases, or news articles are all unstructured documents.

To learn more about document types, check the Document types section.

Modelos ML

Los modelos ML son como los asistentes virtuales que se han entrenado para aprender de los datos y hacer predicciones o decisiones. Estos modelos son esencialmente algoritmos que aprenden a reconocer patrones en función de los datos históricos. Cuantos más datos a los que estén expuestos, mejor podrán mejorar sus predicciones o decisiones a lo largo del tiempo.

You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.

Check the Pre-trained document types page for the full list of pre-trained models and their fields.

Los modelos ML pueden entrenarse en la mayoría de los idiomas, siempre que el OCR reconozca el documento y el texto con alta confianza.

Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres (OCR) es una tecnología especial que se utiliza para convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes tomadas por una cámara digital, en datos editables y susceptibles de búsqueda.

La precisión de un motor de OCR con mayor frecuencia depende de la calidad del documento original. Un texto claro, bien formateado y con un tipo de letra legible suele producir los mejores resultados.

For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado