- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Lógica de licencias y tarificación
- Tutorial
Conceptos clave
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
Active learning is our modern approach to creating models for Document UnderstandingTM.
El aprendizaje activo ofrece una experiencia interactiva en la que el algoritmo de aprendizaje puede pedir al usuario que etiquete los datos con los resultados deseados. Este proceso ayuda a reducir el tiempo y los datos necesarios para entrenar un modelo de aprendizaje automático hasta en un 80 %. La IA se utiliza para guiar el proceso, que incluye la anotación automática, que suele ser la tarea que más tiempo consume. El modelo también ofrece recomendaciones de expertos para mejorar la precisión utilizando los conjuntos de datos más informativos.
Al utilizar el aprendizaje activo, también puedes supervisar tus automatizaciones a través de las funciones de análisis.
Un tipo de documento se refiere a la clasificación o categorización de un documento en función de su contenido, formato, propósito u otros factores distintivos. Algunos ejemplos pueden incluir facturas, recibos, contratos, informes, historiales médicos, documentos legales y otros.
- Estructurado: documentos diseñados para recopilar información en un formato específico. Por ejemplo, las encuestas, los formularios de impuestos, los pasaportes o las licencias son todos documentos estructurados.
- Semiestructurado: documentos que no siguen un formato estricto y no están vinculados a los campos de datos especificados. Los documentos semiestructurados incluyen facturas, recibos, facturas de servicios públicos, extractos bancarios y otros.
- No estructurado: documentos que no siguen un modelo específico u organizado. Por ejemplo, los contratos, los contratos de alquiler o los artículos de noticias son todos documentos no estructurados.
Para obtener más información sobre los tipos de documentos, consulta la sección Tipos de documentos.
Los modelos ML son como los asistentes virtuales que se han entrenado para aprender de los datos y hacer predicciones o decisiones. Estos modelos son esencialmente algoritmos que aprenden a reconocer patrones en función de los datos históricos. Cuantos más datos a los que estén expuestos, mejor podrán mejorar sus predicciones o decisiones a lo largo del tiempo.
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Consulte la página Modelos listos para usar para ver la lista completa de modelos preentrenados y sus campos.
Los modelos ML pueden entrenarse en la mayoría de los idiomas, siempre que el OCR reconozca el documento y el texto con alta confianza.
El reconocimiento óptico de caracteres (OCR) es una tecnología especial que se utiliza para convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes tomadas por una cámara digital, en datos editables y susceptibles de búsqueda.
La precisión de un motor de OCR con mayor frecuencia depende de la calidad del documento original. Un texto claro, bien formateado y con un tipo de letra legible suele producir los mejores resultados.
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.