- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Acerca de los paquetes ML
- Configuración de OCR
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2022.10.0
- Paquetes sin conexión 2022.10.2
- Paquetes sin conexión 2022.10.4
- Paquetes sin conexión 2022.10.6
- Paquetes sin conexión 2022.10.9
- Paquetes sin conexión 2022.10.10
- Paquetes sin conexión 2022.10.11
- Paquetes sin conexión 2022.10.12
- Paquetes sin conexión 2022.10.13
- Paquetes sin conexión 2022.10.14
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Acerca de los paquetes ML
El uso de un paquete ML de Document Undestanding implica estos pasos:
- Recopila muestras de documentos y los requisitos de los puntos de datos que deben extraerse.
- Etiquetado de documentos con Document Manager. El propio Document Manager se conecta a un servicio de OCR.
- Descarga o exportación de documentos etiquetados como conjunto de datos de entrenamiento y carga de la carpeta exportada en el almacenamiento de AI Center.
- Descarga o exportación de documentos etiquetados como un conjunto de datos de evaluación y carga de la carpeta exportada en el almacenamiento de AI Center.
- Ejecución de un proceso de entrenamiento en AI Center.
- Evaluación del rendimiento del modelo con un proceso de evaluación en AI Center.
- Implementación del modelo entrenado como una habilidad ML en AI Center.
- Consultar la habilidad ML desde un flujo de trabajo RPA con el paquete de actividades UiPath.DocumentUnderstanding.ML.
Nota: recuerda que el uso de los paquetes ML de Document Understanding requiere que la máquina en la que está instalado AI Center pueda acceder a
https://du-metering.uipath.com
.Importante: Al crear un paquete UiPath.DocumentUnderstanding.ML.Activities en AI Center, el nombre del paquete no debería contener ninguna palabra clave reservada para Python, comoclass
,break
,from
,finally
,global
,None
, etc. Ten en cuenta que esta lista no es exhaustiva, ya que el nombre del paquete se usa paraclass <pkg-name>
yimport <pkg-name>
.
Se trata de modelos de aprendizaje automático listos para usarse para clasificar y extraer cualquier punto de datos común de documentos semiestructurados o no estructurados, incluidos los campos regulares, las columnas de tablas y los campos de clasificación, con un enfoque sin plantillas.
Los paquetes de aprendizaje automático suministrados por UiPath tienen la versión 0 y ya están disponibles en tu tenant, lo que significa que no es necesario descargarlos.
La descarga está disponible solo para las versiones 1 o superiores, que ya fueron entrenadas por ti.
Document Understanding contiene múltiples paquetes de ML divididos en cinco categorías principales:
- UiPath Document OCR
- Document Understanding
- Clasificador de documentos
- Out-of-the-box Pre-trained ML Packages
- Paquetes ML DU preentrenados listos para usar en AI Center
- Otros paquetes ML listos para usar
Este es un modelo no entrenable que puede usarse con la actividad del motor UiPath Document OCR como parte de la actividad Digitalizar documento. Para poder usarla, la habilidad ML debe hacerse pública primero para copiar una URL en la actividad del motor UiPath Document OCR.
Puede ejecutar UiPathDocumentOCR en la GPU o en la CPU, siendo la precisión la misma en ambos casos y el entrenamiento en la GPU es más rápido que en la CPU. Consulta los Requisitos de hardware para obtener más información.
UiPathDocumentOCR requiere acceso al servidor de medición de Document Understanding en https://du.uipath.com/metering si la habilidad ML se está ejecutando en una implementación regular de AI Center local. No es necesario el acceso a Internet en las implementaciones aisladas de AI Center locales.
Este paquete ML se puede implementar de la misma manera que el paquete ML de UiPathDocumentOCR, con las siguientes diferencias:
- está optimizado para ejecutarse en la CPU, por lo que deberías ver un aumento de velocidad de 3 a 4 veces cuando se ejecuta en el flujo de trabajo, y de 5 a 10 veces cuando se utiliza para importar documentos en el administrador de documentos.
- la precisión es ligeramente inferior a la del paquete ML UiPathDocumentOCR, y es similar a la del paquete de Studio UiPath.DocumentUnderstanding.OCR.LocalServer.
- Debido a que es más rápida, la CPU también se recomienda cuando los documentos son grandes (más de 20 páginas por documento) en ausencia de una GPU, que es lo ideal.
Se trata de un modelo genérico y reentrenable para extraer cualquier punto de datos común de cualquier tipo de documentos estructurados o semiestructurados, creando un modelo desde cero. Este paquete ML debe ser entrenado. Si se implementa sin entrenamiento previo, la implementación falla con un error que indica que el modelo no está entrenado.
Se trata de un modelo genérico y reentrenable para clasificar cualquier tipo de documentos estructurados o semiestructurados, creando un modelo desde cero. Este paquete ML debe ser entrenado. Si se implementa sin entrenamiento previo, la implementación falla con un error que indica que el modelo no está entrenado.
Se trata de paquetes de ML reentrenables que contienen el conocimiento de diferentes modelos de aprendizaje automático.
Se pueden personalizar para extraer campos adicionales o admitir idiomas adicionales mediante ejecuciones de procesos. Gracias a las capacidades de aprendizaje de transferencia de última generación, este modelo puede volver a entrenarse con documentos etiquetados adicionales y adaptarse a casos de uso específicos o ampliarse para que admita más idiomas latinos, cirílicos o griegos.
El conjunto de datos usado puede tener los mismos campos, un subconjunto de campos o tener campos adicionales. Para beneficiarte de la inteligencia ya contenida en el modelo preentrenado, es necesario usar campos con los mismos nombres que en el propio modelo listo para usar.
Estos paquetes ML son:
- Facturas: los campos extraídos listos para usar pueden consultarse aquí.
- FacturasAustralia: los campos extraídos listos para usar pueden consultarse aquí.
- FacturasIndia: los campos extraídos listos para usar pueden consultarse aquí.
-
FacturasJapón
Preview
: los campos extraídos listos para usar pueden consultarse aquí.Por el momento no se admite el reentrenamiento con datos de la Estación de validación.
-
FacturasChina
Preview
: los campos extraídos listos para usar pueden consultarse aquí.Por el momento no se admite el reentrenamiento con datos de la Estación de validación.
- Recibos: los campos extraídos listos para usar pueden consultarse aquí.
- Órdenes de compra: los campos extraídos listos para usar pueden consultarse aquí.
- Facturas de serivicios: los campos extraídos listos para usar pueden consultarse aquí.
- Documentos de identidad: los campos extraídos listos para usar pueden consultarse aquí.
- Pasaportes: los campos extraídos listos para usar pueden consultarse aquí.
- ConsejosDeRemesas: los campos extraídos listos para usar pueden consultarse aquí.
- ConocimientosDeEmbarque: los campos extraídos listos para usar pueden consultarse aquí.
- W2: los campos extraídos listos para usar pueden consultarse aquí.
- W9: los campos extraídos listos para usar pueden consultarse aquí.
- ACORD125: los campos extraídos listos para usar pueden consultarse aquí
- I9: los campos extraídos listos para usar pueden consultarse aquí
- 990
Preview
: los campos extraídos listos para usar pueden consultarse aquí - 4506T: los campos extraídos listos para usar pueden consultarse aquí
- FM1003
Preview
: los campos extraídos listos para usar pueden consultarse aquí - ACORD25: los campos extraídos listos para usar pueden consultarse aquí
- 1040: los campos extraídos listos para usar pueden consultarse aquí
- Cheques: los campos extraídos listos para usar pueden consultarse aquí
- Extractos bancarios: los campos extraídos listos para usar pueden consultarse aquí
- Estados financieos: los campos extraídos listos para usar pueden consultarse aquí
- Listas de embalaje: los campos extraídos listos para usar pueden consultarse aquí
- ACORD131: los campos extraídos listos para usar pueden consultarse aquí
- ACORD126: los campos extraídos listos para usar pueden consultarse aquí
- ACORD140: los campos extraídos listos para usar pueden consultarse aquí
- Titulación de vehículos: los campos extraídos listos para usar pueden consultarse aquí
Estos modelos son arquitecturas de aprendizaje profundo diseñadas por UiPath. Una GPU puede usarse tanto en el tiempo de servicio como en el de entrenamiento, pero no es obligatoria. Una GPU ofrece una mejora de más de 10 veces en la velocidad para el entrenamiento en particular.
Los paquetes ML preentrenados listos para usar pueden dividirse en categorías de documentos en función del uso previsto de cada modelo:
Categoría de documento |
Modelo de ML |
---|---|
KYC |
|
Seguros |
|
Préstamos |
|
Recursos humanos |
|
Envíos |
|
AP |
|
AR |
|
Gastos |
|
Se trata de paquetes no entrenables que son necesarios para los componentes no ML del paquete de Document Understanding.
Estos paquetes ML son:
- ExtractorDeFormularios: impleméntala como habilidad pública y pega la URL en la actividad Extractor de formularios.
- ExtractorInteligenteDeFormularios: implementa como habilidad pública y pega la URL en la actividad Extractor inteligente de formularios. Asegúrate de implementar primero la habilidad ML Reconocimiento de escritura manual y configúrala como OCR para este paquete.
- ClasificadorInteligenteDePalabrasClave: impleméntala como habilidad pública y pega la URL en la actividad Clasificador inteligente de palabras clave.
- HandwritingRecognitionOCR: implementa como habilidad pública y usa como OCR al crear el paquete Extractor inteligente de formularios.