- Primeros pasos
- Componentes de marco
- Document Understanding en AI Center
- Procesos
- Paquetes ML
- Gestor de datos
- Servicios de OCR
- Licencia
- Referencias
Acerca de los paquetes ML
El uso de un paquete ML de Document Undestanding implica estos pasos:
- Recopila muestras de documentos y los requisitos de los puntos de datos que deben extraerse.
- Etiqueta los documentos utilizando Data Manager.
El propio Data Manager se conectará a un servicio de OCR.
- Exporta documentos etiquetados como un conjunto de datos de entrenamiento y carga la carpeta exportada al almacenamiento de AI Center.
- Exporta documentos etiquetados como un conjunto de datos de prueba y carga la carpeta exportada al almacenamiento de AI Center.
- Ejecuta un proceso de entrenamiento en AI Center.
- Evalúa el rendimiento del modelo con un proceso de evaluación en AI Center.
- Implementa el modelo entrenado como una habilidad ML en AI Center.
- Consultar la Habilidad ML desde un flujo de trabajo RPA con el paquete de actividades UiPath.DocumentUnderstanding.ML.
Nota: recuerda que el uso de los paquetes ML de Document Understanding requiere que la máquina en la que está instalado AI Center pueda acceder a
https://du-metering.uipath.com
.Importante: Al crear un paquete UiPath.DocumentUnderstanding.ML.Activities en AI Center, el nombre del paquete no debería contener ninguna palabra clave reservada para Python, comoclass
,break
,from
,finally
,global
,None
, etc. Ten en cuenta que esta lista no es exhaustiva, ya que el nombre del paquete se usa paraclass <pkg-name>
yimport <pkg-name>
.
Se trata de modelos de aprendizaje automático listos para usarse para clasificar y extraer cualquier punto de datos común de documentos semiestructurados o no estructurados, incluidos los campos regulares, las columnas de tablas y los campos de clasificación, con un enfoque sin plantillas.
Document Understanding contiene múltiples Paquetes ML divididos en cuatro categorías principales:
Este es un modelo no entrenable que puede usarse con la actividad del motor UiPath Document OCR como parte de la actividad Digitalizar documento. Para poder utilizarla, primero debe hacerse pública para que se pueda copiar y pegar una URL en la actividad del motor UiPath Document OCR.
UiPathDocumentOCR requiere acceso al servidor de medición de Document Understanding en https://du.uipath.com/metering si la habilidad ML se está ejecutando en una implementación regular de AI Center local. No es necesario el acceso a Internet en las implementaciones aisladas de AI Center locales.
El paquete ML UiPathDocumentOCR de AI Center está optimizado para ejecutarse en GPU, por lo que recomendamos encarecidamente su uso en GPU. Si no se dispone de GPU, es recomendable utilizar el contenedor docker independiente.
Se trata de un modelo genérico y reentrenable para extraer cualquier punto de datos común de cualquier tipo de documentos estructurados o semiestructurados, creando un modelo desde cero. Este paquete ML debe ser entrenado. Si se implementa sin entrenamiento previo, la implementación falla con un error que indica que el modelo no está entrenado.
Se trata de paquetes de ML reentrenables que contienen el conocimiento de diferentes modelos de aprendizaje automático.
Se pueden personalizar para extraer campos adicionales o admitir idiomas adicionales mediante ejecuciones de procesos. Gracias a las capacidades de aprendizaje de transferencia de última generación, este modelo puede volver a entrenarse con documentos etiquetados adicionales y adaptarse a casos de uso específicos o ampliarse para que admita más idiomas latinos, cirílicos o griegos.
El conjunto de datos usado puede tener los mismos campos, un subconjunto de campos o tener campos adicionales. Para beneficiarte de la inteligencia ya contenida en el modelo preentrenado, es necesario usar campos con los mismos nombres que en el propio modelo listo para usar.
Estos paquetes ML son:
- Facturas: los campos extraídos listos para usar pueden consultarse aquí.
- FacturasAustralia
Preview
: los campos extraídos listos para usar pueden consultarse aquí. - FacturasIndia
Preview
: los campos extraídos listos para usar pueden consultarse aquí. - FacturasJapón
Preview
: los campos extraídos listos para usar pueden consultarse aquí. - Recibos: los campos extraídos listos para usar pueden consultarse aquí.
- ÓrdenesDeCompra
Preview
: los campos extraídos listos para usar pueden consultarse aquí. - FacturasDeServicios
Preview
: los campos extraídos listos para usar pueden consultarse aquí.
Estos modelos son arquitecturas de aprendizaje profundo diseñadas por UiPath. Una GPU puede usarse tanto en el tiempo de servicio como en el de entrenamiento, pero no es obligatoria. Una GPU ofrece una mejora de más de 10 veces en la velocidad para el entrenamiento en particular.
Se trata de paquetes no entrenables que son necesarios para los componentes no ML del paquete de Document Understanding.
Estos paquetes ML son:
- ExtractorDeFormularios: impleméntala como habilidad pública y pega la URL en la actividad Extractor de formularios.
- ExtractorInteligenteDeFormularios: implementa como habilidad pública y pega la URL en la actividad Extractor inteligente de formularios. Asegúrate de implementar primero la habilidad ML ReconocimientoDeEscrituraManual y configurarla como el OCR para este paquete.
- ClasificadorInteligenteDePalabrasClave: impleméntala como habilidad pública y pega la URL en la actividad Clasificador inteligente de palabras clave.
- ReconocimientoDeEscrituraManual: impleméntala como habilidad pública y úsala como OCR cuando crees el paquete Extractor inteligente de formularios.