- Primeros pasos
- Componentes de marco
- Document Understanding en AI Center
- Procesos
- Paquetes ML
- Gestor de datos
- Servicios de OCR
- Licencia
- Referencias
Guía del usuario de Document Understanding
Instalar Data Manager
Antes de continuar, comprueba que cumples los Requisitos e instala los Prerrequisitos.
En esta sección se detallan los requisitos de hardware y software para instalar Data Manager.
-
Máquinas implicadas: máquina virtual en la nube o equipo local o portátil
-
Sistemas operativos: Windows (Windows 10) o Linux (Ubuntu/CentOS/RedHat)
-
Motores de cálculo: CPU
-
OCR: requerido
Núcleos de la CPU |
RAM (GB) |
HDD (GB) |
---|---|---|
1 |
4 |
30 |
Sistema operativo Linux
Si instalas el producto en una máquina virtual en la nube, se admiten los siguientes sistemas operativos:
Software |
Versiones |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
Si instalas el producto en una máquina en un centro de datos local, se admiten los siguientes sistemas operativos:
Software |
Versiones |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
CentOS |
7.x |
Sistema operativo Windows
Consulta el sitio web oficial de Docker para ver la lista de sistemas operativos Windows compatibles.
En Windows, tu máquina requiere que se habilite la virtualización. Se recomienda encarecidamente hacer esto solo en máquinas físicas como portátiles o estaciones de trabajo de escritorio. No se admite la ejecución de Docker en Windows en máquinas virtuales (nube o centro de datos) utilizando la virtualización anidada.
Navegadores
Software |
Versiones |
---|---|
Google Chrome |
50+ |
(Opcional) Data Manager necesita acceso a AI Center On-premises o a puntos finales SaaS públicos como https://du.uipath.com/ie/invoices en caso de que sea necesario el preetiquetado.
<IP>:<port_number>
. El motor OCR puede ser UiPath Document OCR local, Omnipage OCR local, Google Cloud Vision OCR, Microsoft Read Azure, Microsoft Read local.
Data Manager es una aplicación en contenedor que se ejecuta sobre docker. No se puede ejecutar en la misma máquina que AI Center On-Premises. Para ejecutarlo en una máquina independiente, solo es necesario tener instalado Docker (en Linux) o Docker Desktop (en Windows).
/
en la columna de la derecha:
df -h
df -h
Si el tamaño de esa partición es inferior a los requisitos mínimos de almacenamiento, consulta la sección Configurar la carpeta de datos de Docker.
Linux
Sigue las instrucciones de la documentación oficial de Docker o ejecuta este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
Si este comando falla, entonces tienes un sistema operativo Linux no compatible y debes solicitar a tu departamento de TI que instale Docker en la máquina siguiendo las instrucciones de la documentación oficial de Docker.
Máquinas virtuales con Azure
Si la instalación se realiza en una máquina virtual con Azure, utiliza este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
Windows 10
Descarga e instala Docker Desktop. En las versiones recientemente actualizadas de Windows 10, necesitarás tener instalado WSL2. Por lo tanto, cuando aparezca un cuadro de diálogo que indique "La instalación de WSL 2 está incompleta", haz clic en el botón Reiniciar.
workdir
por Data Manager) e incluir su ruta en el comando de ejecución de docker, tras el indicador -v
. Al hacerlo en Windows, Docker Desktop mostrará una notificación similar a la siguiente. Es necesario hacer clic en Compartir para continuar.
Introduce la ruta de la carpeta donde desea que Docker guarde sus archivos, ejecuta este comando y reinicia:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
Docker permite enviar software en imágenes de Docker. Una instancia en ejecución de una imagen se denomina contenedor. Un contenedor puede detenerse, eliminarse y volver a iniciarse tantas veces como sea necesario, siempre que la imagen esté disponible.
Una vez que se elimina la imagen, esta se pierde. La única forma de recuperarla es sacarla de nuevo del registro del que procede, si todavía está disponible ahí.
–v
y –p
respectivamente.
En la siguiente tabla puedes encontrar una lista de comandos comunes para la línea de comandos de Docker.
Haz clic aquí para ver la lista completa de comandos básicos de Docker.
Comando |
Descripción |
---|---|
"
docker login <registry name> -u <username> -p <password> "
|
Permite acceder a un registro. |
"
docker pull <registry name>/<image name>:<image tag> "
|
Permite descargar una imagen de un registro. La etiqueta más reciente se utiliza habitualmente para referirse a la última versión de una imagen. |
"`docker run –d -p 5000:80 <registry name>/<image name>:<image tag> O docker run –d –p 5000:80 <image id> `" |
Ejecuta un contenedor en modo separado, mientras asignas el puerto 80 desde el contenedor al puerto 5000 en la máquina host, y <container folder> a <host folder>. Modo independiente significa que el contenedor no bloquea el terminal, para que puedas realizar otras operaciones en el mismo terminal. |
"
docker images "
|
Muestra una lista de las imágenes que hay en el sistema. |
"
docker ps –a "
|
Muestra una lista de todos los contenedores (tanto los que se están ejecutando como los que están detenidos).
|
"
docker stop <container id> "
|
Detiene el contenedor
|
"
docker rm <container id> "
|
Elimina el contenedor
|
"
docker logs <container id> "
|
Muestra los registros del contenedor |
"
docker rmi <image id> "
|
Elimina una o más imágenes del sistema.
|
"
Docker container prune -f "
|
Elimina todos los contenedores detenidos |
Comando |
Descripción |
---|---|
"
sudo <any_command> "
|
Ejecuta un comando como administrador. Prueba esto cada vez que aparezca el error Permiso denegado. |
"
ifconfig "
|
Muestra información sobre las interfaces de red del sistema. Localiza la IP de tu máquina en las secciones eth0 o docker0. |
"
pwd "
|
Muestra la ruta a la carpeta actual. |
"
ls "
|
Muestra una lista del contenido de un directorio. |
"
cd <folder_name> "
|
Permite ir a una carpeta distinta. |
"
mkdir <folder_name> "
|
Crea una carpeta nueva. |
Procura tener a mano las credenciales de registro. Si no las has recibido, ponte en contacto con tu representante de ventas y solicita que te genere un conjunto de credenciales.
A continuación, introduce lo siguiente en un terminal Powershell o de línea de comandos (en Windows) o en un terminal shell (en Linux):
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
Para iniciar Data Manager, utiliza el siguiente comando:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
Sustituye<port_number>por el número de puerto en el que quieres que se pueda acceder a Data Manager. Los puertos en miles son comunes, como 5000, 8000, 8080, 8081, etc. Sustituye <path_to_working_folder> por la carpeta local donde quieres que Data Manager guarde toda su configuración y datos internos. Asegúrate de que el servicio docker tiene acceso a esa carpeta.
http://localhost:<port_number>
.
localhost
por la dirección IP de la máquina donde se ejecuta el contenedor datamanager.
Para ejecutar varias sesiones de Data Manager, cambia la ruta de la carpeta y vuelve a ejecutar el comando.
Certificados autofirmados
Si una habilidad ML implementada en AI Center On-Premises no utiliza un certificado HTTPS válido, puedes utilizar una opción de la línea de comandos para poner en la lista blanca la raíz de tu certificado autofirmado.
El certificado debe estar en formato PEM. Mientras se cumpla este requisito, la extensión del archivo es irrelevante.
El certificado tiene que existir dentro del contenedor docker, por lo que tiene que estar instalado. Por lo tanto, instala el archivo de certificado en el contenedor utilizando la opción -v y especifica la ruta al mismo:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
path_to_certificate_file
no admite enlaces simbólicos.
custom.cer
, tiene que ser la misma tanto en el primer argumento como en el segundo. Si se cambia uno, también hay que cambiar el otro.
Si necesitas configurar Data Manager en una máquina sin acceso a internet (aislada), deberás ejecutar los comandos anteriores en alguna otra máquina que sí tenga acceso a internet.
A continuación, tienes que guardar el contenedor como un archivo .tar, copiar el archivo a la máquina aislada, y luego cargarlo. Esto se hace usando los comandos docker save y docker load descritos en la documentación de Docker.
Así que, en la máquina conectada a Internet, primero tienes que instalar Docker, luego, después de ejecutar los comandos docker login y docker pull, tienes que ejecutar el comando
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
Luego tienes que copiar el archivo .tar a la máquina aislada, y después ejecutar este comando en la misma carpeta donde se guardó el archivo .tar:
docker load --input datamanager-latest.tar
docker load --input datamanager-latest.tar
Ten en cuenta que el archivo .tar será grande, ocupará unos cuantos gigabytes.
- Requisitos
- Requisitos de hardware
- Requisitos de software
- Configuración de la red
- Requisitos previos
- Instalar Docker
- Configurar la carpeta de datos de Docker (solo en Linux)
- Hoja de referencia de Docker Cheat
- Hoja de referencia del terminal Linux
- Instalar Data Manager
- Lanzar Data Manager
- Entornos aislados (sin acceso a Internet)