document-understanding
2020.10
false
UiPath logo, featuring letters U and I in white
Obsolète

Guide de l'utilisateur de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 29 juil. 2024

Installer Data Manager

Avant de continuer, assurez-vous que vous remplissez les Exigences de matériel et que vous avez installé les prérequis.

Prérequis

Cette section détaille la configuration matérielle et logicielle requise pour l'installation de Data Manager.

Prérequis matériels

  • Machines impliquées : MV dans le Cloud ou Boîte locale ou Ordinateur portable

  • Systèmes d'exploitation : Windows (Windows 10) ou Linux (Ubuntu/CentOS/RedHat)

  • Moteurs de calcul : CPU

  • OCR : Obligatoire

Cœurs de processeur (CPU Cores)

RAM (Go)

Disque dur (Go)

1

4

30

Prérequis logiciels

Système d'exploitation Linux

Si vous installez le produit sur une machine virtuelle dans le cloud, les systèmes d'exploitation suivants sont pris en charge :

Logiciels

Versions

Ubuntu

20.04 LTS

18.04 LTS

16.04 LTS

RHEL

7.x

Si vous installez le produit sur une machine dans un centre de données local, les systèmes d'exploitation suivants sont pris en charge :

Logiciels

Versions

Ubuntu

20.04 LTS

18.04 LTS

16.04 LTS

RHEL

7.x

CentOS

7.x

Système d'exploitation Windows

Consultez le site Web officiel de Docker pour obtenir la liste des systèmes d'exploitation Windows pris en charge.

Sous Windows, votre machine nécessite que la virtualisation soit activée. Nous vous recommandons fortement de ne le faire que sur des machines physiques telles que des ordinateurs portables ou des postes de travail de bureau. Nous ne prenons pas en charge l'exécution sur Docker sous Windows dans des machines virtuelles (Cloud ou Datacenter) à l'aide de la virtualisation imbriquée.

Navigateurs

Logiciels

Versions

Google Chrome

50+

Configuration du réseau

(Facultatif) Data Manager a besoin d'accéder à la version locale d'AI Center ou à des points de terminaison SaaS publics tels que https://du.uipath.com/ie/invoices au cas où une pré-labellisation est nécessaire.

Data Manager a besoin d'accéder au moteur OCR <IP>:<port_number>. Le moteur OCR peut être la version locale de UiPath Document OCR, la version locale de Omnipage OCR, Google Cloud Vision OCR, Microsoft Read Azure, la version locale de Microsoft Read.

Prérequis

Data Manager est une application conteneurisée qui s'exécute sur Docker. Vous ne pouvez pas l'exécuter sur la même machine que la version locale d'AI Center. Pour l'exécuter sur une machine distincte, il vous suffit d'installer Docker (sous Linux) ou Docker Desktop (sous Windows).

Attention : les images Docker peuvent avoir une taille de plusieurs Go, de sorte que le dossier que Docker utilise pour stocker ses fichiers sous Linux doit se trouver sur une partition suffisamment grande pour ne pas manquer d'espace. Par défaut, il se trouve toujours sur la partition racine.
Pour voir la taille de votre partition racine, tapez ce qui suit dans le terminal et recherchez la ligne avec un / dans la colonne la plus à droite :
df -hdf -h

Si la taille de cette partition est inférieure aux exigences de stockage minimales, consultez la section Configuration du dossier de données Docker.

Installation de Docker

Linux

Suivez les instructions de la documentation officielle de Docker ou exécutez cette commande :

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpucurl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu

Si cette commande échoue, alors vous avez un système d'exploitation Linux incompatible et vous devez demander à votre service informatique d'installer Docker sur la machine en suivant les instructions de la documentation officielle de Docker.

Machines virtuelles Azure

Si vous effectuez l'installation sur une machine virtuelle dans Azure, utilisez plutôt cette commande :

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azurecurl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure

Windows 10

Téléchargez et installez Docker Desktop. Sur les versions récemment mises à jour de Windows 10, vous aurez besoin de WSL2 installé. Ainsi, lorsqu'une boîte de dialogue indiquant « L'installation de WSL 2 est incomplète » s'affiche, cliquez sur le bouton Redémarrer (Restart).

Lors de l'exécution du Data Manager, vous devez créer un dossier de travail pour chaque conteneur Docker (peut-être nommé workdir pour le Data Manager) et inclure le chemin d'accès dans la commande docker run, après l'indicateur -v. Lorsque vous faites cela sous Windows, Docker Desktop affichera une notification comme celle ci-dessous. Vous devez cliquer sur Partager (Share it) pour continuer.


Configuration du dossier de données Docker (Linux uniquement)

Remplissez le chemin d'accès au dossier dans lequel vous souhaitez que Docker conserve ses fichiers, puis exécutez cette commande, puis redémarrez :

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>

Aide-mémoire Docker

Docker aide à transférer des logiciels dans Docker "images. Une instance en cours d'exécution d'une image est appelée un conteneur. Un conteneur peut être arrêté, supprimé, redémarré, autant de fois que nécessaire, tant que l'image est disponible.

Une fois l'image supprimée, elle est perdue. La seule façon de la récupérer est de la supprimer à nouveau du registre d'où elle provient si elle y est toujours disponible.

Un conteneur en cours d'exécution est analogue à une petite machine virtuelle, dans la mesure où il possède un filesystem et des interfaces réseau internes, qui sont distincts du filesystem et du réseau de la machine hôte. Les dossiers et les ports peuvent être mappés du conteneur à l'hôte, respectivement à l'aide des arguments –v et –p.

Dans le tableau ci-dessous, vous pouvez trouver une liste de commandes courantes pour la ligne de commande Docker.

Cliquez ici pour la liste complète des commandes Docker de base.

Commande

Description

"docker login <registry name> -u <username> -p <password>"

Connectez-vous à un registre.

"docker pull <registry name>/<image name>:<image tag>"

Téléchargez une image à partir d'un registre. La balise latest est couramment utilisée pour faire référence à la dernière version d'une image.

"`docker run –d -p 5000:80 <registry name>/<image name>:<image tag>

OU

docker run –d –p 5000:80 <image id>

`"

Exécutez une image en mode détaché, tout en mappant le port 80 de l'intérieur du conteneur au port 5000 sur la machine hôte, et <dossier conteneur> au <dossier hôte>. Le mode détaché signifie que le conteneur ne bloque pas le terminal, vous pouvez donc effectuer d'autres opérations sur le même terminal.

"docker images"

Répertorie les images présentes sur votre système.

"docker ps –a"

Répertorie tous les conteneurs (en cours d'exécution et arrêtés).

  • L'identifiant du conteneur est utilisé pour faire référence à ce conteneur lorsqu'il est nécessaire de l'arrêter ou de le supprimer, par exemple.
"docker stop <container id>"

Arrêter le conteneur

  • Cette commande ne supprime pas le conteneur, mais est requise avant sa suppression.
"docker rm <container id>"

Supprimer le conteneur

  • Le conteneur doit être arrêté au préalable.
"docker logs <container id>"

Affiche les journaux du conteneur

"docker rmi <image id>"

Supprime une ou plusieurs images du système.

  • Permet d'économiser de l'espace de stockage, car les images peuvent occuper beaucoup d'espace.
"Docker container prune -f"

Supprimer tous les conteneurs arrêtés

Aide-mémoire du terminal Linux

Commande

Description

"sudo <any_command>"

Exécute une commande en tant qu'administrateur. Essayez ceci chaque fois que vous obtenez une erreur Autorisation refusée.

"ifconfig"

Affiche des informations sur les interfaces réseau de votre système. Trouve l'IP de votre machine dans les sections eth0 ou docker0.

"pwd"

Affiche le chemin d'accès au dossier actuel.

"ls"

Liste le contenu d'un répertoire.

"cd <folder_name>"

Accède à un autre dossier.

"mkdir <folder_name>"

Crée un dossier.

Installer Data Manager

Assurez-vous d'avoir les informations d'identification du registre à portée de main. Si vous n'avez pas reçu les informations d'identification du registre, vous devez contacter votre représentant commercial et demander qu'un ensemble d'informations d'identification soit généré pour vous.

Tapez ensuite ce qui suit dans un terminal Powershell ou Command Line (sous Windows) ou un terminal shell (sous Linux) :

docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latestdocker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
Attention : le conteneur autonome Data Manager ne peut pas s'exécuter sur la même machine qu'AI Center.

Lancement du Data Manager

Pour lancer Data Manager, utilisez la commande suivante :

docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement acceptdocker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept

Remplacez <numéro_port> par le numéro de port sur lequel vous souhaitez que Data Manager soit accessible. Des milliers de ports sont courants, tels que 5000, 8000, 8080, 8081, etc. Remplacez <path_to_working_folder> par le dossier local dans lequel vous souhaitez que Data Manager conserve toutes sa configuration et ses données internes. Assurez-vous que le service Docker a accès à ce dossier.

Après avoir exécuté cette commande, ouvrez un navigateur Web et saisissez l'URL suivante : http://localhost:<port_number>.
Si vous utilisez le navigateur sur une autre machine, remplacez localhost par l'adresse IP de la machine sur laquelle le conteneur datamanager s'exécute.

Pour exécuter plusieurs sessions Data Manager, modifiez le chemin d’accès au dossier et exécutez à nouveau la commande.

Certificats auto-signés

Si une compétence ML déployée dans l'AI Center local n'utilise pas de certificat HTTPS valide, vous pouvez utiliser une option de ligne de commande pour mettre sur liste blanche la racine de votre certificat auto-signé.

Le certificat doit être au format PEM. Tant que cette exigence est remplie, l'extension de fichier n'a pas d'importance.

Le certificat doit exister à l'intérieur du conteneur Docker, il doit donc être monté. Par conséquent, montez le fichier cert à l'intérieur du conteneur à l'aide de -v, puis spécifiez le chemin d'accès :

docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
Remarque : path_to_certificate_file ne prend pas en charge les liens symboliques.
La racine du certificat auto-signé, dans ce cas custom.cer, doit être la même dans le premier argument ainsi que dans le second. Si l'une est modifiée, l'autre doit également être modifiée.

Environnements physiquement isolés (pas d'accès Internet)

Si vous devez configurer Data Manager sur une machine sans accès Internet (physiquement isolée), vous devez exécuter les commandes ci-dessus sur une autre machine disposant d'un accès Internet.

Ensuite, vous devez enregistrer le conteneur en tant que .fichier tar, copier le fichier sur la machine physiquement isolée, puis le charger. Cela se fait à l'aide des commandes docker save et docker load décrites dans la documentation Docker.

Ainsi, sur la machine connectée à Internet, vous devez d'abord installer Docker, puis, après avoir exécuté les commandes docker login et docker pull ci-dessus, vous devez exécuter la commande

docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latestdocker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest

Ensuite, vous devez copier le fichier .tar sur la machine physiquement isolée, puis exécuter cette commande dans le même dossier où le fichier .tar a été enregistré :

docker load --input datamanager-latest.tardocker load --input datamanager-latest.tar

Sachez que le fichier tar sera volumineux, de l'ordre de quelques gigaoctets.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.