- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Document Understanding dans AI Center
- Pipelines
- Paquets ML
- Data Manager
- Services OCR
- Licences
- Référence (Reference)
Guide de l'utilisateur de Document Understanding
Installer Data Manager
Avant de continuer, assurez-vous que vous remplissez les Exigences de matériel et que vous avez installé les prérequis.
Cette section détaille la configuration matérielle et logicielle requise pour l'installation de Data Manager.
-
Machines impliquées : MV dans le Cloud ou Boîte locale ou Ordinateur portable
-
Systèmes d'exploitation : Windows (Windows 10) ou Linux (Ubuntu/CentOS/RedHat)
-
Moteurs de calcul : CPU
-
OCR : Obligatoire
Cœurs de processeur (CPU Cores) |
RAM (Go) |
Disque dur (Go) |
---|---|---|
1 |
4 |
30 |
Système d'exploitation Linux
Si vous installez le produit sur une machine virtuelle dans le cloud, les systèmes d'exploitation suivants sont pris en charge :
Logiciels |
Versions |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
Si vous installez le produit sur une machine dans un centre de données local, les systèmes d'exploitation suivants sont pris en charge :
Logiciels |
Versions |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
CentOS |
7.x |
Système d'exploitation Windows
Consultez le site Web officiel de Docker pour obtenir la liste des systèmes d'exploitation Windows pris en charge.
Sous Windows, votre machine nécessite que la virtualisation soit activée. Nous vous recommandons fortement de ne le faire que sur des machines physiques telles que des ordinateurs portables ou des postes de travail de bureau. Nous ne prenons pas en charge l'exécution sur Docker sous Windows dans des machines virtuelles (Cloud ou Datacenter) à l'aide de la virtualisation imbriquée.
Navigateurs
Logiciels |
Versions |
---|---|
Google Chrome |
50+ |
(Facultatif) Data Manager a besoin d'accéder à la version locale d'AI Center ou à des points de terminaison SaaS publics tels que https://du.uipath.com/ie/invoices au cas où une pré-labellisation est nécessaire.
<IP>:<port_number>
. Le moteur OCR peut être la version locale de UiPath Document OCR, la version locale de Omnipage OCR, Google Cloud Vision OCR, Microsoft Read Azure, la version locale de Microsoft Read.
Data Manager est une application conteneurisée qui s'exécute sur Docker. Vous ne pouvez pas l'exécuter sur la même machine que la version locale d'AI Center. Pour l'exécuter sur une machine distincte, il vous suffit d'installer Docker (sous Linux) ou Docker Desktop (sous Windows).
/
dans la colonne la plus à droite :
df -h
df -h
Si la taille de cette partition est inférieure aux exigences de stockage minimales, consultez la section Configuration du dossier de données Docker.
Linux
Suivez les instructions de la documentation officielle de Docker ou exécutez cette commande :
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
Si cette commande échoue, alors vous avez un système d'exploitation Linux incompatible et vous devez demander à votre service informatique d'installer Docker sur la machine en suivant les instructions de la documentation officielle de Docker.
Machines virtuelles Azure
Si vous effectuez l'installation sur une machine virtuelle dans Azure, utilisez plutôt cette commande :
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
Windows 10
Téléchargez et installez Docker Desktop. Sur les versions récemment mises à jour de Windows 10, vous aurez besoin de WSL2 installé. Ainsi, lorsqu'une boîte de dialogue indiquant « L'installation de WSL 2 est incomplète » s'affiche, cliquez sur le bouton Redémarrer (Restart).
workdir
pour le Data Manager) et inclure le chemin d'accès dans la commande docker run, après l'indicateur -v
. Lorsque vous faites cela sous Windows, Docker Desktop affichera une notification comme celle ci-dessous. Vous devez cliquer sur Partager (Share it) pour continuer.
Remplissez le chemin d'accès au dossier dans lequel vous souhaitez que Docker conserve ses fichiers, puis exécutez cette commande, puis redémarrez :
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
Docker aide à transférer des logiciels dans Docker "images. Une instance en cours d'exécution d'une image est appelée un conteneur. Un conteneur peut être arrêté, supprimé, redémarré, autant de fois que nécessaire, tant que l'image est disponible.
Une fois l'image supprimée, elle est perdue. La seule façon de la récupérer est de la supprimer à nouveau du registre d'où elle provient si elle y est toujours disponible.
–v
et –p
.
Dans le tableau ci-dessous, vous pouvez trouver une liste de commandes courantes pour la ligne de commande Docker.
Cliquez ici pour la liste complète des commandes Docker de base.
Commande |
Description |
---|---|
"
docker login <registry name> -u <username> -p <password> "
|
Connectez-vous à un registre. |
"
docker pull <registry name>/<image name>:<image tag> "
|
Téléchargez une image à partir d'un registre. La balise latest est couramment utilisée pour faire référence à la dernière version d'une image. |
"`docker run –d -p 5000:80 <registry name>/<image name>:<image tag> OU docker run –d –p 5000:80 <image id> `" |
Exécutez une image en mode détaché, tout en mappant le port 80 de l'intérieur du conteneur au port 5000 sur la machine hôte, et <dossier conteneur> au <dossier hôte>. Le mode détaché signifie que le conteneur ne bloque pas le terminal, vous pouvez donc effectuer d'autres opérations sur le même terminal. |
"
docker images "
|
Répertorie les images présentes sur votre système. |
"
docker ps –a "
|
Répertorie tous les conteneurs (en cours d'exécution et arrêtés).
|
"
docker stop <container id> "
|
Arrêter le conteneur
|
"
docker rm <container id> "
|
Supprimer le conteneur
|
"
docker logs <container id> "
|
Affiche les journaux du conteneur |
"
docker rmi <image id> "
|
Supprime une ou plusieurs images du système.
|
"
Docker container prune -f "
|
Supprimer tous les conteneurs arrêtés |
Commande |
Description |
---|---|
"
sudo <any_command> "
|
Exécute une commande en tant qu'administrateur. Essayez ceci chaque fois que vous obtenez une erreur Autorisation refusée. |
"
ifconfig "
|
Affiche des informations sur les interfaces réseau de votre système. Trouve l'IP de votre machine dans les sections eth0 ou docker0. |
"
pwd "
|
Affiche le chemin d'accès au dossier actuel. |
"
ls "
|
Liste le contenu d'un répertoire. |
"
cd <folder_name> "
|
Accède à un autre dossier. |
"
mkdir <folder_name> "
|
Crée un dossier. |
Assurez-vous d'avoir les informations d'identification du registre à portée de main. Si vous n'avez pas reçu les informations d'identification du registre, vous devez contacter votre représentant commercial et demander qu'un ensemble d'informations d'identification soit généré pour vous.
Tapez ensuite ce qui suit dans un terminal Powershell ou Command Line (sous Windows) ou un terminal shell (sous Linux) :
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
Pour lancer Data Manager, utilisez la commande suivante :
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
Remplacez <numéro_port> par le numéro de port sur lequel vous souhaitez que Data Manager soit accessible. Des milliers de ports sont courants, tels que 5000, 8000, 8080, 8081, etc. Remplacez <path_to_working_folder> par le dossier local dans lequel vous souhaitez que Data Manager conserve toutes sa configuration et ses données internes. Assurez-vous que le service Docker a accès à ce dossier.
http://localhost:<port_number>
.
localhost
par l'adresse IP de la machine sur laquelle le conteneur datamanager s'exécute.
Pour exécuter plusieurs sessions Data Manager, modifiez le chemin d’accès au dossier et exécutez à nouveau la commande.
Certificats auto-signés
Si une compétence ML déployée dans l'AI Center local n'utilise pas de certificat HTTPS valide, vous pouvez utiliser une option de ligne de commande pour mettre sur liste blanche la racine de votre certificat auto-signé.
Le certificat doit être au format PEM. Tant que cette exigence est remplie, l'extension de fichier n'a pas d'importance.
Le certificat doit exister à l'intérieur du conteneur Docker, il doit donc être monté. Par conséquent, montez le fichier cert à l'intérieur du conteneur à l'aide de -v, puis spécifiez le chemin d'accès :
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
path_to_certificate_file
ne prend pas en charge les liens symboliques.
custom.cer
, doit être la même dans le premier argument ainsi que dans le second. Si l'une est modifiée, l'autre doit également être modifiée.
Si vous devez configurer Data Manager sur une machine sans accès Internet (physiquement isolée), vous devez exécuter les commandes ci-dessus sur une autre machine disposant d'un accès Internet.
Ensuite, vous devez enregistrer le conteneur en tant que .fichier tar, copier le fichier sur la machine physiquement isolée, puis le charger. Cela se fait à l'aide des commandes docker save et docker load décrites dans la documentation Docker.
Ainsi, sur la machine connectée à Internet, vous devez d'abord installer Docker, puis, après avoir exécuté les commandes docker login et docker pull ci-dessus, vous devez exécuter la commande
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
Ensuite, vous devez copier le fichier .tar sur la machine physiquement isolée, puis exécuter cette commande dans le même dossier où le fichier .tar a été enregistré :
docker load --input datamanager-latest.tar
docker load --input datamanager-latest.tar
Sachez que le fichier tar sera volumineux, de l'ordre de quelques gigaoctets.
- Prérequis
- Prérequis matériels
- Prérequis logiciels
- Configuration du réseau
- Prérequis
- Installation de Docker
- Configuration du dossier de données Docker (Linux uniquement)
- Aide-mémoire Docker
- Aide-mémoire du terminal Linux
- Installer Data Manager
- Lancement du Data Manager
- Environnements physiquement isolés (pas d'accès Internet)