- Introdução
- Componentes do framework
- Document Understanding no AI Center
- Pipelines
- Pacotes de ML
- Gerenciador de Dados
- Serviços de OCR
- Licenciamento
- Referências

Guia do usuário do Document Understanding.
Antes de prosseguir, certifique-se de atender aos requisitos e instalar os pré-requisitos.
Esta seção detalha os requisitos de hardware e software para instalação do Data Manager.
Requisitos de Hardware
-
Máquinas envolvidas: VM na nuvem (Cloud) ou caixa ou laptop local (On-Premises)
-
Sistemas operacionais: Windows (Windows 10) ou Linux (Ubuntu/CentOS/RedHat)
-
Motores de computação: CPU
-
OCR: obrigatório
|
Núcleos da CPU |
RAM (GB) |
HDD (GB) |
|---|---|---|
|
1 |
4 |
30 |
Requisitos de software
Sistema operacional Linux
Se você instalar o produto em uma VM na nuvem, os seguintes sistemas operacionais serão suportados:
|
Software |
Versões |
|---|---|
|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
|
RHEL |
7.x |
Se você instalar o produto em uma máquina em um datacenter local, os seguintes sistemas operacionais serão suportados:
|
Software |
Versões |
|---|---|
|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
|
RHEL |
7.x |
|
CentOS |
7.x |
Sistema operacional Windows
Consulte o site oficial do Docker para obter a lista de sistemas operacionais Windows suportados.
No Windows, sua máquina requer a virtualização esteja habilitada. É altamente recomendável que isso seja feito apenas em máquinas físicas, como laptops ou estações de trabalho desktop. Não oferecemos suporte à execução no Docker no Windows em máquinas virtuais (nuvem ou datacenter) usando virtualização aninhada.
Navegadores
|
Software |
Versões |
|---|---|
|
Google Chrome |
50+ |
Configuração de rede
(Opcional) O Data Manager precisa de acesso ao AI Center On-Premises ou a Pontos de extremidades SaaS públicos, como https://du.uipath.com/ie/invoices, caso seja necessário pré-rotulagem.
<IP>:<port_number>. O mecanismo de OCR pode ser UiPath Document OCR on-premises, Omnipage OCR on-premises, Google Cloud Vision OCR, Microsoft Read Azure, Microsoft Read on-premises.
O Data Manager é um aplicativo em contêiner executado sobre o Docker. Você não pode executá-lo na mesma máquina que o AI Center On-Premises. Para executá-lo em uma máquina separada, basta ter o Docker instalado (no Linux) ou o Docker Desktop instalado (no Windows).
/ na coluna mais à direita:
df -hdf -hSe o tamanho dessa partição for menor que os requisitos mínimos de armazenamento, consulte a seção Como configurar a pasta de dados do Docker.
Como instalar o Docker
Linux
Siga as instruções da documentação oficial do Docker ou execute este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpucurl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpuSe esse comando falhar, você tem um sistema operacional Linux incompatível e precisa solicitar que seu TI instale o Docker na máquina seguindo as instruções na documentação oficial do Docker.
Máquinas virtuais (VMs) do Azure
Se você estiver instalando em uma VM no Azure, use este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azurecurl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azureWindows 10
Baixe e instale o Docker Desktop. Em versões atualizadas recentemente do Windows 10, você precisará do WSL2 instalado. Portanto, quando aparecer uma caixa de diálogo dizendo "A instalação do WSL 2 está incompleta", clique no botão Reiniciar.
workdir para o Data Manager) e incluir o caminho para ele no comando docker run, após o sinalizador -v. Ao fazer isso no Windows, o Docker Desktop exibirá uma notificação como a abaixo. Você precisa clicar em Compartilhar para continuar.
Como configurar a pasta de dados do Docker (somente Linux)
Preencha o caminho para a pasta onde deseja que o Docker mantenha seus arquivos, execute este comando e reinicie:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>Folha de referência do Docker
O Docker ajuda a implantar software em Docker "images. Uma instância em execução de uma imagem é chamada de contêiner. Um contêiner pode ser parado, removido, reiniciado, quantas vezes forem necessárias, desde que a imagem esteja disponível.
Após a imagem ser removida, ele é perdido. A única maneira de recuperá-lo é puxá-lo novamente do registro de onde veio, se ainda estiver disponível lá.
–v e –p, respectivamente.
Na tabela abaixo, você pode encontrar uma lista de comandos comuns para a linha de comando do Docker.
Clique aqui para obter a lista completa de comandos básicos do Docker.
|
Command |
Description |
|---|---|
|
"
docker login <registry name> -u <username> -p <password>"
|
Faça login em um registro. |
|
"
docker pull <registry name>/<image name>:<image tag>"
|
Baixe uma imagem de um registro. A tag mais recente é comumente usada para se referir à versão mais recente de uma imagem. |
|
"`docker run –d -p 5000:80 <registry name>/<image name>:<image tag> OU docker run –d –p 5000:80 <image id> `" |
Execute um contêiner no modo desassociado, enquanto mapeia a porta 80 de dentro do contêiner para a porta 5000 na máquina host, e <container folder> para <host folder>. O modo desassociado significa que o contêiner não bloqueia o terminal, portanto, você pode realizar outras operações no mesmo terminal. |
|
"
docker images"
|
Liste imagens presentes no seu sistema. |
|
"
docker ps –a"
|
Liste todos os contêineres (em execução e parados).
|
|
"
docker stop <container id>"
|
Pare o contêiner
|
|
"
docker rm <container id>"
|
Remova o contêiner
|
|
"
docker logs <container id>"
|
Exiba os logs do contêiner |
|
"
docker rmi <image id>"
|
Remova uma ou mais imagens do sistema.
|
|
"
Docker container prune -f"
|
Remova todos os contêineres parados |
Folha de referência do terminal Linux
|
Command |
Description |
|---|---|
|
"
sudo <any_command>"
|
Execute um comando como administrador. Tente isso sempre que você receber o erro de Permissão Negada. |
|
"
ifconfig"
|
Exiba informações sobre as interfaces de rede em seu sistema. Encontre o IP da sua máquina nas seções eth0 ou docker0. |
|
"
pwd"
|
Exiba o caminho para a pasta atual. |
|
"
ls"
|
Liste o conteúdo de um diretório. |
|
"
cd <folder_name>"
|
Acesse uma pasta diferente. |
|
"
mkdir <folder_name>"
|
Crie uma nova pasta. |
Certifique-se de ter as credenciais de registro em mãos. Se você não recebeu as credenciais de registro, entre em contato com seu representante de vendas e solicite que um conjunto de credenciais seja gerado para você.
Em seguida, digite o seguinte em um terminal Powershell ou linha de comando (no Windows) ou terminal shell (no Linux):
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latestdocker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latestIniciando o Data Manager
Para iniciar o Data Manager, use o seguinte comando:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement acceptdocker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement acceptSubstitua <port_number> pelo número da porta onde deseja que o Data Manager seja acessível. Portas aos milhares são comuns, como 5000, 8000, 8080, 8081, etc. Substitua <path_to_working_folder> pela pasta local na qual deseja que o Data Manager mantenha todas as suas configurações e dados internos. Certifique-se de que o serviço Docker tenha acesso a essa pasta.
http://localhost:<port_number>.
localhost pelo endereço IP da máquina em que o contêiner datamanager esteja em execução.
Para executar várias sessões do Data Manager, altere o caminho da pasta e execute o comando novamente.
Certificados autoassinados
Se uma Habilidade de ML implantada no AI Center On-Premises não usar um certificado HTTPS válido, você poderá usar uma opção de linha de comando para colocar na lista de permissões a raiz do seu certificado autoassinado.
O certificado precisa estar no formato PEM. Desde que esse requisito seja atendido, a extensão do arquivo é insignificante.
O certificado deve existir dentro do contêiner Docker, portanto, deve ser montado. Consequentemente, monte o arquivo cert dentro do contêiner usando -v e especifique o caminho para ele:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"path_to_certificate_file não suporta links simbólicos.
custom.cer, deve ser a mesma tanto no primeiro argumento quanto no segundo. Se um for alterado, o outro também precisa ser.
Ambientes Air-gapped (sem acesso à Internet)
Se precisar configurar o Data Manager em uma máquina sem acesso à Internet (Air-gapped), será necessário executar os comandos acima em outra máquina que tenha acesso à Internet.
Em seguida, você precisa salvar o contêiner como um arquivo .tar, copiar o arquivo para a máquina Air-gapped e, em seguida, carregá-lo. Isso é feito usando os comandos docker save e docker load descritos na documentação do Docker.
Então, na máquina conectada à internet, você precisa primeiro instalar o Docker, depois, após executar os comandos docker login e docker pull acima, é preciso executar o comando
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latestdocker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latestEm seguida, você precisa copiar o arquivo .tar para a máquina Air-gapped e, logo, executar este comando na mesma pasta onde o arquivo .tar foi salvo:
docker load --input datamanager-latest.tardocker load --input datamanager-latest.tarEsteja ciente de que o arquivo tar será grande, com alguns gigabytes.
- Requisitos
- Requisitos de Hardware
- Requisitos de software
- Configuração de rede
- Pré-requisitos
- Como instalar o Docker
- Como configurar a pasta de dados do Docker (somente Linux)
- Folha de referência do Docker
- Folha de referência do terminal Linux
- Instalação do Data Manager
- Iniciando o Data Manager
- Ambientes Air-gapped (sem acesso à Internet)