- Introdução
- Componentes do framework
- Document Understanding no AI Center
- Pipelines
- Pacotes de ML
- Gerenciador de Dados
- Serviços de OCR
- Licenciamento
- Referências
Guia do usuário do Document Understanding.
Instalação do Data Manager
Antes de prosseguir, certifique-se de atender aos requisitos e instalar os pré-requisitos.
Esta seção detalha os requisitos de hardware e software para instalação do Data Manager.
-
Máquinas envolvidas: VM na nuvem (Cloud) ou caixa ou laptop local (On-Premises)
-
Sistemas operacionais: Windows (Windows 10) ou Linux (Ubuntu/CentOS/RedHat)
-
Motores de computação: CPU
-
OCR: obrigatório
Núcleos da CPU |
RAM (GB) |
HDD (GB) |
---|---|---|
1 |
4 |
30 |
Sistema operacional Linux
Se você instalar o produto em uma VM na nuvem, os seguintes sistemas operacionais serão suportados:
Software |
Versões |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
Se você instalar o produto em uma máquina em um datacenter local, os seguintes sistemas operacionais serão suportados:
Software |
Versões |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
CentOS |
7.x |
Sistema operacional Windows
Consulte o site oficial do Docker para obter a lista de sistemas operacionais Windows suportados.
No Windows, sua máquina requer a virtualização esteja habilitada. É altamente recomendável que isso seja feito apenas em máquinas físicas, como laptops ou estações de trabalho desktop. Não oferecemos suporte à execução no Docker no Windows em máquinas virtuais (nuvem ou datacenter) usando virtualização aninhada.
Navegadores
Software |
Versões |
---|---|
Google Chrome |
50+ |
(Opcional) O Data Manager precisa de acesso ao AI Center On-Premises ou a Pontos de extremidades SaaS públicos, como https://du.uipath.com/ie/invoices, caso seja necessário pré-rotulagem.
<IP>:<port_number>
. O mecanismo de OCR pode ser UiPath Document OCR on-premises, Omnipage OCR on-premises, Google Cloud Vision OCR, Microsoft Read Azure, Microsoft Read on-premises.
O Data Manager é um aplicativo em contêiner executado sobre o Docker. Você não pode executá-lo na mesma máquina que o AI Center On-Premises. Para executá-lo em uma máquina separada, basta ter o Docker instalado (no Linux) ou o Docker Desktop instalado (no Windows).
/
na coluna mais à direita:
df -h
df -h
Se o tamanho dessa partição for menor que os requisitos mínimos de armazenamento, consulte a seção Como configurar a pasta de dados do Docker.
Linux
Siga as instruções da documentação oficial do Docker ou execute este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
Se esse comando falhar, você tem um sistema operacional Linux incompatível e precisa solicitar que seu TI instale o Docker na máquina seguindo as instruções na documentação oficial do Docker.
Máquinas virtuais (VMs) do Azure
Se você estiver instalando em uma VM no Azure, use este comando:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
Windows 10
Baixe e instale o Docker Desktop. Em versões atualizadas recentemente do Windows 10, você precisará do WSL2 instalado. Portanto, quando aparecer uma caixa de diálogo dizendo "A instalação do WSL 2 está incompleta", clique no botão Reiniciar.
workdir
para o Data Manager) e incluir o caminho para ele no comando docker run, após o sinalizador -v
. Ao fazer isso no Windows, o Docker Desktop exibirá uma notificação como a abaixo. Você precisa clicar em Compartilhar para continuar.
Preencha o caminho para a pasta onde deseja que o Docker mantenha seus arquivos, execute este comando e reinicie:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
O Docker ajuda a implantar software em Docker "images. Uma instância em execução de uma imagem é chamada de contêiner. Um contêiner pode ser parado, removido, reiniciado, quantas vezes forem necessárias, desde que a imagem esteja disponível.
Após a imagem ser removida, ele é perdido. A única maneira de recuperá-lo é puxá-lo novamente do registro de onde veio, se ainda estiver disponível lá.
–v
e –p
, respectivamente.
Na tabela abaixo, você pode encontrar uma lista de comandos comuns para a linha de comando do Docker.
Clique aqui para obter a lista completa de comandos básicos do Docker.
Command |
Description |
---|---|
"
docker login <registry name> -u <username> -p <password> "
|
Faça login em um registro. |
"
docker pull <registry name>/<image name>:<image tag> "
|
Baixe uma imagem de um registro. A tag mais recente é comumente usada para se referir à versão mais recente de uma imagem. |
"`docker run –d -p 5000:80 <registry name>/<image name>:<image tag> OU docker run –d –p 5000:80 <image id> `" |
Execute um contêiner no modo desassociado, enquanto mapeia a porta 80 de dentro do contêiner para a porta 5000 na máquina host, e <container folder> para <host folder>. O modo desassociado significa que o contêiner não bloqueia o terminal, portanto, você pode realizar outras operações no mesmo terminal. |
"
docker images "
|
Liste imagens presentes no seu sistema. |
"
docker ps –a "
|
Liste todos os contêineres (em execução e parados).
|
"
docker stop <container id> "
|
Pare o contêiner
|
"
docker rm <container id> "
|
Remova o contêiner
|
"
docker logs <container id> "
|
Exiba os logs do contêiner |
"
docker rmi <image id> "
|
Remova uma ou mais imagens do sistema.
|
"
Docker container prune -f "
|
Remova todos os contêineres parados |
Command |
Description |
---|---|
"
sudo <any_command> "
|
Execute um comando como administrador. Tente isso sempre que você receber o erro de Permissão Negada. |
"
ifconfig "
|
Exiba informações sobre as interfaces de rede em seu sistema. Encontre o IP da sua máquina nas seções eth0 ou docker0. |
"
pwd "
|
Exiba o caminho para a pasta atual. |
"
ls "
|
Liste o conteúdo de um diretório. |
"
cd <folder_name> "
|
Acesse uma pasta diferente. |
"
mkdir <folder_name> "
|
Crie uma nova pasta. |
Certifique-se de ter as credenciais de registro em mãos. Se você não recebeu as credenciais de registro, entre em contato com seu representante de vendas e solicite que um conjunto de credenciais seja gerado para você.
Em seguida, digite o seguinte em um terminal Powershell ou linha de comando (no Windows) ou terminal shell (no Linux):
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
docker login aiflprodweacr.azurecr.io -u <username> -p <password>docker pull aiflprodweacr.azurecr.io/datamanager:latest
Para iniciar o Data Manager, use o seguinte comando:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept
Substitua <port_number> pelo número da porta onde deseja que o Data Manager seja acessível. Portas aos milhares são comuns, como 5000, 8000, 8080, 8081, etc. Substitua <path_to_working_folder> pela pasta local na qual deseja que o Data Manager mantenha todas as suas configurações e dados internos. Certifique-se de que o serviço Docker tenha acesso a essa pasta.
http://localhost:<port_number>
.
localhost
pelo endereço IP da máquina em que o contêiner datamanager esteja em execução.
Para executar várias sessões do Data Manager, altere o caminho da pasta e execute o comando novamente.
Certificados autoassinados
Se uma Habilidade de ML implantada no AI Center On-Premises não usar um certificado HTTPS válido, você poderá usar uma opção de linha de comando para colocar na lista de permissões a raiz do seu certificado autoassinado.
O certificado precisa estar no formato PEM. Desde que esse requisito seja atendido, a extensão do arquivo é insignificante.
O certificado deve existir dentro do contêiner Docker, portanto, deve ser montado. Consequentemente, monte o arquivo cert dentro do contêiner usando -v e especifique o caminho para ele:
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
docker run -d -p <port_number>:80 -v "<path_to_working_folder>:/app/data" -v "<path_to_certificate_file>":/custom.cer aiflprodweacr.azurecr.io/datamanager:latest --license-agreement accept --custom-root-cert="/custom.cer"
path_to_certificate_file
não suporta links simbólicos.
custom.cer
, deve ser a mesma tanto no primeiro argumento quanto no segundo. Se um for alterado, o outro também precisa ser.
Se precisar configurar o Data Manager em uma máquina sem acesso à Internet (Air-gapped), será necessário executar os comandos acima em outra máquina que tenha acesso à Internet.
Em seguida, você precisa salvar o contêiner como um arquivo .tar, copiar o arquivo para a máquina Air-gapped e, em seguida, carregá-lo. Isso é feito usando os comandos docker save e docker load descritos na documentação do Docker.
Então, na máquina conectada à internet, você precisa primeiro instalar o Docker, depois, após executar os comandos docker login e docker pull acima, é preciso executar o comando
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
docker save -o datamanager-latest.tar aiflprodweacr.azurecr.io/datamanager:latest
Em seguida, você precisa copiar o arquivo .tar para a máquina Air-gapped e, logo, executar este comando na mesma pasta onde o arquivo .tar foi salvo:
docker load --input datamanager-latest.tar
docker load --input datamanager-latest.tar
Esteja ciente de que o arquivo tar será grande, com alguns gigabytes.
- Requisitos
- Requisitos de Hardware
- Requisitos de software
- Configuração de rede
- Pré-requisitos
- Como instalar o Docker
- Como configurar a pasta de dados do Docker (somente Linux)
- Folha de referência do Docker
- Folha de referência do terminal Linux
- Instalação do Data Manager
- Iniciando o Data Manager
- Ambientes Air-gapped (sem acesso à Internet)