- Introdução
- Componentes do framework
- Document Understanding no AI Center
- Pipelines
- Pacotes de ML
- Gerenciador de Dados
- Serviços de OCR
- Licenciamento
- Referências
Guia do usuário do Document Understanding.
Configurar OCR
Para importar documentos para o Data Manager, é obrigatório configurar um serviço de OCR. Isso pode ser feito no ambiente Configurações > OCR, acessível por meio do botão no canto superior direito da tela.
A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:
- URLs públicos como https://du.uipath.com/ocr ou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR;
- URLs do UiPath Document OCR ou contêineres autônomos Omnipage OCR fornecidos pela UiPath implantados no local;
- URLs do pacote de ML de OCR implantado como habilidades ML que foram tornadas públicas no AI Center on-premises v2020.10 ou posterior.
Importante:Se estiver executando o OCR na mesma máquina que o Data Manager, não use
localhost
para se referir à máquina local, mas sim o endereço IP ou o nome de domínio da máquina local.No caso de URLs de OCR implantados como Habilidade de ML pública no AI Center no local, use o URL conforme aparece na tela de detalhes da Habilidade de ML do AI Center.
Escolher o mecanismo de OCR a ser usado para importar documentos para o Data Manager é uma decisão importante.
Recomenda-se usar o mesmo OCR para importar dados de treinamento (tempo de treinamento), pois será usado quando o modelo for implantado (tempo de execução).
Idealmente, você deve experimentar alguns diferentes para identificar qual funciona melhor em seus documentos e só então decidir.
As opções no locai são:
- Contêiner UiPath OCR que suporta os principais idiomas da Europa Ocidental;
- Contêiner do Omnipage OCR (também disponível da UiPath) que funciona melhor em documentos claros digitalizados e tem a melhor cobertura de idioma;
- Contêiner Microsoft Read (disponível como pré-visualização pela Microsoft) também oferece boa cobertura de idioma;
- UiPath OCR ML Skills implantado no AI Center no local v2020.10 ou posterior.
As opções na nuvem são:
- UiPath Document OCR - https://du.uipath.com/ocr;
- Google Cloud OCR, o qual tem a melhor cobertura linguística;
- Microsoft Read Azure OCR.