document-understanding
2021.10
false
UiPath logo, featuring letters U and I in white
Fora do período de suporte

Guia do usuário do Document Understanding.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última atualização 11 de nov de 2024

Sobre o Data Manager

O UiPath Document Manager é um aplicativo web leve, que permite aos usuários preparar, revisar e fazer correções nos conjuntos de dados necessários para treinamento e avaliação de modelos de Machine Learning do Document Understanding.

Aqui estão os métodos de implantação no local (On-Premises):

  • Data Manager no AI Center On Premises. O pacote já está disponível (versão GA) e é totalmente suportado para cenários de produção. Não há limitação quanto ao tamanho dos conjuntos de dados que podem ser importados, com exceção de Retreinamento automático, que ainda tem o limite de 2.000 páginas ou 2 GB por importação. Para todos os métodos de implantação do AI Center disponíveis para a versão local (On Premises), consulte esta página.

O Data Manager permite que vários usuários executem uma variedade de operações envolvidas no gerenciamento de lotes de dados, preparação de dados e configuração de modelo:

Defina e configure os campos a serem extraídos por um modelo de ML.

Importe documentos para rotulagem.

Pré-rotule documentos usando um modelo de ML preexistente e pronto para uso, como Extração de Fatura ou Extração de Recibo, fornecido pela UiPath, ou usando um modelo treinado utilizando o AI Center.

Rotule documentos.

Exporte documentos no formato esperado pelos Pipelines de Treinamento do AI Center.

A interface do usuário

Barra de gerenciamento

Exibido na parte superior da página no Data Manager.

Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.

Aqui estão as opções disponíveis na barra de gerenciamento:

Opção

Ícone

Description

Navegação

Navegue entre os documentos que correspondam ao filtro ativo. Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo.

Pesquisar ou filtrar documentos. O filtro também é aplicado ao exportar documentos. Você também pode filtrar por palavras em um documento ou por nomes de documentos.

Excluir / Restaurar

/

Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído.

Predict

Execute as previsões do modelo de IA e exiba os resultados.

Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual.

No momento, usar a opção Prever com Pontos de extremidade públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação.

Abra a caixa de diálogo Importar dados.

Abra a caixa de diálogo Exportar arquivos.

Clique no ícone para baixar um arquivo Zip contendo o documento original.

Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... Veja abaixo.

Fazer download

Além do arquivo Zip contendo o documento original, todas as páginas convertidas internamente pelo Document Manager para imagens .jpeg também são baixadas.
Nome do documento, tipo e nome da sessão

No lado direito do ícone, você pode visualizar o nome do documento atualmente ativo, seu tipo e o nome da sessão.

Há três tipos de documentos:

  • Documento de treinamento
  • Documento de validação
  • Documento de avaliação

Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento.

Os documentos de avaliação são ignorados pelos pipelines de treinamento e devem ser usados apenas pelos pipelines de avaliação no AI Center. Esses documentos são os que foram marcados como avaliação selecionando a caixa de verificação Faça deste um conjunto de avaliação na caixa de diálogo Importar dados.

Configurações

O botão de configurações tem duas opções disponíveis:

OCR

Para importar documentos para o Data Manager, é obrigatório configurar um serviço de OCR.



As seguintes opções estão disponíveis:

Método de OCR

Importante:

Escolher o mecanismo de OCR a ser usado para importar documentos para o Data Manager é uma decisão importante.

Recomenda-se usar o mesmo OCR para importar dados de treinamento (tempo de treinamento), pois será usado quando o modelo for implantado (tempo de execução).

Idealmente, você deve experimentar alguns diferentes para identificar qual funciona melhor em seus documentos e só então decidir.

As opções no locai são:

  • Contêiner UiPath OCR que suporta os principais idiomas da Europa Ocidental;
  • Contêiner Microsoft Read (disponível como pré-visualização pela Microsoft) também oferece boa cobertura de idioma;
  • UiPath OCR ML Skills implantado no AI Center no local v2020.10 ou posterior.

As opções na nuvem são:

  • UiPath Document OCR - https://du.uipath.com/ocr;
  • Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
  • Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
  • Microsoft Read OCR.

URL de OCR

A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:

  • URLs públicos como https://du.uipath.com/ocr ou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR
  • URLs do contêiner independente UiPath Document OCR fornecido pela UiPath implantada no local
  • URLs do pacote de ML de OCR implantado como habilidades de ML que foram disponibilizadas publicamente (GA) no AI Center On-Premises v2020.10 ou posterior

    Importante:
    Se estiver executando o OCR na mesma máquina que o Data Manager, não use localhostpara se referir à máquina local, mas sim o endereço IP ou o nome de domínio da máquina local.

    No caso de URLs de OCR implantados como Habilidade de ML pública no AI Center no local, use o URL conforme aparece na tela de detalhes da Habilidade de ML do AI Center.

Chave de OCR

A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Data Manager Cloud e Data Manager On-Prem Online. Não é necessário para o Data Manager On-Prem Air-gapped.

Pré-rotulamento

Se você já possui um modelo que pode extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar muito tempo usando o recurso de pré-rotulagem do Data Manager.



As seguintes opções estão disponíveis:

URL de pré-rotulamento

A pré-rotulagem exige que o modelo de ML tenha um URL. Esses são os URLs possíveis que você pode usar:

  • URLs públicos, como https://du.uipath.com/ie/invoices ou https://du.uipath.com/ie/purchase_orders
  • Veja a lista completa de pontos de extremidade aqui
  • URLs de habilidades de ML que foram tornados públicos no AI Center no local ou no AI Center Cloud

As habilidades de ML no AI Center On-Premises implantadas em ambientes isolados (air-gapped) não podem ser usadas para pré-rotulagem.

Importante:
Se estiver executando o Modelo de pré-rotulagem na mesma máquina que o Data Manager, não use localhost para se referir à máquina local, mas sim o endereço IP ou o nome de domínio da máquina local.

No caso de URLs de habilidades de ML públicas no AI Center no local, use o URL conforme aparece na tela de detalhes da habilidade de ML do AI Center.

Chave de pré-rotulamento

A chave de API do Document Understanding. Obrigatório para Data Manager Cloud e Data Manager On-Prem Online. Não é necessário para o Data Manager On-Prem Air-gapped.

Como...

A opção Como fazer... acessa o menu de ajuda do Data Manager.



Nela, você pode encontrar:

  • A versão do Data Manager
  • O link Documentação que leva a esta página de documentação.
  • A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
  • A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
  • A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.

Campos de coluna

Os campos de coluna têm as seguintes opções:

  • Criar novo campo de coluna docs image
  • Editar campo docs image
  • Expande/recolhe valores de campo de coluna docs image

Para obter mais detalhes sobre campos de coluna, visite esta seção.

Campos Regulares

Os campos regulares têm as seguintes opções:

  • Cria um novo campo regular docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos regulares, visite esta seção.

Campos de Classificação

Os campos de classificação têm as seguintes opções:

  • Cria um novo campo de classificação docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos de classificação, visite esta seção.

Exibição de Documento

Para documentos de várias páginas, você pode rolar naturalmente pelas páginas como em qualquer visualizador de PDF. Para aumentar ou diminuir o zoom, use Ctrl + rolagem do mouse.

Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.

Para obter mais detalhes sobre como rotular documentos, visite esta página.

Quando você abre uma nova sessão do Data Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:



Além disso, as falhas de carregamento também são exibidas na visualização do documento:



Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.