- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Carregar Taxonomia
UiPath.IntelligentOCR.Activities.TaxonomyManagement.LoadTaxonomy
taxonomy.json
criado com a ajuda do Gerenciador de Taxonomia em uma variável que pode ser utilizada posteriormente com outras atividades.
Comum
- NomeDeExibição - o nome de exibição da atividade.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
-
Taxonomia - A taxonomia que você deseja carregar, armazenada em uma variável
DocumentTaxonomy
. Esta saída pode ser utilizada posteriormente em atividades que recebam uma taxonomia como entrada.Importante: caso você use uma GPU Intel Xe e o Gerenciador de Taxonomia não seja exibido corretamente, recomendamos atualizar o driver gráfico para a versão mais recente. Para obter mais informações, consulte esta página.
Serialize()
: Ao ser requisitado em um objetoDocumentTaxonomy
, o métodoSerialize()
retorna uma representaçãoJSON
do objeto, para que possa ser armazenado e recuperado para uso posterior.Deserialize(String)
: a extensão estáticaDocumentTaxonomy.Deserialize(jsonString)
retorna um objetoDocumentTaxonomy
, hidratado com os dados codificados JSON transmitidos como um parâmetro.GetFields(String)
: Ao ser requisitado em um objetoDocumentTaxonomy
, o métodoGetFields()
chamado com uma stringDocumentTypeId
retorna uma lista de campos definidos dentro desse tipo de documento.
O Gerenciador de Taxonomia pode ser usado para criar e editar um arquivo de Taxonomia específico para seu projeto de automação atual. Este arquivo de Taxonomia contém tipos de documentos definidos pelo usuário, organizados em Grupos e Categorias.
Você pode aproveitar ainda mais o arquivo de Taxonomia convertendo-o em um tipo de dados .NET com a atividade Load Taxonomy e, em seguida, passando-o como entrada para atividades como:
- Classificar Escopo do Documento
- Train Classifiers Scope
- Escopo de Extratores de Treinamento
- Present Validation Station
O Gerenciador de Taxonomia pode ser acessado somente após a instalação de um pacote UiPath.IntelligentOCR.Activities versão v1.6.0 ou superior como dependência para seu projeto. Após a instalação do pacote, um botão para o Gerenciador de Taxonomia aparece na faixa de opções, na seção Assistentes.
A janela do Gerenciador de Taxonomia permite criar tipos de documentos, organizados por grupos e categorias. Quando aberta pela primeira vez em um projeto, nenhum grupo, categoria ou tipo de documento é definido.
O primeiro passo é criar um grupo ou um tipo de documento. A diferença entre os dois é que um grupo envolve uma estrutura hierárquica, enquanto um tipo de documento pode ser criado como um único arquivo. Um projeto complexo implica a criação de grupos, categorias e tipos de documentos; um projeto simples pode exigir apenas um ou dois tipos de documentos.
Criando um Grupo
Quando um grupo é criado, também é necessária uma categoria para o tipo de documento que você deseja criar dentro do grupo. Isso é feito usando o botão Grupo. Depois de escolher um nome para seu grupo, você pode salvá-lo usando o botão Salvar ou usando a tecla Enter.
Criando uma Categoria
Depois que um grupo é definido e selecionado, você pode criar uma Categoria e/ou um Tipo de Documento dentro do grupo, usando seus botões definidos. Selecione Salvar ou use a tecla Enter para salvar a configuração.
Criando um Tipo de documento
Um Tipo de documento pode ser criado como parte de um grupo ou como um documento isolado. Quando criado dentro de um grupo, certifique-se de que o grupo esteja selecionado e, em seguida, selecione Tipo de documento.
Se o Tipo de Documento for criado como um único arquivo, certifique-se de que nenhum grupo esteja selecionado e selecione Tipo de Documento. Depois de selecionar Tipo de Documento, insira um nome para o arquivo e selecione Salvar.
Selecionar um Tipo de documento já criado permite alterar seu nome, copiar seu ID exclusivo para a área de transferência, reatribuí-lo a outro grupo/categoria ou remover a categorização. Você também pode inserir um código para o tipo de documento.
Group.Category.Document
e pode ser copiado para a área de transferência. O código de ID do tipo de documento é uma funcionalidade opcional e pode ser usado para localizar seus documentos ou mapear seus documentos para os tipos de documento definidos na taxonomia.
Como criar campos
Quando o Tipo de Documento é selecionado, o botão Campo fica disponível para você criar um novo campo. Depois que o botão Campo for selecionado, você pode inserir um nome para ele e selecionar seu tipo na lista suspensa.
A categoria Campo tem duas guias: Detalhes e Regras. A guia Detalhes fornece informações sobre o campo selecionado, como Nome do campo, tecla de atalho atribuída ou tipo de campo, enquanto a guia Regras permite que você crie regras que precisam ser atendidas pelo resultado da extração para o campo.
Os tipos de campos disponíveis são os seguintes:
- Texto
- Número
- Data - A escolha desse tipo também permite que você especifique um formato esperado, que é opcional.
Observação:
Se você quiser adicionar um formato esperado, use um formato compatível com o MSDN (MicroSoft Developer Network).
Este formato pode ser usado por extratores e é usado pela atividade Data Extraction Scope ao tentar analisar uma Data em suas partes constituintes de Dia, Mês e Ano.
- Name
- Address
- Definir - Escolher esse tipo permite que você adicione vários valores ao campo de uma lista preestabelecida.
- Booleano
- Tabela - A escolha desse tipo permite que você edite a estrutura da tabela, pois você pode adicionar colunas e editar seu nome e tipo.
Aba Detalhes
Depois que o novo Campo for criado, selecione-o para visualizar mais informações. Por padrão, quando você abre um campo, a guia Detalhes é exibida permitindo que você modifique o nome, cor ou tecla de atalho do campo. Você também pode especificar se é multivalor (É multivalor) ou se permite que valores sem evidência no documento sejam processados (Requer referência).A opção multivalor permite que um campo tenha vários valores, sem ser restrito a uma lista específica.
- É multivalor: se um campo for definido como multivalor, você pode ter mais de um valor relatado para esse campo específico.Por exemplo, você deseja extrair uma "Lista de Diretores" onde o número de entradas pode variar.Imagine um campo de vários valores como uma tabela de coluna única.
- Requer referência: quando um campo requer referência, você pode adicionar um valor a ele apenas se selecionar algo do documento que você vê na Estação de Validação. Para campos especiais nos quais você deseja capturar valores que talvez não sejam visíveis no documento, você pode alternar Requer referência para Off. O efeito será que o usuário poderá adicionar um valor sem especificar um local no documento de onde esses valores vêm.
Você também pode selecionar o Tipo do campo na lista suspensa ou adicionar um valor Padrão. Use o campo Valor padrão para definir valores a serem preenchidos no Resultado da extração, caso não haja valor para o campo identificado no documento.
- Somente leitura: se estiver habilitado, o validador manual pode visualizar quaisquer notas do validador definidas no campo ExtractionResult no Validation Station como uma mensagem. Se desabilitado (estado padrão), o validador humano também pode editar essa nota no Validation Station e, assim, comunicar de volta ao robô informações sobre a decisão tomada.
- Texto: se Texto estiver selecionado, a nota do validador é exibida como uma mensagem de texto (ou texto editável, quando a edição está habilitada) no Validation Station. O validador humano pode exibir, editar ou adicionar uma mensagem de no máximo 200 caracteres no Validation Station.
- Opções: se você selecionar Opções, você pode configurar uma série de botões de opção que a validação manual pode visualizar e, se não for somente leitura, selecionar na Estação de Validação. É possível adicionar no máximo 10 opções.
GetFieldValidatorNotes(<fieldId>)
e SetFieldValidatorNotes(<fieldId>, <validatorNote>)
.
Os campos criados podem ser excluídos usando o botão excluir que aparece ao lado ou reordenados usando a função arrastar e soltar.
Um campo também pode ser excluído da janela Detalhes, selecionando Excluir.
Refazendo essas etapas, é possível criar vários grupos, categorias e tipos de documento que você pode filtrar usando o campo Pesquisar.
Aba Regras
As regras de campo ajudam você a otimizar os resultados da extração e validá-los automaticamente ao executar seu fluxo de trabalho. Sua função é aumentar a eficiência da extração e ajudar você a validar facilmente os campos que precisam de atenção na Estação de validação, destacando-os. Você pode criar várias regras que se aplicam a um campo.
Você define uma regra definindo o tipo de avaliador e o nível de criticidade.
Tipo de avaliador
Use o Tipo de avaliador para especificar como as regras definidas devem ser avaliadas. Existem dois tipos de avaliadores que você pode escolher: AND, OR.
Tipo de avaliador |
Description |
Exemplo |
---|---|---|
AND |
Use esse tipo de avaliador quando todas as regras precisarem ser executadas. |
Regra : O número da fatura começa com A e termina com X.
|
OU |
Apenas uma das regras precisa ser executada. |
Regra : O número da fatura começa com A OU é 123.
|
Nível de criticidade
Indica a criticidade de todas as regras definidas para um campo. Você não pode definir um nível MUST se a regra for quebrada na sessão da Estação de Validação. Existem dois níveis de criticalidade que você pode escolher: MUST, SHOULD.
A regra criada é acionada assim que o nível de criticidade definido é identificado.
Quando você deseja enviar uma regra, uma regra MUST requer 100% de sucesso, caso contrário, a operação de envio falha. Uma regra DEVERIA permitir que você a envie mesmo se a regra for quebrada.
Você sempre pode verificar se uma regra é quebrada usando o método do ajudante da classe Classe ExtractionResult, que reside no pacote de atividades UiPath.DocumentProcessing.Contracts.
Description | |
---|---|
MUST |
Use este nível de criticidade quando a regra criada for imperativa para ser incluída no processo de Resultado da Extração. |
SHOULD |
Use este nível de criticalidade quando a regra criada for opcional. |
Depois de selecionar o Tipo de avaliador e o Nível de criticidade, você deve definir um tipo aplicável à sua regra recém-criada. Existem várias opções que você pode escolher. Aqui está uma lista completa com todos os disponíveis:
- Não está vazio
- Valores possíveis
- Inicia com
- Termina com
- Contém
- Comprimento fixo
- É email
- RegExObservação: o tipo de campo para o qual você criou uma regra dita o número de tipos de regras possíveis dos quais você pode selecionar um. Por exemplo, um campo do tipo Texto exibe todos os tipos de regras possíveis, enquanto um campo do tipo Data exibe apenas dois tipos de regras, Não vazio e valores Possíveis.
Tipo de regras
Description | Tipo de campo | Nível de criticidade | Tipo de avaliador | |
---|---|---|---|---|
Não está vazio | O valor extraído não pode estar vazio, o que significa que o campo é obrigatório. Se o valor estiver ausente, a validação/entrada manual será necessária. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Valores possíveis | O usuário define todos os valores possíveis e os dados extraídos são um dos valores adicionados como entrada ao criar a regra (por exemplo, Tipo de empregador é "tempo integral", "meio período" ou "estágio"). | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Expression | Defina expressões matemáticas que atuam como uma regra para extrair dados. | Aplicável aos campos do tipo número.
Uma condição é obrigatória ao configurar a regra. Escolha uma das seguintes opções:
Uma expressão matemática é necessária. Use os operadores predefinidos para definir sua expressão. Verifique os seguintes exemplos:
|
MUST SHOULD | AND
OU |
Inicia com | Esta é uma regra fixa, o que significa que o valor extraído precisa começar com um dos valores adicionados pelo usuário. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Termina com | Esta é uma regra fixa, o que significa que o valor extraído precisa terminar com um dos valores adicionados pelo usuário. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Contém | Esta é uma regra fixa, o que significa que o valor extraído precisa conter um dos valores adicionados pelo usuário. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Comprimento fixo | Esta é uma regra fixa, o que significa que o valor extraído precisa ter um determinado comprimento fixo. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
É email | Esta é uma regra fixa, o que significa que o valor extraído precisa ser escrito em um formato de e-mail. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
RegEx | Esta é uma regra fixa, o que significa que o valor extraído precisa conter uma expressão regular semelhante a um dos valores adicionados pelo usuário. | Aplicável aos campos dos seguintes tipos:
|
MUST SHOULD | AND
OU |
Usando Regras
- Selecione um campo no painel Taxonomia.
- Acesse a guia Regras.
- Selecione Adicionar novo, para adicionar uma nova regra.
- Digite a regra
full address
, para a qual o Tipo é Contém e a Expressão ést, str, street
. - Escolha o Tipo de avaliador.
Nesse exemplo, selecione OR.
- Escolha o nível de Criticidade.
Nesse exemplo, selecione MUST.
- Selecione Adicionar novo.
- Digite a regra
phone number
, para a qual o Tipo é Não está vazio. - Selecione Adicionar novo.
- Digite a regra
city or state
, para a qual o Tipo é Contém e a Expressão écity, state
.
A imagem animada a seguir mostra as etapas descritas anteriormente.
Outras opções
Editando
Você pode Editar o nome de qualquer grupo, categoria ou tipo de documento criado. Isso pode ser feito selecionando um dos três níveis de configuração e editando o campo Nome.
Excluindo
Grupos, categorias e tipos de documento também podem ser excluídos. Há duas opções disponíveis:
- Selecione Excluir , no elemento pai do objeto que você deseja excluir.
- Selecione Excluir ao selecionar o objeto que você deseja excluir.
Em ambos os casos, um pop-up é exibido pedindo que você confirme a ação de exclusão. Selecione Excluir para aprovar a ação.
Personalização e acessibilidade
Uma tecla de atalho e uma cor são alocadas automaticamente para o campo recém-criado. Você pode usá-las para melhor visibilidade e navegação mais rápida em sua taxonomia. Personalize-as clicando na tecla de atalho ou no campo do código de cores.
Um campo personalizado com cor e tecla de atalho pode instruir a Estação de Validação e o Gerenciador de Modelos a usar a cor atribuída ao exibir o campo e a usar a tecla de atalho atribuída como um atalho para fornecer valores aos campos. Acesse Estação de validação para obter mais informações sobre como usar os atalhos de campo para atribuir valores a um campo.
Para atribuir uma cor e uma tecla de atalho para um campo, selecione o campo e escolha um código de cor específico no campo Cor e, em seguida, selecione uma tecla de atalho específica no menu Tecla de atalho.
Navegue pelo Gerenciador de Taxonomia usando os atalhos de teclado. Selecione Mostrar atalhos de teclado disponíveis e ative a opção Alternar atalhos de teclado para evitar o disparo acidental dos atalhos de teclado. Os nós também podem ser recolhidos.
taxonomy.json
específico para seu projeto.