- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Classificar Documento – Visualização
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Retrieve Document Validation Artifacts
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades de Document Understanding
Classificar Documento
UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument
Você pode usar essa atividade para classificar documentos, selecionando um classificador desejado e um documento que você gostaria de classificar.
Painel do Designer
- Entrada - Fornece o arquivo de entrada ou o objeto de dados do documento.
Importante: o número máximo de páginas que um arquivo pode ter é 500. Os arquivos que excedem esse limite não são classificados.Dica: quando seus arquivos não são armazenados como uma variável do tipo
IResource
, há uma opção para realizar uma conversão. UseLocalResource.FromPath(<reference_to_the_file>)
no campo de propriedade Entrada para isso.Considere um cenário em que você está iterando por meio de uma lista de arquivos usando uma atividade For Each. Suponha quecurrentItem
seja sua variável de iteração. Para convertercurrentItem
emIResource
, coleLocalResource.FromPath(currentItem)
no campo Entrada. - Projeto do Document Understanding – Requer que você selecione seu projeto do Document Understanding no menu suspenso. As opções disponíveis são:
- Predefinido – Projeto que usa modelos especializados pré-treinados recomendados para cenários padrão.
- Projeto existente do tenant e da pasta aos quais você está conectado
- Você pode criar um novo projeto selecionando o ícone +.
Observação: se você tiver criado mais de 500 projetos em seu tenant e usar a atividade Classify Document, o UiPath Studio ou Studio Web não exibirá nenhum projeto além dos 500 iniciais.Portanto, esses projetos não podem ser usados. - Classificador – Se você estiver usando o projeto Predefinido, você pode selecionar seu classificador de Document Understanding desejado no menu suspenso.
Observação: os dados enviados ao Classificador generativo serão enviados para uma instância de Modelo LLM que não está disponível publicamente, não a deixarão e, quando processados, não serão armazenados ou usados para treinamento.
- Para o projeto Predefinido, você tem duas opções:
- Classificação de ML – Classificador baseado em ML.
- Classificador generativo – O tipo de classificador generativo.
Importante:
Essa funcionalidade faz parte atualmente de um processo de auditoria e não deve ser considerada parte da Autorização do FedRAMP até que a revisão seja finalizada. Veja aqui a lista completa das funcionalidades atualmente em revisão.
- Solicitação – Instruções para identificar Tipos de Documentos, fornecidas como pares de chave-valor, onde a chave representa o nome do Tipo de Documento e o valor uma descrição para ele, ajudando o classificador a identificar esses documentos.
- Tipo de documento - Forneça o nome do tipo de documento a ser usado como resultado da classificação (limite de 30 caracteres).
- Solicitação generativa – Exige que você forneça instruções para o Classificador Generativo sobre como identificar o tipo de documento. O número máximo de caracteres permitidos é 1000.
- Solicitação – Instruções para identificar Tipos de Documentos, fornecidas como pares de chave-valor, onde a chave representa o nome do Tipo de Documento e o valor uma descrição para ele, ajudando o classificador a identificar esses documentos.
- Para o projeto Predefinido, você tem duas opções:
Painel de Propriedades
Opções Avançadas
- Confiança mínima - Especifique o limite mínimo de confiança com base no qual um tipo de documento é atribuído durante a classificação. Se a pontuação de confiança de um documento ficar abaixo desse limite, seu Tipo de documento será relatado como "desconhecido".
Dica: a maioria dos tipos de documentos gera uma previsão com um nível de confiança. A configuração dessa propriedade evita falsos positivos considerando apenas as previsões com um nível de confiança acima do limite. Você pode identificar um nível de confiança ideal testando vários documentos dentro do seu fluxo de trabalho, gravando os resultados em uma planilha do Excel, por exemplo, e, em seguida, analisar qual valor de limite é o mais preciso.
Entrada
- Tempo limite (segundos) - Tempo máximo de execução (em segundos) para a chamada para o modelo generativo. Se a operação exceder esse tempo limite, ela será encerrada automaticamente para evitar atrasos ou travamentos. Essa propriedade é exibida apenas se o Classificador generativo for selecionado como um classificador.
Saída
- Dados do documento - Todos os dados de campo extraídos validados do arquivo.
Para começar rapidamente com os recursos generativos da atividade Classify Document, execute as seguintes etapas:
- Adicione uma atividade Classify Document
- From the Project dropdown list, select Predefined
- Para Classificador, selecione Classificador generativo.
A propriedade Detalhes do Tipo de Documento aparece no corpo da atividade.
- Na coleção Detalhes do tipo de documento, forneça suas instruções como pares de chave-valor do dicionário, em que:
- A Chave representa o Tipo de Documento (exemplo: CV).
- O valor representa o Prompt generativo: a descrição usada pelo classificador generativo para identificar os tipos de documento.
Por exemplo, verifique a tabela a seguir para obter uma amostra de pares de chave-valor:
Tabela 1. Pares de chave-valor usados como um aviso para o classificador generativo Chave Valor CV "Encontre palavras-chave comuns para CVs, como "Eduação", "Habilidades" e "Experiência"." Fatura "Encontrar nomes de campos comuns, como "Número da fatura", "Cobrança de" ou "Valor total"."
Figura 1. Pares de chave-valor usados como um prompt para o classificador generativo