- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Abbyy Document OCR
UiPath.AbbyyEmbedded.Activities.AbbyyDocumentOCR
Verifique o cronograma de descontinuação para obter mais detalhes.
Extrai uma string e informações associadas sobre o conteúdo textual de imagens de documentos usando o Abbyy OCR Engine. A atividade pode ser usada em qualquer cenário de documento em que um mecanismo de OCR seja necessário, por exemplo, a atividade Digitalizar documento ou a atividade Ler PDF com OCR .
Abbyy Document OCR requer que seu Robot esteja conectado a uma instância do Orchestrator que tenha unidades ABBYY FRE12 disponíveis. Esta atividade é compatível apenas com o Orchestrator 20.10 ou superior
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
-
Imagem - A imagem que você deseja processar. Este campo suporta apenas variáveis de imagem .
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Opções
- CustomRecognitionProfilePath - especifica o caminho completo para um perfil de reconhecimento personalizado. Este campo suporta apenas strings e variáveis
String
. - EnginePack - Fornece o mecanismo incorporado que precisa ser usado a partir das duas opções disponíveis. O Basic EnginePack contém suporte para a maioria dos idiomas, exceto aqueles com caracteres CJK. O CJK EnginePack contém suporte para os idiomas chinês, japonês e coreano
- ExtractWords - Se selecionado, a posição na tela de cada palavra detectada é extraída.
- Idioma - O idioma usado pelo mecanismo de OCR para extrair o texto do elemento de interface gráfica ou imagem. O nome do idioma deve ser escrito inteiro, por exemplo, "inglês", "japonês", "romeno". O valor padrão é
"English"
.Se você quiser usar um dos seguintes idiomas chinêsPRC, chinêsTaiwan, japonês, coreanoe coreanoHangul , será necessário instalar um pacote separado disponível no menu Gerenciar pacotes .
- Escala - O fator de escala do elemento de interface gráfica ou imagem selecionada. Quanto mais alto o número, mais a imagem é ampliada. Isso pode fornecer uma leitura melhor de OCR e é recomendado para imagens pequenas. Se você quiser reduzir a escala, valores entre 0 e 1 também são aceitos. Por padrão, o valor é
1
.
Saída
- Confiança - A pontuação de confiança resultante, armazenada em uma variável
Int32
. Este campo suporta apenasInt32
variáveis. - Resultado - O texto extraído pelo mecanismo de OCR junto com sua posição na tela, armazenado em um
KeyValuePair<Rectangle,String>
. Este campo suporta apenasKeyValuePair<Rectangle,String>
. -
Texto - O texto extraído pelo mecanismo de OCR, armazenado em uma variável String. Este campo suporta apenas
String
variáveis.
Idiomas suportados |
---|
abecásia |
Adyghe |
Africâner |
Agul |
Albanês |
altaico |
Árabe |
armênio oriental |
ArmenianGrabar |
armênio ocidental |
Awar |
aimará |
AzeriCirílico |
azerilatino |
Basquir |
Basco |
Bielorrusso |
bemba |
Blackfoot |
Bretão |
Bugotu |
Búlgaro |
Birmanês |
Buriate |
Catalão |
Chamorro |
Checheno |
Chukcha |
Chuvache |
corso |
CrimeanTatar |
Croata |
Corvo |
Checo |
Dinamarquês |
Dargwa |
Números |
Dungan |
Holandês |
holandês belga |
English |
EsquimóCirílico |
esquimólatino |
esperanto |
Estoniano |
Até |
Evenki |
Ilhas Faroé |
persa |
Fijiano |
Finlandês |
Francês |
frísio |
Friulano |
gaélico escocês |
Gagaúzes |
Galego |
Ganda |
Alemão |
AlemãoLuxemburgo |
AlemãoNovaOrtografia |
Grego |
guarani |
Hani |
Hauçá |
havaiano |
Hebraico |
Húngaro |
Islandês |
Ido |
Indonésio |
inguche |
Interlingua |
Irlandês |
Italiano |
cabardiano |
Kalmyk |
Karachay Balkar |
Karakalpak |
Kasub |
kawa |
Cazaque |
Khakas |
Khanty |
Kikuyu |
Quirguistão |
Congo |
Koryak |
Kpelle |
Kumyk |
curdo |
Lak |
lapão |
Letão |
Lezgin |
Lituano |
luba |
Macedônio |
Malgaxe |
Malaio |
Malinke |
maltês |
Mansi |
maori |
Mari |
maia |
miao |
Minankabaw |
moicano |
mongol |
Mordvin |
náuatle |
Nenets |
Nivkh |
Nogay |
Bokmal norueguês |
Norueguês Nynorsk |
Nyanja |
Ocidental |
Ojibway |
ossético |
papiamento |
Inglês pidgin |
Polonês |
PortuguêsPadrão |
português brasileiro |
provençal |
Quechua |
Rhaetoromânico |
Romeno |
RomenoMoldávia |
romani |
Ruanda |
Rundi |
Russo |
Russo Com Sotaque |
samoano |
Selkup |
Sérvio |
cirílico sérvio |
sérviolatim |
Shona |
sioux |
Eslovaco |
Esloveno |
somali |
sérvio |
sotho |
Espanhol |
sunda |
Suaíli |
suazi |
Sueco |
Tabassaran |
Tagalog |
taitiano |
Tajique |
Tártaro |
Tailandês |
Tinpo |
Tonganês |
tswana |
tun |
Turco |
turcomano |
turcomenolatim |
Tuvin |
udmurta |
UigurCirílico |
Uigurlatim |
Ucraniano |
uzbequecirílico |
uzbequelatim |
Vietnamita |
Visayan |
Galês |
Wolof |
xhosa |
Yakut |
iídiche |
zapoteca |
Zulu |
Pacote de idiomas CJK |
---|
China RPC |
chinêsTaiwan |
Japonês |
Coreano |
coreanoHangul |