- Visão geral
- Automação de Interface Gráfica
- Sobre o pacote de atividades UIAutomation
- Aplicativos e tecnologias automatizados com a Automação de Interface Gráfica
- Compatibilidade do projeto
- UI-ANA-016 - Extrair URL de navegador aberto
- UI-ANA-017 - ContinuarComErro verdadeiro
- UI-ANA-018 - Listar atividades de OCR/Imagem
- UI-DBP-006 - Uso do contêiner
- UI-DBP-013 - Uso Incorreto da Automação do Excel
- UI-DBP-030 - Uso de variáveis proibidas em seletores
- UI-DBP-031 - Verificação de atividades
- UI-PRR-001 - Simular clique
- UI-PRR-002 - Simular Digitação
- UI-PRR-003 - Uso incorreto do aplicativo aberto
- UI-PRR-004 - Atrasos Embutidos em Código
- UI-REL-001 - Idx grande em Seletores
- UI-SEC-004 - Dados de e-mail do seletor
- UI-SEC-010 — restrições de app/URL
- UI-USG-011 - Atributos não permitidos
- UX-SEC-010 — restrições de app/URL
- UX-DBP-029 - Uso de senha não segura
- UI-PST-001 - Nível de log de auditoria nas configurações do projeto
- Ferramenta de Migração de Navegador do UiPath
- Região do Recorte
- Computer Vision Recorder
- Índice de atividades
- Ativar
- Anchor Base
- Anexar Navegador
- Anexar Janela
- Block User Input
- Texto Explicativo
- Marcar
- Click
- Clicar na Imagem
- Click Image Trigger
- Click OCR Text
- Clicar no Texto
- Click Trigger
- Close Application
- Fechar Guia
- Close Window
- Context Aware Anchor
- Copy Selected Text
- Element Attribute Change Trigger
- Element Exists
- Element Scope
- Element State Change Trigger
- Export UI Tree
- Extrair Dados Estruturados
- Find Children
- Localizar Elemento
- Localizar Imagem
- Find Image Matches
- Find OCR Text Position
- Localizar Elemento Relativo
- Find Text Position
- Get Active Window
- Get Ancestor
- Get Attribute
- Get Event Info
- Get From Clipboard
- Obter Texto Completo
- Get OCR Text
- Get Password
- Get Position
- Get Source Element
- Get Text
- Obter Texto Visível
- Voltar
- Avançar
- Ir para a Página Inicial
- Google Cloud Vision OCR
- Hide Window
- Highlight
- Hotkey Trigger
- Hover
- Focalizar Imagem
- Hover OCR Text
- Focalizar Texto
- Imagem Existe
- Indicate On Screen
- Inject .NET Code
- Inject Js Script
- Invoke ActiveX Method
- Key Press Trigger
- Carregar Imagem
- Maximize Window
- Microsoft Azure Computer Vision OCR
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Minimize Window
- Monitorar eventos
- Mouse Trigger
- Move Window
- Navegar Para
- OCR Text Exists
- On Element Appear
- On Element Vanish
- Aparecer Na Imagem
- Desaparecer Na Imagem
- Abrir Aplicativo
- Abrir Navegador
- Atualizar Navegador
- Replay User Event
- Restore Window
- Save Image
- Select Item
- Select Multiple Items
- Enviar Tecla de Acesso
- Set Clipping Region
- Set Focus
- Set Text
- Set To Clipboard
- Set Web Attribute
- Show Window
- Iniciar Processo
- System Trigger
- Take Screenshot
- Tesseract OCR
- Texto Existe
- Dica de ferramenta
- Type Into
- Digitar Texto Seguro
- Use Foreground
- Wait Attribute
- Esperar Elemento Desaparecer
- Aguardar Imagem Desaparecer
- Verificação de acessibilidade
- Application event trigger
- Block User Input
- Check/Uncheck
- Check App State
- Check Element
- Click
- Click Event Trigger
- Drag and Drop
- Extract Table Data
- Localizar elementos
- For Each UI Element
- Get Browser Data
- Obter Área de Transferência
- Get Text
- Get URL
- Go To URL
- Highlight
- Hover
- Inject Js Script
- Keyboard Shortcuts
- Keypress Event Trigger
- Mouse Scroll
- Navigate Browser
- Select Item
- Set Browser Data
- Definir Área de Transferência
- Set Runtime Browser
- Set Focus
- Set Text
- Take Screenshot
- Type Into
- Unblock User Input
- Use Application/Browser
- Window operation
- Realize pesquisa no navegador e recupere resultados usando APIs de Automação de interface gráfica
- Navegação na Web
- Localizar imagens
- Clicar em imagens
- Disparar e monitorar eventos
- Criar e substituir arquivos
- Páginas HTML: extrair e manipular informações
- Manipulação de janelas
- Seleção automatizada de listas
- Localizar e manipular elementos de janela
- Gerenciar automação de texto
- Carregar e processar imagens
- Gerenciar ações ativadas pelo mouse
- Automatizar o runtime de aplicativos
- Execução automatizada de um aplicativo local
- Navegação em navegador
- Automação da Web
- Exemplo de escopo de disparador
- Habilitar o suporte de Automação de Interface Gráfica no DevExpress
- Computer Vision Local Server
- Automação Móvel
- Notas de versão
- Sobre a arquitetura de automação de dispositivos móveis
- Compatibilidade do projeto
- Get Log Types
- Get Logs
- Get Page Source
- Get Device Orientation
- Get Session Identifier
- Instalar Aplicativo
- Gerenciar Aplicativo Atual
- Manage Other App
- Open DeepLink
- Abrir URL
- Mobile Device Connection
- Deslizar Direcional
- Padrão de Desenho
- Positional Swipe
- Press Hardware Button
- Set Device Orientation
- Take Screenshot
- Obter parte da captura de tela
- Element Exists
- Execute Command
- Get Attribute
- Get Selected Item
- Get Text
- Set Selected Item
- Set Text
- Deslizar
- Tap
- Type Text
- Terminal
- Notas de versão
- Sobre o pacote de atividades Terminal
- Compatibilidade do projeto
- Melhores práticas
- Find Text
- Get Color At Position
- Get Cursor Position
- Get Field
- Obter Campo na Posição
- Obter Área da Tela
- Get Text
- Obter Texto na Posição
- Mover Cursor
- Mover cursor para o texto
- Enviar Tecla de Controle
- Send Keys
- Send Keys Secure
- Set Field
- Definir Campo na Posição
- Terminal Session
- Aguardar Texto do Campo
- Wait Screen Ready
- Aguardar Texto da Tela
- Aguardar Texto na Posição
- APIs de automação codificadas em terminais

Atividades do UIAutomation
Tesseract OCR
UiPath.Core.Activities.GoogleOCR
Extrai uma string e suas informações de um elemento ou imagem de interface gráfica indicado usando o mecanismo Tesseract OCR. Ele pode ser usado com outras atividades de OCR, como Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text e Find OCR Text Position.
- O mecanismo Tesseract OCR usado no UiPath foi atualizado para a versão 4.0. Você pode encontrar mais informações sobre as capacidades desse mecanismo aqui.
- Essa atividade não oferece suporte a documentos rotacionados e, portanto, os resultados são imprevisíveis em tais documentos.
Pré-requisitos
Antes de executar o Mecanismo Tesseract OCR, instale o Visual C++ Redistributable x86 (32 bits) na máquina correspondente. Mesmo que seu sistema operacional seja de 64 bits (x64), você ainda precisa instalar a versão x86 (32 bits). Acesse Downloads mais recentes compatíveis com o Visual C++ Redistribuível para selecionar e instalar a versão do Visual C++ que atende aos seus requisitos.
Limitações
O mecanismo Tesseract OCR não é compatível com o Windows 10 N Edition, porque essa edição do Windows não inclui o Pacote de Recursos de Mídia. Para garantir compatibilidade, recomendamos que você atualize para o Windows 10 Pro, que contém todos os componentes de mídia necessários.
Propriedades
Opções
-
CaracteresPermitidos - O mecanismo OCR extrai a string em questão de acordo com os caracteres especificados aqui.
-
CaracteresNegados - O mecanismo OCR extrai a string em questão sem levar em conta os caracteres especificados aqui.
-
Inverter – Quando essa caixa de seleção estiver selecionada, as cores do elemento de interface gráfica são invertidas antes da coleta. Isso é útil quando o plano de fundo estiver mais escuro que a cor do texto.
-
Idioma - O idioma usado pelo mecanismo OCR para extrair a string do elemento de interface gráfica. Para o mecanismo Google OCR, esse campo precisa conter o prefixo do arquivo do idioma, como "ron" para romeno, "ita" para italiano e "fra" para francês. Você pode encontrar os prefixos de idiomas compatíveis nesta página.
Observação:A pasta Idioma pode ser baixada daqui e adicionada à sua pasta local
%UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata. Após a pasta Idioma ter sido adicionada localmente, certifique-se de reiniciar o aplicativo UiPath Studio. -
ExtrairPalavras - Se esta caixa de seleção estiver marcada, a posição na tela de cada palavra detectada é extraída.
-
Perfil - Escolha um perfil de pré-processamento para a imagem especificada ou elemento de interface gráfica para alcançar uma leitura de OCR melhor. As seguintes opções estão disponíveis: Nenhum - não aplica um perfil de pré-processamento; Tela - pré-processamento adequado para aplicativos de desktop remotos; Digitalizar - pré-processamento adequado para arquivos digitalizados; Legado - usa as configurações padrão do mecanismo para imagens de pré-processamento - essa é a opção padrão.
-
Scale - The scaling factor of the selected UI element or image. The higher the number is, the more you enlarge the image. This can provide a better OCR read and it is recommended with small images. If you want to scale down, values between 0 and 1 are also accepted. By default, the value is 2.
Importante:Imagens de tamanho grande podem resultar em erro quando o fator de escala é maior que 1.
Saída
- Texto - A String extraída. Este campo é compatível apenas com variáveis
string. - Resultado - As palavras extraídas juntamente com sua posição na tela. Este campo é compatível apenas com variáveis
KeyValuePair <rectangle,string>.
Entrada
- Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis
image.
Comum
- DisplayName - O nome de exibição da atividade.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.