Descubra agora uma nova abordagem que imita a forma como a visão humana lida com a leitura de documentos
Ao desenvolver código para ler documentos PDF automaticamente, o uso expressões regulares (regex) ou a conversão do documento para um formato estruturado como XML para analisá-lo são abordagens muito comuns. Em ambos os casos, você precisa descobrir regras específicas (análise de regex ou XML) para cada campo no documento.
Vamos ver um exemplo de análise de alguns campos de documento usando regex:
Agora, analisando um documento XML:
Como pode ser visto, o desenvolvimento do leitor pode ser muito trabalhoso dependendo do número de campos no documento.
Além disso, ambas as abordagens são muito sensíveis a alterações no documento, como omitir um campo ou alterar sua posição. Mesmo que essa alteração pareça mínima ao visualizar o documento, ela pode quebrar o analisador, pois não é baseado na estrutura visual do documento.
Agora, vamos dar uma olhada neste problema de uma perspectiva diferente. Por que os humanos ainda conseguem ler um documento mesmo que a posição ou os campos sejam alterados? A resposta é bem simples: humanos não leem documentos levando em consideração a posição dos campos no documento. Para nós, geralmente, buscamos uma relação entre rótulo e valor:
Em vermelho temos os rótulos que são basicamente a definição do campo em questão e em azul temos o valor. Normalmente, os campos (rótulos e valores) são agrupados por algum contexto para facilitar o processo de leitura, mas se alterarmos a posição dos campos no documento, os humanos ainda poderão entender o documento sem problemas.
E se fosse possível usar o mesmo conceito ao criar analisadores para ler documentos automaticamente? E se houvesse uma ferramenta que permitisse gerar o código do analisador automaticamente conforme você clica nos documentos e valores do campo?
Vamos falar sobre o BotCity Documents
BotCity Documents é um framework que permite criar facilmente analisadores e ler documentos, usando as linguagens de programação Python ou Java, da mesma forma que você leria naturalmente um documento, estabelecendo uma relação entre rótulos e campos.
Usando a interface intuitiva do BotCity Studio e a geração automática de código junto com o framework BotCity Documents para análise de documentos, o código para analisar um determinado campo no documento é gerado de maneira bastante simples:
Passo 1 – Selecione o campo no documento
Passo 2 – Selecione a área de leitura para o campo escolhido
Passo 3 – Código é gerado automaticamente
Esse processo é repetido para cada campo no documento que você precisa ler e seu leitor personalizado é criado em minutos.

Ao aproveitar os plugins da BotCity para integrar seu código ao seu provedor de OCR favorito, como Google Cloud Vision, Azure Cognitive Services ou até mesmo o projeto de código aberto Tesseract, leitores criados com BotCity Documents podem ser estendidos para lidar de forma transparente não apenas com PDFs baseados em texto, mas também digitalizados e arquivos de imagem usando o código.
Tudo isso significa menos dor de cabeça criando vários leitores, analisadores e integração com serviços de terceiros.
Take a look into BotCity Documents in action and see how you can boost your team’s productivity by constructing parsers not only faster but in a maintainable and more reliable way.