Document Processing

De PDF para JSON em minutos. Conheça o BotCity Docs.

Descubra agora uma nova abordagem que imita a forma como a visão humana lida com a leitura de documentos

Os aplicativos e serviços corporativos têm a necessidade constante de ler, analisar e obter informações de uma enorme variedade de documentos, como faturas, contracheques, documentos fiscais e outros.

Ao lidar com formatos estruturados, como CSV ou planilhas, a tarefa é trivial, mas quando se trata de documentos PDF digitalizados ou baseados em texto e imagens, isso se torna uma dificuldade.

Para resolver esse problema, os desenvolvedores geralmente usam expressões regulares (regex) ou convertem o documento em um formato estruturado como XML para analisá-lo. Este processo não é apenas muito trabalhoso dependendo do número de campos no documento, mas também é altamente sensível a alterações no documento ou campos ausentes.

Os serviços de pagamento por página baseados em nuvem que oferecem uma combinação de modelos pré-criados e geradores de analisadores de documentos baseados em IA estão na moda, mas na maioria das vezes esses serviços são de nicho e quando expostos a documentos fora do escopo predefinido de modelos disponíveis estes serviços conseguem apenas lidar com alguns dados tabulares estruturados de PDFs baseados em texto. Além disso, é necessário um esforço considerável e um grande conjunto de dados para treinar o modelo de IA que analisará os arquivos com um nível de confiança aceitável para processar um lote de documentos com sucesso.

Nós, humanos, somos mais resilientes a mudanças em documentos quando se trata de mudanças de posicionamento pois nossa visão e cérebro estão sempre procurando uma relação entre rótulos e valores.

Vamos falar sobre o BotCity Documents

BotCity Documents é um framework que permite criar facilmente analisadores e ler documentos, usando as linguagens de programação Python ou Java, da mesma forma que você leria naturalmente um documento, estabelecendo uma relação entre rótulos e campos.

Usando a interface intuitiva do BotCity Studio e a geração automática de código junto com o framework BotCity Documents para análise de documentos, o código para analisar um determinado campo no documento é gerado de maneira bastante simples:

Passo 1 – Selecione o campo no documento

Passo 2 – Selecione a área de leitura para o campo escolhido

Passo 3 – Código é gerado automaticamente

Esse processo é repetido para cada campo no documento que você precisa ler e seu leitor personalizado é criado em minutos.

Ao aproveitar os plugins da BotCity para integrar seu código ao seu provedor de OCR favorito, como Google Cloud Vision, Azure Cognitive Services ou até mesmo o projeto de código aberto Tesseract, leitores criados com BotCity Documents podem ser estendidos para lidar de forma transparente não apenas com PDFs baseados em texto, mas também digitalizados e arquivos de imagem usando o código.

Tudo isso significa menos dor de cabeça criando vários leitores, analisadores e integração com serviços de terceiros.

Dê uma olhada no BotCity Documents em ação e veja como você pode aumentar a produtividade de sua equipe construindo analisadores não apenas mais rápidos, mas de maneira sustentável e confiável.

Head of Developer Experience @ BotCity.

Leave a Reply

%d bloggers like this: