Guia Sobre Trabalhar Com PDFs Python
Guia Sobre Trabalhar Com PDFs Python
Guia Sobre Trabalhar Com PDFs Python
Guia rápido
Trabalhando com
PDFs em Python
PyPDF2
@Odemir Depieri Jr
Minerar/Manipular PDF
PyPDF2
Os pdfs fazem parte dos dados não estruturados, o que é diferente seu
tratamento quanto aos dados estruturados (Tabelas, Planilhas e etc).
Lendo um PDF
Com apenas algumas linhas de comando é possível extrair todo o conteúdo do PDF
@Odemir Depieri Jr
Com esse script é possível extrair diversas informações dos PDFs e gerar uma base
analítica com as informações.
Essa técnica é ótima para consolidar as informações dos PDFs.
A coluna com o conteúdo do PDF é perfeita para ser usada para técnicas de
Text Mining.
@Odemir Depieri Jr
Incluindo Criptografia
Final
Esse guia rápido é para ter conhecimentos prévios sobre como utilizar a
biblioteca PyPDF2
Caso queira mais informações, acesse a documentação oficial do
framework.
PyPDF2
Odemir Depieri Jr
Intelligence Analyst Sr
Tech Lead
Specialization AI