[Linux] parser un document pdf

Cyril Chaboisseau cyril.chaboisseau@::1
Lun 30 Mar 14:04:07 CEST 2020


* Jérôme Kieffer <jerome.kieffer@::1> [2020-03-26 12:18 +0100]:

> On Thu, 26 Mar 2020 11:09:11 +0100 (CET)
> Bernard Schoenacker <bernard.schoenacker@::1> wrote:
> 
> > je souhaiterai pouvoir extraire le texte d'un document PDF 
> > et avec les outils classique je n'obtiens que des "injures" 
> > 
> > voici le lien:
> > https://www.alibabacloud.com/Handbook_of_COVID_19_Prevention_en_Mobile.pdf
> 
> libreoffice s'en sort vachement bien !

pour une version ligne de commande, il y a pdftotext (paquet poppler-utils) qui
est aussi très bon

-- 
	Cyril Chaboisseau


Plus d'informations sur la liste de diffusion linux