[Linux] parser un document pdf
Cyril Chaboisseau
cyril.chaboisseau@::1
Lun 30 Mar 14:04:07 CEST 2020
* Jérôme Kieffer <jerome.kieffer@::1> [2020-03-26 12:18 +0100]:
> On Thu, 26 Mar 2020 11:09:11 +0100 (CET)
> Bernard Schoenacker <bernard.schoenacker@::1> wrote:
>
> > je souhaiterai pouvoir extraire le texte d'un document PDF
> > et avec les outils classique je n'obtiens que des "injures"
> >
> > voici le lien:
> > https://www.alibabacloud.com/Handbook_of_COVID_19_Prevention_en_Mobile.pdf
>
> libreoffice s'en sort vachement bien !
pour une version ligne de commande, il y a pdftotext (paquet poppler-utils) qui
est aussi très bon
--
Cyril Chaboisseau
Plus d'informations sur la liste de diffusion linux