[Linux] convertir un document de tableur en html

Guillaume RENARD guillaume.renard@::1
Ven 29 Déc 08:11:16 CET 2006


Salut Bernard,

Alors pour faire 'simple', il te suffit de créer un pdf et ensuite de
convertir le pdf en html, voici une méthode, bon, c'est un copier/coller de
mon fichier crée à l'aide du site suivant :
http://www.physik.uni-wuerzburg.de/~vrbehr/cups-pdf/<http://www.physik.uni-wuerzburg.de/%7Evrbehr/cups-pdf/>et
http://lacherez.info/wordpress/archives/11
mais ça marche plutôt pas mal.
De plus, cette méthode a l'avantage d'être 'universelle' !!

Bon courage !

===
1.1      Openoffice.org

 [root@::1 ~]# apt-get install openoffice.org

Installe openoffice sur le poste et pour l'utiliser il suffit de taper
ooffice en ligne de commande.

Openoffice est nécessaire car il comprend les formats propriétaires de
Microsoft office.


1.2      Cups

Il était déjà installé mais sinon un apt-get install cups suffit à
l'installer.


1.3      Cups-pdf 1.3.1      Installation

Il faut le télécharger sur le site
http://www.physik.uni-wuerzburg.de/~vrbehr/cups-pdf/<http://www.physik.uni-wuerzburg.de/%7Evrbehr/cups-pdf/>dans
la rubrique téléchargement(download) ou directement ici (
http://www.physik.uni-wuerzburg.de/~vrbehr/cups-pdf/src/cups-pdf_2.4.2.tar.gz<http://www.physik.uni-wuerzburg.de/%7Evrbehr/cups-pdf/src/cups-pdf_2.4.2.tar.gz>
)

Il faut ensuite extraire l'archive

[root@::1 installs]# *tar -xvzf cups-pdf_2.4.2.tar.gz*

Et lire le fichier README qui explique comment faire mais en résumé il faut
procéder de la façon suivante :

On se place dans le dossier où l'archive a été décompressée et ensuite dans
src

[root@::1 installs]# *cd cups-pdf-2.4.2/ *

[root@::1 cups-pdf-2.4.2]# *cd src*

[root@::1 src]# *gcc -O9 -s -o cups-pdf cups-pdf.c*

[root@::1 src]# *cp cups-pdf /usr/lib/cups/backend/*

[root@::1 src]# *cp ../extra/cups-pdf.conf /etc/cups/*

[root@::1 src]# *cp ../extra/PostscriptColor.ppd /usr/share/cups/model/
*

 [root@::1 src]# /*etc/init.d/cups stop*

Arrêt de cups :                                           [  OK  ]

[root@::1 src]# */etc/init.d/cups start*

DÃ(c)marrage de cups :                                       [  OK  ]
 1.3.2      Configuration 1.3.2.1  Destination des fichiers pdf

On rajoute la ligne suivante (on peut la modifier si nécessaire)

Out /home/public/pdf

Dans le fichier */etc/cups/cups-pdf.conf.*

Tous les pdfs générés se trouveront dans ce dossier.


1.3.2.2  Imprimante virtuelle

Il faut créer l'imprimante virtuelle, pour ce faire, on va utiliser
l'interface web de cups

http://goupilux:631




On clique sur Imprimantes ou sur Administrer les imprimantes et ensuite en
bas de la page sur


On s'authentifie





On choisit ensuite le type d'imprimante, cette option est rendue possible
grâce à l'installation de cups-pdf




On s'occupe du driver**



Et du modèle afin de pouvoir prendre en compte la couleur




Et c'est terminé


On peut voir la nouvelle imprimante dans la liste des imprimantes
2         Utilisation

Il suffit de taper la commande suivante (qui peut prendre quelques dizaines
de secondes) :

[root@::1 ~]# *ooffice -invisible -pt PDF test.doc*



Pour générer le fichier test.pdf dans le dossier /home/public/pdf

[root@::1 ~]# *ll /home/public/pdf/*

-rw-------  1 root root 15587 nov 21 15:37 *test.pdf*



Il est possible d'envisager de transformer ce pdf en fichier(s) html pour
rendre un affichage sur un navigateur plus rapide.



Pouvoir le faire en ligne de commande permet de scripter et donc de faire ce
genre de traitement par batch.


3         Transformation en HTML 3.1      Les outils

Il s'agit de *pdftohtml* dont le site officiel est
http://pdftohtml.sourceforge.net/ et un site plus complet :
http://www.framasoft.net/article1563.html.
3.1.1      Installation

Il faut télécharger pdftohtml à l'adresse suivante :

http://belnet.dl.sourceforge.net/sourceforge/pdftohtml/pdftohtml-0.40a.tar.gz



On décompresse

[root@::1 installs]# *tar -xvzf pdftohtml-0.40a.tar.gz*

On compile

[root@::1 installs]# *cd pdftohtml-0.40a*

[root@::1 pdftohtml-0.40a]# *make*

Et on installe dans le path

[root@::1 pdftohtml-0.40a]# *cp src/pdftohtml /usr/local/bin/*

On vérifie

[root@::1 pdftohtml-0.40a]# *pdftohtml -v*

pdftohtml version 0.40 http://pdftohtml.sourceforge.net/, based on Xpdf
version 3.01

Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch

Copyright 1996-2005 Glyph & Cog, LLC
 3.1.2      Utilisation

Il suffit de taper *pdftohtml –c <fichier.pdf>* pour générer la page web
mais attention, plusieurs fichiers sont créés, il est donc prudent de créer
un dossier, d'y copier le pdf et d'ensuite le convertir en html.

Plus d'info en tapant *pdftohtml -h*

===

On 12/28/06, bernard.schoenacker@::1 <bernard.schoenacker@::1>
wrote:
>
> bonjour,
>
> je recherche une solution de script pour convertir un fichier
> csv en un fichier html ...
> je sais qu'il existe tx2html mais le résultat est vraiment
> décevant par rapport à un import dans un tableur
> et à le convertir au format html ....
> je recherche une solution en ligne de commande ...
>
> bonnes fêtes et profitez de faire du foie gras
>
> slt
> bernard
>
>


-- 
Guillaume RENARD
http://glmrenard.free.fr
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: https://strasbourg.linuxfr.org/pipermail/linux/attachments/20061229/82ece233/attachment-0001.htm 


Plus d'informations sur la liste de diffusion linux