<div dir="ltr"><div>Merci Christophe d'avoir pris le temps de répondre. Je suis pas trop fort en SQL mais ça aurait été une bonne solution je pense.</div><div><br></div><div>Mais finalement j'ai réussi à trouver mon bonheur. Le mot clé manquant dans mes recherches était "crawler" et je suis tombé sur diskover <a href="https://github.com/shirosaidev/diskover">https://github.com/shirosaidev/diskover</a> . Ça me semble très prometteur, à base d'elastic search.<br></div><div><br></div><div>J'ai monté une maquette avec le docker compose de <a href="http://linuxserver.io">linuxserver.io</a> <a href="https://hub.docker.com/r/linuxserver/diskover/">https://hub.docker.com/r/linuxserver/diskover/</a> et après avoir réglé un souci de droit du container elasticsearch, ça tourne. J'ai pas encore tout explorer, mais ça répond à mon besoin primaire.</div><div><br></div><div>Bonne journée,</div><div>Pierre-damien<br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Le mer. 5 juin 2019 à 15:54, Christophe Courtois <christophe@courtois.cc> a écrit :<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On 05/06/2019 12:51, <a href="mailto:pdga@free.fr" target="_blank">pdga@free.fr</a> wrote:<br>
> Je cherche en vain une solution "simple" pour juste indexer les fichiers (le contenu n'est pas nécessaire) d'un serveur de fichiers avec plusieurs millions de fichiers.<br>
> Ensuite j'aimerais pouvoir faire des recherches de type : fichiers modifiés il y a X ans, taille total et nombre de ces fichiers ; exclure certains types et/ou certaines extensions ça serait pas mal aussi (peut-être le faire au niveau de l'indexation ?)<br>
> Pour l'instant je fais un find avec du -mtime Xjours et du printf qui m'affiche la date de modification que je mets dans un fichier texte, puis du wc -l et un awk qui m'aide à additionner les tailles. Bon ça marche mais c'est pas très dynamique, les updates sont pas faciles (on refait tout), ...<br>
<br>
> J'ai regardé du côté de Solr mais pfff pas facile, y'a beaucoup à faire à la main<br>
> Elastic search, pas facile non plus.<br>
> Les "desktop file search" (catfish, fsearch, recoll, ...) : je n'arrive pas à sortir ce que je veux, la taille total par exemple. Exporter aussi les résultats non plus.<br>
(etc)<br>
> Alors je me dis : "suis-je le premier sur la planète à vouloir ça ???" :) ou alors je fais pas les bonnes recherches.<br>
<br>
Si le problème d'insérer les données (nom, chemin, date, taille) dans un<br>
outil externe est déjà résolu (un CSV suffit), une bête base de données<br>
classique genre PostgreSQL n'est-il pas l'idéal?<br>
<br>
Recherche et agrégations rapides, export sous le format que tu veux...<br>
<br>
Moi aussi je me dis que tu n'es pas le premier à le vouloir...<br>
<br>
<br>
-- <br>
Christophe Courtois<br>
</blockquote></div></div>