[Linux] Wget -r -l <number> ne marche pas si `Content-Encoding: gzip`
Steve Schnepp
steve.schnepp@::1
Ven 29 Mai 18:01:38 CEST 2009
Je ne peux pas tester là, mais "*dont_want_this_in_url*" n'est pas une
regex, c'est une wildcard-expression. Un petit article expliquant les
différences entre les 2 est :
http://www.cfengine.org/confdir/regex.html
Dans une regex, le * est un indicateur de multiplicité qui demande 0 à
N fois le caractère devant lui.
Il faut donc plutôt utiliser ".*dont_want_this_in_url.*" pour faire ce
que tu penses.
Toutefois, je ne suis pas sûr au vu de la doc que -b est bien la bonne
option. Il te faudrait à mon avis utiliser
-I <regex> : Don't handle files matching this pattern
^ Ceci est un "i" majuscule... [ avec une police proportionnelle ça
ne se voit pas trop trop ]
--
Steve Schnepp <steve.schnepp@::1>
http://blog.pwkf.org/
2009/5/29 Olemis Lang <olemis@::1>:
> 2009/5/29 Steve Schnepp <steve.schnepp@::1>:
>> Sinon il y a aussi cURL[1] pour le download et curlmirror[2] pour un
>> download récursif
>>
>> [2] http://curl.haxx.se/programs/curlmirror.txt
>>
>
> Châpeau !
>
> Ça marche, merci bcp, mais maintenant j'ai d'autres doutes:
>
> Q: Comment doit-on écrire les regex pour filtrer les URLs à télécharger ?
>
> Ça ne marche pas et j'en ai besoin ... ;) Voici ce q j'ai fait :
>
> {{{
> $ ../bin/curlmirror.pl -d 3 -s 20 -p -v -a "--compress" -o ./dest -t
> /tmp/mpl -b "*dont_want_this_in_url*" <url>
> }}}
>
> Ce que je veux c'est ne pas télécharger
> http://exemple.com/dont_want_this_in_url.html
>
> ;^)
>
> --
> Regards,
>
> Olemis.
>
> Blog ES: http://simelo-es.blogspot.com/
> Blog EN: http://simelo-en.blogspot.com/
>
> Featured article:
> Oracle : por más que engorda sigue subiendo ... -
> http://feedproxy.google.com/~r/simelo-es/~3/ndKoYi3D-kg/oracle-por-mas-que-engorda-sigue.html
>
Plus d'informations sur la liste de diffusion linux