Salut,
Je pense avoir trouvé un bug dans awk (enfin mawk, version wheezy).
J’avais besoin de virer les tags HTML d’un fichier à la barbare, j’aurais pu le
faire en perl :
cat /tmp/html | perl -ne '{s/<.+?>/ /g; split > 0 && print}'
Mais bon, j’ai pris awk :
awk '/.*/ {gsub("<[^>]+>"," ")} NF > 0 {print}' /tmp/html
Ca marche mais je voulais faire une recherche moins avide (moins “greedy” quoi…), à la perl, seulement j’ai fait une typo :
# ATTENTION CETE COMMANDE BOUFFE LA RAM
awk '/.*/ {gsub("<.+*>"," ")} NF > 0 {print}' /tmp/html
Mon PC se retrouve à moitié bloqué dû à une allocation de memoire en boucle (un peu comme une bombe malloc…)
J’ai appris entre temps que les recherches greedy avec mawk c’est pas possible. Mais il nous reste ce bug…
Alors la question c’est : je fais un rapport sur le BTS ?
Merci d’avance.