Home/ | www.icosaedro.it | ![]() |
HTMLLint è un validatore di codice HTML conforme alle specifiche WA2CA TR0-1A. Ho scritto questo programmillo per dare una controllata alle pagine del mio sito. Prima di questo controllo le mie pagine non raggiungevano neppure il livello WA2CA B0-1A. Adesso vanno molto meglio. Non c'è molto altro da dire.
Scherzi a parte, un validatore è necessario quando le pagine del sito sono tutte generate dinamicamente, com'è il caso del mio sito dove anche le pagine *.html sono in realtà dei programmi. In questo caso un editor HTML non serve.
Altra motivazione: ottenere un parser HTML che permette di filtrare il codice immesso dagli utenti nelle dialog box, come in un blog o in un wiki. Ad esempio, si potrebbe dare al programma l'elenco dei tag e degli attributi ammissibili e ordinargli di spazzare via il resto.
Un'altra funzionalità ancora è l'estrazione di informazioni da pagina WEB: una piccola modifica al programma e si possono estrarre i link HREF, oppure le immagini, oppure determinate informazioni. Insomma, una specie di analizzatore che svolge un lavoro simile ai motori di ricerca. Il bello di avere un programma semplice e facilmente modificabile apre la strada a vari utilizzi non appena lo si desidera.
<a><b></a></b>
.Troppe per elencarle. Ignora bellamente gli SCRIPT e il JavaScript. Molti attributi non li conosce. Qualche tag manca perché non lo uso. Ignora i fogli di stile.
Con due comandi si può controllare tutto un sito. Il primo comando scarica tutto il sito nella directory locale. Il secondo comando seleziona i file *.html e li invia uno ad uno a htmllint tramite il comando xargs. Eccoli:
$ wget -r http://www.sito.it $ find www.sito.it -type f -name '*.html' | xargs -n 1 htmllint
Versione stabile:
htmllint-0.1-20080406.tar.gz
(36 KB)
Ultima versione allo sviluppo: vedi server CVS.
Umberto Salsi | Commenti | Contatto | Mappa | Home/ |
Still no comments to this page. Use the Comments link above to add your contribute.