Home/
 www.icosaedro.it 

 HTMLLint

HTMLLint è un validatore di codice HTML conforme alle specifiche WA2CA TR0-1A. Ho scritto questo programmillo per dare una controllata alle pagine del mio sito. Prima di questo controllo le mie pagine non raggiungevano neppure il livello WA2CA B0-1A. Adesso vanno molto meglio. Non c'è molto altro da dire.

Scherzi a parte, un validatore è necessario quando le pagine del sito sono tutte generate dinamicamente, com'è il caso del mio sito dove anche le pagine *.html sono in realtà dei programmi. In questo caso un editor HTML non serve.

Altra motivazione: ottenere un parser HTML che permette di filtrare il codice immesso dagli utenti nelle dialog box, come in un blog o in un wiki. Ad esempio, si potrebbe dare al programma l'elenco dei tag e degli attributi ammissibili e ordinargli di spazzare via il resto.

Un'altra funzionalità ancora è l'estrazione di informazioni da pagina WEB: una piccola modifica al programma e si possono estrarre i link HREF, oppure le immagini, oppure determinate informazioni. Insomma, una specie di analizzatore che svolge un lavoro simile ai motori di ricerca. Il bello di avere un programma semplice e facilmente modificabile apre la strada a vari utilizzi non appena lo si desidera.

Funzionalità implementate

Funzionalità NON implementate

Troppe per elencarle. Ignora bellamente gli SCRIPT e il JavaScript. Molti attributi non li conosce. Qualche tag manca perché non lo uso. Ignora i fogli di stile.

Esempio

Con due comandi si può controllare tutto un sito. Il primo comando scarica tutto il sito nella directory locale. Il secondo comando seleziona i file *.html e li invia uno ad uno a htmllint tramite il comando xargs. Eccoli:

$ wget -r http://www.sito.it
$ find www.sito.it -type f -name '*.html' | xargs -n 1 htmllint

Download

Versione stabile: htmllint-0.1-20080406.tar.gz (36 KB)

Ultima versione allo sviluppo: vedi server CVS.


Umberto Salsi
Commenti
Contatto
Mappa
Home/
Still no comments to this page. Use the Comments link above to add your contribute.