Home/
 www.icosaedro.it 

 Mywget

In breve

Questo programma realizza una interfaccia di uso immediato verso il programma wget, il popolare strumento per scaricare file e pagine web. Con wget si possono scaricare alcuni file o interi siti web, e sono disponibili un gran numero di opzioni che rendono lo strumento molto potente. Mywgettk realizza una interfaccia grafica verso il programma wget per facilitare l'uso delle opzioni più comuni.

Storico degli aggiornamenti

2002-07-22
Rilascio versione 1.2.
2002-07-20
Rilascio versione 1.0.


Figura 1. La finestra principale di mywgettk.

In lungo (ovvero: per esteso)

mywgettk presenta una interfaccia grafica su X Window (v. figura 1). Per quanto riguarda l'utilizzo non c'è molto da dire: basta scegliere le opzioni volute e premere il bottone Execute: il programma apre una finestra dove fa scorrere le informazioni sul procedere del download (v. figura 2).

Il programma si può avviare specificando come parametro l'URL desiderato. Segue una breve descrizione delle opzioni del programma. Rimando alla man page del comando wget per una discussione più approfondita.


Figura 2. L'output del programma come appare in una finestra di xterm.

Finestra Main

La finestra principale Main presenta le opzioni di uso più frequente, e spesso è l'unica di cui si ha bisogno (v. figura 1).

URL:
In questo entry box si indica l'URL da cui iniziare il download. Ricordarsi di indicare sempre il protocollo http:// oppure ftp://. E' anche possibile indicare in questa finestra il login da usare seguendo questo schema:

http://user:password@www.unposto.it/a/b/c

ftp://user:password@ftp.unposto.it/a/b/c

Destination dir.:
In questo entry box si indica la directory dove verranno salvati i file scaricati. Il bottone Select permette di accedere anche a una dialog box per la selezione della directory voluta. Lasciando vuoto questo entry box, vine usata la directory corrente.

Download: all, preserve existing, newwer only.
Questo gruppo di tre bottoni radio permette di scegliere il criterio di download: tutti i file incondizionatamente, tutti i file in più rispetti a quelli già presenti nella directory di destinazione, oppure tutti i file più recenti e quelli nuovi.

Download page requisites (images, style sheets, etc.)
Per la visualizzazione corretta e completa, alcune pagine web richiedono altri file accessori contenenti le immagini incluse nella pagina, i suoni, i fogli di stile.

Continue interrupted download
Per ogni file scaricato in una precedente sessione del programma, richiede al server di continuare il download a partire dal punto in cui il file disponibile finisce, questo nella ipotesi che il download del file sia incompleto.

Force .html extension for text/html docs
Se il server dichiara che il tipo del documento è text/html (cioè una normale pagina web) ma l'estensione del nome del file è diversa da .html o .htm, il programma provvede ad aggiungere l'estensione .html in modo da consentire la corretta visualizzazione in locale. Questo problema si presenta tipicamente quando le pagine in questione vengono generate dinamicamente lato server.

Recursive:
Questo checkbox attiva la sezione relativa al download ricorsivo di siti web o di siti ftp.

Limit recursion level to:
In questo entry box si può impostare un limite alla recursione. Ad esempio, un valore di 1 significa che verrà scaricata la pagina web indicata più le pagine web cui essa fa riferimento. Il valore 0 indica recursione infinita.

Follow relative links only
Quando una pagina web fa riferimento a un'altra pagina web con un link relativo, di solito questa seconda pagina è contestualmente legata alla prima e in teressa scaricarla. Viceversa, i link assoluti spesso fanno riferimento ad altre pagine dello stesso sito che non sono strettamente correlate a quella attuale. Questa opzione aiuta a restringere il download alle sole pagine di interesse.

No parent
Attivando questo checkbox vengono scaricate solo le pagine web della directory corrente e inferirori. Eventuali link assoluti o relativi a pagine che si trovano in altre directory vengono ignorati.

Convert links to local
Al termine della sessione di download, il programma provvede a convertire i link delle pagine in link relativi locali, in modo che le pagine scaricate siano navigabili localmente.

Save settings on exit to the file /home/user/.mywgettk.prefs
Le impostazioni del programma vengono salvate all'uscita nel file indicato. Ogni volta che si avvia il programma, lo stesso file viene riletto in modo da presentare la situazione come la si era lasciata. Può essere utile salvare la impostazioni di uso più frequente, e poi il checkbox si può disabilitare.

Bottoni

Show Cmd
Mostra il comando wget completo di tutte le sue opzioni, così come verrà utilizzato dal programma.

Execute
Apre una nuova finestra terminale dove eseguire il comando wget.

Close
Termina il programma, eventualmente salvando le impostazioni correnti.

Finestra "Advanced"

Questa finestra contiene alcune opzioni generali per l'uso avanzato del programma (v. figura 3).


Figura 3. La finestra delle opzioni avanzate.

Terminal: xterm -hold -e
In questa entry box va indicato il programma da usare per la visualizzazione del procedere del download. Il comando wget composto dal programma e completo di tutte le opzioni, viene aggiunto a questa stringa per formare un comando completo da eseguire. Il valore default apre una finestra di terminale virtuale xterm (v. figura 2): in questo caso l'opzione -e è indispensabile!
Naturalmente si possono usare anche altri programmi e altre opzioni. Ecco alcuni esempi interessanti:

xterm -bg black -fg green -hold -e

gnome-terminal -e

(stringa vuota)

Retries:
Il numero di tentativi da eseguire per scaricare una pagina o un file prima di rinunciare. Ci sono varie cause per il mancato download di un documento. Per esempio, alcuni server molto oberati talvolta non rispondono alla prima richiesta e lasciano scadere la richiesta stessa.

Wait between retrievals:
Numero di secondi di attesa tra un tentativo fallito di scaricare un file e il tentativo successivo. Il valore zero significa nessuna attesa: il programma esegue i tentativi impostati in successione senza alcuna attesa tra un tentativo e il successivo.

Limit download rate to:
Opzione per limitare la banda occupata dal programma, espressa in KB/s.

Accept these suffixes or patterns:
Elenco di suffissi di file o di pattern separati da virgola dei file che interessa scaricare. Ha significato solo quando è attivo il download ricorsivo nella finestra principale.

Reject these suffixes or patterns:
Elenco di suffissi di file o di pattern separati da virgola dei file che non si desidera scaricare. Ha significato solo quando è attivo il download ricorsivo nella finestra principale.

Download quota:
Il numero massimo di MB da scaricare, limite oltre al quale il programma cessa l'operazione. Ha significato solo quando è attivo il download ricorsivo nella finestra principale; i file singoli vengono sempre scaricati interamente.

Finestra HTTP

In questa finestra sono disponibile le opzioni avanzate specifiche del protocollo HTTP utilizzato per il WEB (v. figura 4).


Figura 4. La finestra HTTP con le opzioni avanzate per il WEB.

Login to the HTTP server using:
Permette di impostare il nome e la password di login da utilizzarsi con il metodo di autenticazione "basic" o "digest" previsti dal protocollo HTTP. Attenzione! questo metodo non funziona con i siti che richiedono il login da apposita form di input presentata nelle pagine del sito stesso. Funziona invece per i siti nei quali, all'atto del collegamento, il browser stesso propone una apposita finestrella standard di login.

Ignore bogus length from HTTP server
Di norma il server fonisce, per ogni pagina richiesta, l'indicazione della sua lunghezza. Taluni server e talune pagine, invece, possono fornire un valore errato confondendo il programma. Il sintomo classico di questo problema è che il programma ripete più volte i tentativi di download segnalando che il precedente tentativo è fallito per la chiusura prematura del collegamento da parte del server.

Identify to the HTTP server as:
Permette di inviare una stringa di identificazione dell'user agent usato. Taluni siti forniscono un output completo solo se il "browser" utilizzato (nel nostro caso wget) si identifica in un certo modo. Di norma non è necessario attivare questa opzione, a meno che le pagine scaricate appaiano incomplete.

Span across hosts
Nel caso di download ricorsivo, il programma segue anche i link che si estendono su altri server. Raramente è necessario fare uso di questa opzione.

Follow FTP links
Nel caso di download ricorsivo, il programma segue anche i link del sito ma relativi al protocollo FTP.

Use cookies
Alcuni siti prevedono solo la navigazione interattiva con browser, e fanno uso di cookies per tracciare l'utente e le preferenze. La mancanza dei cookies preclude il download. Questa opzione abilita il programma ad accettare i cookies proposti dal server durante la sessione di download, e provvede a reinviarli secondo necessità durante il download delle pagine successive. Una volta terminata la sessione di download, tutti i cookies vengono cancellati.

Finestra FTP

In questa finestra sono disponibile le opzioni avanzate specifiche del protocollo FTP (v. figura 5).


Figura 5. La finestra FTP con le opzioni avanzate per il protocollo FTP.

Anable use of the globbing chars: * ? [ ]
Permette di interpretare i caratteri indicati come caratteri speciali per costruire il pattern dei file desiderati, da indicare nell'URL della finestra principale.

Use passive mode
Usa il protocollo FTP nella modalità passiva. Utile, tipicamente, quando si opera dietro un firewall o un altro apparecchio di connessione che non permette la modalità normale di funzionamento del protocollo FTP.

Finestra "Proxy"

Permette di indicare i proxy server da usare per il protocollo HTTP e per il protocollo FTP (v. figura 6).


Figura 6. La finestra dei server proxy.

Proxy login:
Se la configurazione del proxy lo richiede, qui si indicano il nome e la password da usare. Il metodo di autenticazione per il proxy HTTP è "basic" o "digest" a seconda del server. Il checkbox save permette di salvare la password all'uscita dal programma, purché sia abilitata l'opzione di salvataggio nella finestra principale.

HTTP Proxy Server:
FTP Proxy Server:
Notare che bisogna indicare esplicitamente il protocollo e/o la porta da usare. E' anche possibile indicare l'eventuale login in una forma del tipo

http://user:password@my.proxy.it:8080

Licenza

Il programma è assolutamente gratuito (free) e di pubblico dominio; anche i sorgenti sono utilizzabili liberamente e sono di pubblico dominio.

PREREQUISITI

mywgettk è uno script Tcl/Tk e richiede pertanto il relativo interprete. All'inizio dello script è indicato il path dell'interprete: se sul tuo sistema è diverso, modificalo in modo corrispondente.

DOWNLOAD

La versione corrente è la 1.2.

mywgettk (24 KB) - Il programma mywgettk.

INSTALLAZIONE

E' estremamente banale: scaricare il programma, impostarne il nome togliendo l'estensione .txt (è una cosa puramente estetica ;-) e quindi impostare il bit di eseguibilità con chmod +x mywgettk: fatto!


Umberto Salsi
Commenti
Contatto
Mappa
Home/
Still no comments to this page. Use the Comments link above to add your contribute.