Un motore di ricerca personalizzato con Ubuntu.


Un motore di ricerca personalizzato.
Grazie a Heritrix è possibile archiviare i siti web preferiti.

Installare ed utilizzare heritrix

Passo-1
Installare ed eseguire heritrix
Scarica il pacchetto da http://sourceforge.net/
project/archive-crawler, estrai il contenuto in una
cartella, poi entra in quest'ultima con il terminale,
accessibile dal menu”Applicazioni>Accessori”.

Passo-2
Avviare l'interfaccia
Dal terminale, digita il seguente comando 'heritrix--
admin=NOME:PASSWORD', dove nome e password
devono essere scelti con cura in modo da non poter
essere individuati con facilità.

Passo-3
Collegarsi via web
Apri un browser installato nel sistema, per esempio
Firefox. Collegati all'indirizzo fornito da Heritrix (in
questa immagine http://127.0.0.1:8080) e fornisci
nome e password scelti nel passo precedente.

Passo-4
Creare un job
Per creare un job clicca sulla voce Jobs. Seleziona
With Defaults” per creare un nuovo job basato sul
profilo predefinito. Dai un nome e una descrizione
ai job che stai creando.

Passo-5
Configurare il job
Clicca su Modules e seleziona il metodo di scansione
in “Select Crawl Scope”. Clicca su Setting. Scorri fino
a 'http-headers', specifica il sito da visitare e clicca su
Submit Job”.

Passo-6
Eseguire il job
Apri la sezione 'Console'. Clicca su 'Start' per avviare
il job appena creato. Attendi qualche secondo e clicca
su Refresh. Al termine potrai visualizzare un report
dettagliato sul sito che hai monitorato.


Commenti

Post popolari in questo blog

INSTAFETCH - Android -

I pesci abissali. Zoologia marina.

La Centrale Idroelettrica.