Un motore di ricerca personalizzato con Ubuntu.
Un motore di ricerca personalizzato.
Grazie a Heritrix è possibile
archiviare i siti web preferiti.
Installare ed utilizzare heritrix
Passo-1
Installare ed eseguire heritrix
Scarica il
pacchetto da http://sourceforge.net/
project/archive-crawler,
estrai il contenuto in una
cartella, poi
entra in quest'ultima con il terminale,
accessibile dal
menu”Applicazioni>Accessori”.
Passo-2
Avviare l'interfaccia
Dal terminale,
digita il seguente comando 'heritrix--
admin=NOME:PASSWORD',
dove nome e password
devono essere
scelti con cura in modo da non poter
essere individuati
con facilità.
Passo-3
Collegarsi via web
Apri un browser
installato nel sistema, per esempio
Firefox.
Collegati all'indirizzo fornito da Heritrix (in
questa immagine
http://127.0.0.1:8080) e
fornisci
nome e password
scelti nel passo precedente.
Passo-4
Creare un job
Per creare un job
clicca sulla voce Jobs. Seleziona
“With
Defaults” per creare un nuovo job basato sul
profilo
predefinito. Dai un nome e una descrizione
ai job che stai
creando.
Passo-5
Configurare il job
Clicca
su Modules e
seleziona il metodo di scansione
in
“Select Crawl Scope”.
Clicca su Setting.
Scorri fino
a
'http-headers',
specifica il sito da visitare e clicca su
“Submit Job”.
Passo-6
Eseguire il job
Apri la sezione
'Console'. Clicca su 'Start' per avviare
il job appena
creato. Attendi qualche secondo e clicca
su Refresh.
Al termine potrai visualizzare un report
dettagliato sul
sito che hai monitorato.
Commenti
Posta un commento
Ciao a tutti voi, sono a chiedervi se avete preferenze per Post di vostro interesse
in modo da dare a tutti voi che mi seguite un aiuto maggiore, grazie per la vostra disponibilità.