Come procurare i contenuti per il tuo sito

Uno dei problemi più scoraggianti per chi ha buone idee e poco tempo per svilupparle, è quello del dover partire con un sito senza possedere una base dati.
Mi riferisco per esempio ai prodotti nei siti di ecommerce, alle schede tecniche per siti settoriali, alle recensioni per i siti d’informazione ecc…

La mancanza di contenuti rende di fatto il vostro sito, agli inizi, una goccia nel mare, per quanto il vostro sito potrà essere carino, funzionante, veloce ecc.. nessuno sarà in grado di raggiungerlo perchè privo di contenuti.
Le strade a questo punto sono 3 ovvero:

  • Comprare pubblicità e sponsorizzare il proprio sito spendendo diversi soldi
  • Estrarre i contenuti da altri siti, elaborarli e ripubblicarli controllando le norme sul copyright dei siti sorgente
  • Fare entrambe le cose 🙂

E’ ovvio che se state creando un sito di ecommerce e non avete inserito mezzo articolo, sarà inutile pubblicizzare il sito, serve prima una base dati.
A questo punto l’esigenza di riuscire ad estrarre in maniera veloce, contenuti specifici da altri siti diventa un plus che ci permette di andare subito in produzione con una base molto valida e che verrà continuamente migliorata nel tempo.

Easy Web Extract

Easy Web Extract è un software piuttosto economico (54 euro ad oggi) e disponibile anche in versione free (con limite di 200 record) che serve proprio a questo: popolare il database del nostro sito “rubando” dati da un altro sito.
In particolare il prodotto scompone l’estrazione in 3 fasi:

  • Creazione di un progetto con le specifiche e i pattern di estrazione
  • Inizio del processo di estrazione
  • Esportazione dei dati esportarti

Creazione di un progetto

Una volta installato ed eseguito Easy Web Extract dobbiamo per prima cosa creare un nuovo progetto andando su File > New Project.
A questo punto dobbiamo specificare in alto la URL del sito dal quale vogliamo estrarre le informazioni, nel mio caso www.amazon.it e navigare nella categoria fino ad arrivare alla visualizzazione tabellare dei prodotti:
ewe01
A questo punto procedere cliccando sul pulsante Next.
Tenendo premuto il tasto CTRL spostare il mouse sopra al riquadro contenente il pattern discriminatore del record, ovvero, il riquadro che contiene le informazioni del primo prodotto visibile, come da figura:
ewe02
Clicchiamo sul pulsante next e a questo punto, il software ci chiederà quali sono le informazioni da estrarre per ogni prodotto trovato sulla pagina, ma nel nostro caso, le informazioni sono all’interno della scheda prodotto, quindi dovremo andare a configurare i campi sempre tenendo premuto CTRL e cliccando sulla pagina, come segue:
ewe03
Andando a selezionare con CTRL+Click il titolo del libro e specificando che Column1 è di type=URL e spuntando “Link to details” accederemo alla scheda del prodotto vera e propria dalla quale estrarre i campi che ci interessano:
ewe04
Premendo di nuovo il tasto next il software ci chiederà come passare alla pagina successiva ogni volta che l’estrazione di una serie di prodotti viene completata, io ho impostato che deve premere il tasto “Pagina Successiva” infondo alla pagina, in realtà il software si adatta ad ogni tipo di sito e ci da la possibilità di fare diverse cose per switchare pagina:
ewe05
Cliccando next, Easy Web Extract ci chiederà se oltre al link iniziale che ho messo ci sono altri link che devo “subire lo stesso trattamento”, io per esempio ho fatto questa estrazione sulla cateria “libri classici” ma potrei farrla anche su altre categorie configurandone i link.
Sempre andando avanti ci verrà richiesto il nome da dare a questo progetto ed il percorso dove salvare le immagini estratte, specifichiamoli e cliccate su Finish.

Esportazione

A questo punto dobbiamo dire ad Easy WEb Extract dove andare a salvare i record che riuscirà ad estrarre, abbiamo la possibilità di esportare i dati in qualunque posto anche grazie alla possibilità di utilizzare ODBC.
Per procedere con la configurazione andate su Results > Export e vi comparirà un wizard che vi permetterà di fare tutto in modo semplice.
ewe06

Estrazione

Ora che abbiamo configurato tutto possiamo procedere all’esportazione vera e propria che si fa cliccando il menu Project > Start.
Ecco il software durante l’estrazione dei dati:
ewe07
Per massimizzare la velocità di download è opportuno configurare il numero di task contemporanei in base alla vostra linea internet da Tools > Options.
Ricordatevi di salvare il progetto una volta che l’estrazione è completata, così facendo anche i record estratti verranno inglobati nel file di Easy Web Extract.

Come procurare i contenuti per il tuo sito
Date Published: 04/06/2013
Easy Web Extract
5 / 5 stars

Un pensiero su “Come procurare i contenuti per il tuo sito

Rispondi

Leggi articolo precedente:
Importare prodotti in Magento con Magmi

Magmi è un prodotto completamente gratuito che permette di importare in Magento file CSV con migliaia di prodotti in brevissimo tempo,...

Chiudi