Jumat, 30 Maret 2012

Web Crawler Tools (Win Web Crauler)

Kali ini saya akan menbahas tugas dari matkul softskill tentang peretingan sebuah web menggunakan web crawler tolls, pada tugas ini saya menggunakan sebuah aplikasi yg bernama WWC (Win Web Crawler). Win Web crawler adalah sebuah otomatis yang memproses atau untuk mereting halaman web. Win web crawler sering juga disebut dengan web spider atau web robot. Bermula pada point awal berupa sebuah link alamat website dan dibuka pada browser, lalu browser melakukan request dan men-download data dari web server melalui protokol HTTP. Setiap Hyperlink yang ditemui pada konten yang tampil akan dibuka lagi pada windows/tab browser yang baru, demikian proses terus berulang. Nah sebuah web crawler mengotomatisasikan pekerjaan itu.
Dibawah ini adalah sekilas cara kerja aplikasi wwc, berikut cara kerja aplikasi tersebut :
1.        Mengidentifikasikan Hyperlink.
Hyperlink yang ditemui pada konten akan ditambahkan pada daftar visit

2.        Melakukan proses visit secara rekursif.
Dari setiap hyperlink, Web crawler akan menjelajahinya dan melakukan proses berulang, dengan ketentuan   yang disesuaikan dengan keperluan aplikasi.
Alasan saya memakai software ini untuk mengerjakan tugas saya karena software ini cukup simpel untuk digunakan, kemudian dengan  sini, pemrosesan data terasa cepat. Satu hal lagi mengapa saya menggunakan software ini, yaitu mudah didapatkan ketika kita surfing di internet. Akantetapi aplikasi ini juga mempunya sdkit kekurangan, yaityu aplikasi ini software bersifat trial selama 15 hari dan pemrosesan data lambat.

Tidak ada komentar:

Posting Komentar

BTricks