Monday, March 28, 2011

0

WEB MINING

Posted in
1. PENDAHULUAN
 
Tidak diragukan lagi bahwa kemajuan teknologi informasi telah memberikan banyak manfaat dan dukungan dalam menjalankan berbagai usaha sehingga mengakibatkan terjadinya persaingan yang sangat ketat dalam dunia bisnis. Perusahaan yang ingin tetap eksis perlu mengadopsi teknologi baru untuk mendukung operasional dalam upaya penetrasi pasar termasuk kecepatan layanan dan ketepataan target market. Dalam hal ini, situs perusahaan memegang peranan yang sangat penting dalam memasarkan produk dan menghimpun data dalam skala besar. Banyaknya transaksi yang dilakukan lewat situs internet mengakibatkan bertambahnya jumlah data yang harus disimpan dan dikelola. Pada data dengan berjumlah relatif besar sesungguhnya tersembunyi informasi yang dapat memberikan manfaat tambahan bagi perusahaan. Namun diperlukan teknik dengan algoritma khusus untuk menganalisis data berukuran besar agar hasil yang diberikan merepresentasikan suatu informasi yang benar-benar bermanfaat. Data mining merupakan salah satu teknik yang digunakan untuk menganalisis data, dan web mining digunakan untuk menganalisis data pada web aplikasi berbasis web.

Dengan menggunakan teknik web mining, salah satu manfaat yang dapat diperolah adalah dalam menentukan pelanggan yang memiliki minat yang relatif besar terhadap sebuah produk, sehingga dapat dilakukan efisiensi dan efektivitas usaha, biaya, dan waktu untuk promosi. Pelanggan yang memiliki peluang ketertarikan relatif lebih besar terhadap sebuah produk disebut sebagai pelanggan potensial (potential customer).Sehubungan dengan hal tersebut, maka pada tulisan ini akan dibahas teknologi web mining untuk menentukan pelanggan potensial.

2. DEFINISI 

Web mining adalah ekstraksi pola-pola penting dan bermanfaat namun tersimpan secara implisit pada kumpulan data yang relatif besar pada layanan world wide web. Web mining teridiri atas tiga bagian yaitu: web content mining, web structure mining, dan web usage mining.

Web content mining adalah suatu proses otomatis untuk menemukan informasi yang berguna dari dokumen atau data. Pada prinsipnya teknik ini mengekstraksi kata kunci yang terkandung pada dokumen. Isi data web antara lain dapat berupa teks, citra, audio, video, metadata, dan hyperlink. Ada dua strategi yang umum digunakan: pertama langsung melakukan mining terhadap data, dan kedua melakukan pencarian serta mengimprove hasil pencarian seperti layaknya search engine. 

Web struncture mining dikenal juga  sebagai web log mining adalah teknik yang digunakan untuk menemukan struktur link dari hyperlink dan membangun rangkuman website dan halaman  web. Salah satu manfaatnya adlah untuk  menentukan pagerank pada suatu halaman web.

Web usage mining adalah teknik untuk mengenali perilaku pelanggan dan struktur web melalui informasi yang diperoleh dari log, click stream, cookies, dan query. Berbagai tool yang sudah ada antara lain WebLogMiner yang melakukan mining terhadap data log. Teknik yang lebih canggih digunakan untuk melakukan OLAP. Manfaat web usage mining adalah untuk kustomosasi halaman berdasarkan profil pengguna, menentukan ketertarikan pelanggan terhadap produk tertentu, dan menentukan target market yang sesuai

3. TAHAPAN WEB MINING

Tahapan web mining dapat diilustrasikan dengan gambar berikut : 

 
Tahapan pada web mining dibagi menjadi tiga kelompok yaitu preprocess, process, dan, post process. Tahapan preprocess meliputi data cleaning, transaction identification, integration, dan transformation. Pada tahap process diterapkan sejumlah formulasi statistik antara lain untuk mengurangi jumlah atribut dengan cara membuang atribut yang tidak berpengaruh (information gain). Pada tahap ini dapat juga dilakukan teknik clustering, asosiasi, dan klasifikasi. Pada tahap post processing dilakukan analisis lebih lanjut untuk mengolah hasil mining pada tahapan sebelumnya. Hal ini perlu dilakukan sebab sering sekali hasil yang diperoleh pada tahap process tidak memberikan sesuatu yang dapat digunakan secara langsung, sehingga diperlukan teknik lainnya seperti visualisasi grafik dan analisis statistik lainnya.

Tahapan process merupakan tahapan utama dalam web mining. Pada tahap ini, atribut yang akan diolah harus diminimalisasi terlebih dahulu dengan tujuan untuk membuang atirbut yang tidak perlu sehingga hanya atribut yang mempunyai relevansi kuat yang akan diproses, sehingga efisiensi space dan waktu dapat dicapai dan kualitas data yang dihasilkan lebih baik. Salah satu cara untuk mereduksi atribut adalah dengan information gain.

4. KESIMPULAN

Proses penghitungan Information Gain perlu dilakukan untuk mereduksi atribut yang tidak perlu. Web mining dapat digunakan untuk menganalisis data-data transaksi yang dilakukan oleh pengunjung web, untuk selanjutnya memanfaatkan hasilnya untuk peningkatan efisiensi aktivitas perusahaan.

SUMBER :http://ivan.siregar.biz/?cat=13



0 komentar: