Proses atau Tahapan Data Mining

 

Apa itu Data Mining?

    Data mining adalah metode dalam ilmu komputer yang biasa digunakan dalam proses pencarian knowledge. Tahapan di dalamnya berguna untuk mencari pola-pola tertentu dari data yang ada pada database. Biasanya, metode ini banyak ditemukan pada bidang machine learning dan statistika.

Pada awalnya, metode penambangan data dikembangkan karena kompleksitas kerja komputer yang semakin meningkat. Namun, di sinilah keuntungan adanya data mining adalah proses pengumpulan dan seleksi data yang lebih praktis.

Banyak teknik dan metode yang ada untuk melakukan berbagai jenis tugas data mining. Metode ini dikelompokkan dalam 3 paradigma utama data mining: Predictive Modeling, Discovery, dan Deviation Detection

Serangkaian proses tahapan data mining tersebut memiliki tahap sebagai berikut (Tan, 2004):

  1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise)
  2. Integrasi data (penggabungan data dari beberapa sumber)
  3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
  4. Aplikasi teknik Data Mining, proses ekstraksi pola dari data yang ada
  5. Evaluasi pola yang ditemukan (proses interprestasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan)
  6. Presentasi pengetahuan (dengan teknik visualisasi 

Komentar

Postingan populer dari blog ini

Quiz Data Mining P5

DBMS