Follow us:-
  • By Dedi Martono
  • 29 April 2020
  • No Comments

Data Mining

Data mining adalah suatu proses penambangan informasi penting dari suatu data. Informasi penting ini didapat dari suatu proses yang amat rumit seperti menggunakan artificial intelligence, teknik statistik, ilmu matematika, machine learning, dan lain sebagainya. Teknik-teknik rumit tersebut nantinya akan mengidentifikasi dan mengekstraksi informasi yang bermanfaat dari suatu database besar.

Contoh mudahnya misalnya anda membaca data buku telepon. Setelah selesai membaca, anda mendapatkan informasi bahwa mayoritas orang dengan nama Agus tinggal di Tangerang, maka hal tersebut dapat dikatakan sebagai proses.

Proses Pencarian Pola dalam Data Mining. Proses pencarian pola atau bisa dikatakan sebagai proses penambangan data penting. Seperti menambang pada umumnya yang memerlukan pencarian untuk mendapatkan sesuatu yang penting. Nah berikut proses pencarian pola dalam menemukan data penting

Namun jika yang anda lakukan hanyalah mencari tempat tinggal Agus Suryanto di buku telepon, maka tidak bisa dikatakan proses data mining. Itu hanyalah proses query biasa. Proses data mining sampai proses implementasi sangatlah penting. Bisa diibaratkan seperti penambangan emas. Diantara banyaknya material, anda hanya akan menemukan sedikit emas tapi nilai dari emas tersebut sangatlah tinggi.

Pengertian Data Mining

Apa itu data mining?

Jadi, berdasarkan penjelasan diatas dapat disimpulkan bahwa data mining merupakan suatu proses penambangan data dalam jumlah data yang sangat besar dengan menggunakan metode statistika, matematika, hingga memanfaatkan teknologi artificial intelligence terkini.

Menurut para ahli (Efraim Turban, dkk 2005) Tujuan dari penambangan data ini  untuk mengekstraksi serta mengidentifikasi suatu data demi informasi tertentu yang berhubungan dengan suatu database besar atau big data.

Terdapat beberapa istilah pula yang memiliki makna hampir sama dengan penambangan data meskipun definisi khususnya berbeda seperti Knowledge discovery in databases (KDD), analisa data atau pola, ekstraksi pengetahuan, kecerdasan bisnis, data arkeologi, dan data dredging.

Fungsi Data Mining

Penambangan data adalah suatu proses yang memiliki banyak fungsi. Fungsi utamanya yaitu untuk mendapatkan informasi penting yang nantinya bisa bermanfaat. Jika dijabarkan lebih lanjut, berikut fungsi dasarnya.

1.      Prediction

Prediction atau fungsi prediksi merupakan salah satu fungsi data mining. Maksudnya yaitu dari proses nanti akan menemukan pola tertentu dari suatu data. Pola tersebut dapat diketahui dari variabel-variabel yang ada pada data. Pola yang didapat bisa digunakan untuk memprediksi variabel lain yang belum diketahui nilai ataupun jenisnya.

Karena itulah fungsi satu ini dikatakan sebagai fungsi prediksi. Nantinya bisa digunakan untuk memprediksi variabel tertentu yang tidak ada dalam suatu data. Hal ini tentunya memudahkan dan menguntungkan bagi mereka pemilik kepentingan yang memerlukan prediksi akurat untuk membuat hal penting tersebut menjadi lebih baik.

2.      Description

Fungsi selanjutnya adalah description atau fungsi deskripsi. Maksud dari fungsi deskripsi ini yaitu untuk memahami lebih jauh tentang data yang diamati. Jadi dengan melakukan proses, diharap mampu mengetahui perilaku dari data tersebut yang nantinya bisa digunakan untuk mengetahui karakteristik dari data yang dimaksud.

Baca Juga: Coding Adalah, Temukan Pengertian dan Manfaatnya

Data mining nantinya bisa menemukan pola tertentu yang tersembunyi dalam sebuah data. Dengan pola yang berulang dan bernilai itulah karakteristik data bisa diketahui. Hal satu ini tentunya memberikan banyak manfaat dan dapat meningkatkan pengetahuan.

3.      Klasifikasi

Fungsi lainnya adalah fungsi klasifikasi atau classification. Maksud dari fungsi klasifikasi yaitu data yang ada akan diproses sehingga akan ditemukan fungsi atau model tertentu yang menggambar konsep dari suatu data. Model atau fungsi tersebut nantinya akan memisahkan tiap data menjadi kelompok-kelompok tertentu.

Kelompok data tersebut nantinya bisa digunakan untuk meramalkan kecenderungan suatu data di masa depan. Pengelompokan atau pengklasifikasian data juga dapat memudahkan pemilik data saat mencari data yang dibutuhkan.

4.      Asosiasi

Fungsi selanjutnya ialah fungsi asosiasi. Maksud dari fungsi asosiasi atau analisis asosiasi yaitu penggunaannya untuk menemukan kombinasi atau aturan assosiatif dari suatu data. Jadi data yang ada nantinya diproses sehingga akan menemukan informasi tentang hubungan variabel satu dengan lainnya.

Agar mudah dipahami, contoh permisalannya pada analisis pembelian barang di swalayan. Semisal dari data pembelian diproses dan ternyata memperoleh hasil hubungan antara pembelian mie dan kecap. Jika besar kemungkinan pelanggan membeli mie dan kecap secara bersamaan, maka pihak swalayan bisa memanfaatkan informasi tersebut untuk mengatur penempatan mie dan kecap.

Kecap bisa diletakkan di rak yang tidak jauh dari mie. Bisa juga menggunakan kecap sebagai bonus pemebelian mie atau bisa juga menggunakan cara lain, yang jelas menggambarkan bentuk hubungan mie dan kecap. Hal ini tentu saja menguntungkan.

Proses Pencarian Pola dalam Data Mining

Proses pencarian pola atau bisa dikatakan sebagai proses penambangan data penting. Seperti menambang pada umumnya yang memerlukan pencarian untuk mendapatkan sesuatu yang penting. Nah berikut proses pencarian pola dalam menemukan data penting.

1.      Pembersihan data

Proses pencarian pola yang pertama adalah proses pembersihan data. Pembersihan data berupa penghapusan data pengganggu atau data yang tidak penting serta mengisi data yang hilang.

2.      Integrasi data

Setelah pembersihan data, proses selanjutnya yaitu integrasi data. Integrasi data merupakan proses penggabungan beberapa sumber data yang ada.

3.      Pemilihan data

Pencarian pola selanjutnya dalam adalah pemilihan data. Data-data yang relevan nantinya dipilih dan dikumpulkan.

4.      Transformasi data

Setelah itu proses selanjutnya adalah transformasi data. Jadi dari banyaknya data, nantinya akan diproses dan ditransformasi ke dalam format tertentu, format yang akan digunakan dalam penggalian data.

5.      Penggalian data

Dalam proses satu ini, data akan diolah menggunakan metode yang cerdas dan canggih sehingga akan menghasilkan ekstraksi pola tertentu.

6.      Evaluasi pola

Proses selanjutnya yaitu evaluasi pola. Dari pola-pola yang ditemukan, nantinya akan dikenali pola-pola yang menarik. Pola-pola menarik tersebut lah yang akan diambil.

7.      Penyajian pola

Setelah ditemukan pola yang menarik, pola tersebut kemudian akan divisualisasikan ke pengguna.

Tahapan Data Mining

Setelah tadi mengetahui proses pencarian polanya, kini saaatnya membahas tentang tahapan umum data mining. Apa saja tahapannya? Berikut penjelasannya.

  1. Seleksi
    Tahapan pertama dalam adalah seleksi. Proses seleksi merupakan proses penyeleksian data. Data yang diseleksi akan ditransformasikan ke format yang sesuai untuk analisis data. Seleksi data menggunakan beberapa kriteria. Data hasil seleksi kemudian akan disimpan di suatu berkas terpisah yang kemudian akan diolah atau dilakukan proses data mining.
  1. Preprocessing
    Sebenarnya tahapan ini hampir sama dengan proses pemecahan pola. Hanya saja tahapan ini ditulis secara umum, tidak menjurus ke pemecahan pola. Nah dalam tahap processing, data yang tidak valid dan tidak dibutuhkan akan dibuang. Jadi akan terjadi pembersihan data yang informasinya tidak terlalu dibutuhkan. Data yang duplikat, yang tidak konsisten, dan data yang salah akan diperiksa dan dibersihkan.
  1. Transformasi
    Tahapan selanjutnya adalah transformasi. Proses transformasi atau coding merupakan proses transformasi data ke dalam format tertentu sehingga nantinya data dapat digunakan dan ditelusuri.
  1. Data Mining

Dalam tahapan ini, akan terjadi proses pencarian pola dengan metode, teknik, dan algoritma tertentu yang bervariasi dan rumit. Pola dan data yang dicari adalah pola dan data yang menarik.

  1. Interpretasi dan Evaluasi

Setelah menemukan pola dan data menarik, selanjutnya adalah menampilkan data tersebut ke dalam bentuk yang mudah dipahami oleh pengguna atau pihak yang berkepentingan. Jadi pola yang ditemukan nanti akan diperiksa dan dicek apakah bertentangan dengan hipotesis sebelumnya ataukah tidak. Intinya data sudah bisa dibaca dan tentunya akan bermanfaat bagi pihak yang berkepentingan.

Kelebihan Data Mining

Data mining merupakan sebuah proses interatif dan interaktif untuk mendapatkan sebuah pola baru yang menarik. Pola tersebut tentunya akan sangat bermanfaat. Model yang dihasilkan dari proses data mining biasanya sudah sempurna sehingga dapat digeneralisasi untuk kepentingan di masa depan.

Karena prosesnya yang cukup panjang dan rumit, maka dari proses awal biasanya akan menghasilkan sesuatu yang baru, yang tidak diketahui sebelumnya. Sesuatu yang baru ini akan menambah pengetahuan para pengguna ataupun peneliti dan tentunya akan sangat bermanfaat karena dapat digunakan untuk melakukan tindakan tertentu.

Penggalian data juga sering dikatakan sebagai proses interaktif dan interatif. Proses interaktif maksudnya yaitu proses yang masih memerlukan interaksi manusia agar bisa terlaksana. Sedangkan proses interatif, maksudnya adalah proses yang tidak hanya dilakukan sekali, perlu proses yang berulang-ulang untuk mendapatkan data penting yang dimaksud.

Kelebihannya membuat analisa suatu data besar menjadi semakin mudah. Pencarian pola baru atau trend baru bisa dilakukan dengan mudah sehingga bisa membantu mengambil keputusan di masa yang akan datang atau bisa memprediksi data tertentu sehingga bisa menganalisis apa yang harus dilakukan.

 

Leave a Reply