Data Mining

Secara sederhana, data mining dapat diartikan sebagai proses mengekstrak atau menggali knowledge yang ada pada sekumpulan data. Proses pengolahan dari data menjadi pengetahuan. Data mining adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar. Pengetahuan yang dihasilkan dapat berupa pola, rumus, aturan atau model. Data Mining merupakan proses yang menggunakan teknik statistik, matematika, kecerdasan buatan,  machine learning  untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Data Mining juga bisa disebut knowledge discovery adalah proses pengambilan pola pada data yang akan diproses lalu output tersebut berupa informasi yang sangat penting. 

 Menurut Tacbir, data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari database yang besar.

Terdapat beberapa istilah lain yang memiliki makna sama dengan data mining (Larose, 2005), yaitu:

  1. Knowledge discovery in databases  (KDD), 
  2. Ekstraksi pengetahuan (knowledge extraction), 
  3. Analisa data/pola (data/pattern analysis), 
  4. Kecerdasan Bisnis (business intelligence) dan  
  5. Data Archaeology  dan  
  6. Data Dredging .

Informasi dan knowledge digunakan pada banyak bidang, seperti manajemen bisnis, pendidikan, kesehatan dan sebagainya. Istilah data mining memiliki hakikat sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Proses menggali informasi dalam data mining melibatkan integrasi teknik dari berbagai disiplin ilmu, seperti teknologi database dan data warehouse, statistik, machine learning, komputasi dengan kinerja tinggi, pattern recognition, neural network, visualisasi data dan sebagainya. Data mining menggunakan pendekatan discovery-based dimana pencocokan pola (pattern matching) dan algoritma-algoritma yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang dieksplorasi. Data mining (penambangan data), sesuai dengan namanya, berkonotasi sebagai pencarian informasi bisnis yang berharga dari basis data yang sangat besar. Dengan tersedianya basis data dalam kualitas dan ukuran yang memadai, teknologi data mining memiliki kemampuan-kemampuan sebagai berikut:

  • Mengotomatisasi prediksi tren sifat-sifat bisnis. Data mining mengotomatisasi proses pencarian informasi di dalam basis data yang besar.
  • Mengotomatisasi penemuan pola-pola yang tidak diketahui sebelumnya. Tools data mining “menyapu” basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan. Contoh dari penemuan pola ini adalah analisis pada data penjualan ritel untuk mengidentifikasi produk-produk yang kelihatannya tidak berkaitan, yang seringkali dibeli secara bersamaan oleh customer

Proses Pencarian Pola dalam Data Mining

Proses pencarian pola merupakan proses penambangan data penting. Seperti menambang pada umumnya yang memerlukan pencarian untuk mendapatkan sesuatu yang penting. Berikut ini proses pencarian pola dalam menemukan data penting:

  • Pembersihan data

Proses pencarian pola yang pertama adalah proses pembersihan data. Pembersihan data berupa penghapusan data pengganggu atau data yang tidak penting serta mengisi data yang hilang.

  • Integrasi data

Setelah pembersihan data, proses selanjutnya yaitu integrasi data. Integrasi data merupakan proses penggabungan beberapa sumber data yang ada.

  • Pemilihan data

Pencarian pola selanjutnya dalam adalah pemilihan data. Data-data yang relevan nantinya dipilih dan dikumpulkan.

  • Transformasi data

Setelah itu proses selanjutnya adalah transformasi data. Jadi dari banyaknya data, nantinya akan diproses dan ditransformasi ke dalam format tertentu, format yang akan digunakan dalam penggalian data.

  • Penggalian data

Dalam proses satu ini, data akan diolah menggunakan metode yang cerdas dan canggih sehingga akan menghasilkan ekstraksi pola tertentu.

  • Evaluasi pola

Proses selanjutnya yaitu evaluasi pola. Dari pola-pola yang ditemukan, nantinya akan dikenali pola-pola yang menarik. Pola-pola menarik tersebut lah yang akan diambil.

  • Penyajian pola

Setelah ditemukan pola yang menarik, pola tersebut kemudian akan disosialisasikan ke pengguna.

 

Tahapan Data Mining:

  • Seleksi
    Proses seleksi merupakan proses penyeleksian data. Data yang diseleksi akan ditransformasikan ke format yang sesuai untuk analisis data. Seleksi data menggunakan beberapa kriteria. Data hasil seleksi kemudian akan disimpan di suatu berkas terpisah yang kemudian akan diolah atau dilakukan proses data mining.
  • Preprocessing
    Dalam tahap processing, data yang tidak valid dan tidak dibutuhkan akan dibuang. Jadi akan terjadi pembersihan data yang informasinya tidak terlalu dibutuhkan. Data yang duplikat, yang tidak konsisten, dan data yang salah akan diperiksa dan dibersihkan.
  • Transformasi
    Proses transformasi atau coding merupakan proses transformasi data ke dalam format tertentu sehingga nantinya data dapat digunakan dan ditelusuri.
  • Data Mining
    Pada tahapan ini, akan terjadi proses pencarian pola dengan metode, teknik, dan algoritma tertentu yang bervariasi dan rumit. Pola dan data yang dicari adalah pola dan data yang menarik.
  • Interpretasi dan Evaluasi
    Menampilkan data tersebut ke dalam bentuk yang mudah dipahami oleh pengguna atau pihak yang berkepentingan. Jadi pola yang ditemukan nanti akan diperiksa dan dicek apakah bertentangan dengan hipotesis sebelumnya ataukah tidak. Intinya data sudah bisa dibaca dan tentunya akan bermanfaat bagi pihak yang berkepentingan.

Sumber dari:

  1. https://ilmukomputer.org/wp-content/uploads/2018/05/agus-k-means-clustering.pdf
  2. http://brainmatics.com/data-mining/
  3. https://accounting.binus.ac.id/2019/10/03/memahami-apa-itu-data-mining/
  4. https://www.gurupendidikan.co.id/data-mining/
  5. https://www.kompasiana.com/mfirman34/5c8fb0557a6d88244e001272/pengertian-data-mining-dan-penerapannya
  6. https://dosen.perbanas.id/apa-itu-data-mining/
  7. https://bootup.ai/blog/data-mining-adalah/

2 Comments

Leave Comment

error

Enjoy this blog? Please spread the word :)

Facebook
YouTube
Instagram