About Me

header ads

Data Mining - Pengenalan Supervised dan Unsupervised Learning


 APA ITU DATA MINING ?


   adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar.
Pengenalan Pola (Pattern Recognition) : suatu disiplin ilmu yang mempelajari cara-cara mengklasifikasi objek ke beberapa kelas dan mengenali kecenderungan data.Objek bisa berupa pasienmahasiswapemohon kredit, image atau signal.

Data Mining difungsikan dalam menemukan keteraturanpola atau hubungan dalam set data berukuran besarMachine Learning : Suatu area artificial intelligence yang berhubungan dengan pengembangan teknik-teknik yang bisa diprogramkan dan belajar dari masa lalu.Mechine learning menjadi alat analisis dalam data mining

                         MACAM-MACAM DATA MINING:

Supervised : Metode dengan adanya latihan.
•Metode : regresi, ANN (Artificial Neural Network), SVM (Support Vector Machine)
Unsupervised : tanpa ada latihan (training) dan tanpa ada guru (teacher = label dalam data).
•Misal: kita punya sekelompok pengamatan atau data tanpa ada label (output)tertentu, maka dalam unsupervised dilakukan pengelompokan data tersebut kedalam kelas yang kita kehendaki.
•Metode unsupervised : Klatering dan SOM(Self  Organizing Map)

CONTOH SUPERVISED Dan UNSUPERVISED

•Sekelompok mahasiswa didalam kelas. Seorang dosen akan mengelompokkan beberapa orang ini kedalam beberapa kelompok. Misalkan jumlah kelompok ada 4. Maka mahasiswa dikelompokkan menurut kesamaan ciri-ciri (atribut): berdasarkan indeks prestasi, jarak tempat tinggal atau gabungan keduanya. Dalam dua dimensi sumbu x merepresentasikan indeks prestasi, sumbu y merepresentasikan jarak tempat tinggal.
•Teknik unsupervised : mahasiswa sebagai objek dari tugas kita, bisa dikempokkan dalam 4 kelompok menurut kedekatan IP dan jarak tempat tinggal. Pengelompokan ini, diasumsikan dalam satu kelompok, anggota-anggotanya harus memunyai kemiripan yang tinggi dibanding anggota dari kelompok lain.
•Teknik supervised : output dari unsupervised dipakai sebagai guru dalam proses training  dengan menggunakan teknik pengenalan pola , Dan dalam pemisahkan data training dan data testing (pelatih) maka diperlukan fungsi pemisah.


GAMBAR POLA SUPERVISED





Post a Comment

0 Comments