APA ITU DATA MINING ?
adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar.
•Pengenalan Pola (Pattern Recognition) : suatu disiplin ilmu yang mempelajari cara-cara mengklasifikasi objek ke beberapa kelas dan mengenali kecenderungan data.–Objek bisa berupa pasien, mahasiswa, pemohon kredit, image atau signal.
•Data Mining difungsikan dalam menemukan keteraturan, pola atau hubungan dalam set data berukuran besar•Machine Learning : Suatu area artificial intelligence yang berhubungan dengan pengembangan teknik-teknik yang bisa diprogramkan dan belajar dari masa lalu.•Mechine learning menjadi alat analisis dalam data mining
MACAM-MACAM DATA MINING:
–Supervised : Metode
dengan
adanya
latihan.
•Metode
: regresi,
ANN (Artificial Neural Network), SVM (Support Vector Machine)
–Unsupervised : tanpa
ada
latihan
(training) dan
tanpa
ada
guru (teacher = label dalam data).
•Misal: kita
punya
sekelompok
pengamatan
atau
data tanpa
ada
label (output)tertentu, maka
dalam
unsupervised dilakukan pengelompokan
data tersebut
kedalam
kelas
yang kita
kehendaki.
•Metode
unsupervised : Klatering dan
SOM(Self
Organizing Map)
CONTOH SUPERVISED Dan UNSUPERVISED
•Sekelompok mahasiswa
didalam
kelas.
Seorang
dosen
akan
mengelompokkan
beberapa
orang ini
kedalam
beberapa
kelompok.
Misalkan
jumlah
kelompok
ada
4. Maka
mahasiswa
dikelompokkan
menurut
kesamaan
ciri-ciri
(atribut):
berdasarkan
indeks
prestasi,
jarak
tempat
tinggal
atau
gabungan
keduanya.
Dalam
dua
dimensi
sumbu
x merepresentasikan
indeks
prestasi,
sumbu
y merepresentasikan
jarak
tempat
tinggal.
•Teknik unsupervised : mahasiswa
sebagai
objek
dari
tugas
kita,
bisa
dikempokkan
dalam
4 kelompok
menurut
kedekatan
IP dan
jarak
tempat
tinggal.
Pengelompokan
ini,
diasumsikan
dalam
satu
kelompok,
anggota-anggotanya
harus
memunyai
kemiripan
yang tinggi
dibanding
anggota
dari
kelompok
lain.
•Teknik supervised : output dari
unsupervised dipakai sebagai
guru dalam
proses training dengan
menggunakan
teknik
pengenalan
pola
, Dan dalam
pemisahkan
data training dan data testing (pelatih)
maka
diperlukan
fungsi
pemisah.
0 Comments