Definisi Algoritma K-Means

algoritam K-Means adalah salah satu teknik dalam data mining untuk mengelompokkan (Clustering) data kedalam beberapa kelompok berdsasarkan jarak, kriteria, kondisi atau karakteristik. Data dalam satu kelompok haru memiliki jarak terpendek, kriteri akondisi, atau karakteristik yang sama atau hampir sama anatara satu dengan lainnya. Algoritma K-Means dapat mengelompokkan objek yang mimiliki kemiripan.



Pengelompokan Data Dengan Algoritma K-Means

Adapaun langkah-langkah dalam pengelompokan data dengan Algoritma K-Means adalah sebagai berikut : 

  1. Menyiapkan sampling data
  2. Menentukan jumlah Cluster
  3. Menentukan nilai Centroid / Titik Pusat
  4. Menghiutng jarak masing-masing centroid
  5. mengeloopokan data berdasarkan jaka terpendek.
untuk menentukukan jarak masing-masing centoid berdasarkan jarak terpendik, kriteria, kondisi ataua karakteristik yang sama atau hampir sama menggunakan model euclidean synag dirumuskan sebagai berikut : 


Keterangan : 
dij = jarak dari data ke i  ke pusasat cluster j
xki = data dari ke-i pdaa attribute data ke - k
xkj = data dari ke-j pada attribute data ke - k




Studi kasus dan penyelesaian

Berikut adalah data nilai mahasiswa dari beberapa matakuliah

kelompok data di atas berdasarkan nilai yang diproleh oleh setiap mahasiswa.
Penyenyelesaian
Iterasi Ke-1 : 
Pertama : Jumlah kelompok yaitu 3 sesuai dengan jumlah atribut kriteria.

Kedua :  Menentukan nilai centroid awal, dengna 3 record sesuai dengan jumlah atribut kriteria. nilai centroid awal diproleh data mahasiswa secara acak. 
Ketiga : Menghitung jarak dengan menggunakan model  euclidean

Cluster 1 : 





Rekapitulasi hasil perhitungan cluster ke 1


Aturan yang digunakan untuk mengelompokan data berdasarkan perhitungan jarak adalah
- if dc1<dc2 dan dc1<dc3 maka cluster = 1
- if dc2<dc1 dan dc2<d3 maka cluster=2
- if dc3<dc1 dan dc3<d2 maka cluster=3
Iterasi ke 2: 
pertama : pencarian nilai pusat awal pada iterasi ke-2 diproleh dari nilai rata-rata penjumlahan anggota masing-masing cluster, setelah itu dibagai dengan jumlah anggota maing-masing cluster.
prolehan nilai c1 : 

perolehan nilai c2 :

Perolahan nilai c2 : 


sehingga nilai centroid awal sebagai berikut : 

Kedua : menghitung jarak dengan menggunakan model Eculidean pada iterasi ke 2 :

Rekapitulasi hasi perhitungan cluster pada iterasi ke-2 sebagai berikut : 


aturan yang diguankan untuk cluster data berdasarkan perhitugnan jarak adalah 
if dc1<dc2 dan dc1<d3 maka c1
if dc2<dc1 dan dc2<d3 maka c2
if dc3<dc1 dan dc3<d2 maka c3

hasil akhir 
Hasil Cluster pada iterasi ke 1 dengan iterasi ke 2 terjadi perubahan cluster yaitu pada iterasi ke 1 anggota cluster 2 jepri taringan dan aprina, anggota cluster 3 nanda putri dan meanus lia. sedangan pada iterasi ke 2 anggota cluster 2 nanda putri rizanti dan meanus laian dan anggota cluster 3 jrpri tarigan dan apriana. perubahan yang terjadi hanya nama cluster. tidak terjadi pertukaran penggurangan atau penambahan angota pada salah satu ssluster sehingga tidak dilanjutkan lagi prosesnya adi ramadi dan sufri yono hutagalung masuk dalm satu cluster yaitu cluster 1 karena kedua nilai mahasiswa tersebut berdekatan, nama nananda putri rizanti dan meanus laia masuk dalam satu cluster yaitu 2 karena kedua nilai mahasiswa tersebut berdekatan serta nama mahasiswa jepri tarigan dan aprina masuk dalam satu cluster yaitu cluster 3 karena kedua nilai mahasiswa tersebut berektan.


pembahasan akan kita lanjutkan besok .

paragram

sub judul 

paragram

sub judul 

paragram

sub judul 

paragram

Post a Comment

Lebih baru Lebih lama