.::Selamat Datang Di Blog Ini..Semoga Bermanfaat::.

Pengertian, Kelebihan dan Kekurangan K-Nearest Neighbor (K-NN)

Wednesday 28 March 2012

hay sobat..
Minggu kemaren saya mendapat tugas materi kapita selekta, sebenernya sih mudah tapi ribet juga,hhe.. Pada tugas kali ini dosen ngasih tugas untuk mencari tentang K-Nearest Neighbor (K-NN). Langsung dah saya nyari dan hasilnya kebanyakan sama, antara lain saya tulis dalam artikel ini. Ya sudahlah, tanpa bosa basi lagi langsung ke TKP.. ;)



  • Pengertian  K-NN
K-Nearest Neighbor (K-NN) adalah suatu metode yang menggunakan algoritma supervised dimana hasil dari sampel uji yang baru diklasifikasikan berdasarkan mayoritas dari kategori pada K-NN. Tujuan dari algoritma ini adalah mengklasifikasi objek baru berdasakan atribut dan sampel latih. pengklasifikasian tidak menggunakan model apapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan titik uji, akan ditemukan sejumlah K objek (titik training) yang paling dekat dengan titik uji. Klasifikasi menggunakan voting terbanyak di antara klasifikasi dari K objek. Algoritma K-NN menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari sample uji yang baru. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Eucledian.

Algoritma metode KNN sangatlah sederhana, bekerja dengan berdasarkan pada jarak terpendek dari sample uji ke sample latih untuk menentukan KNN nya. Setelah mengumpulkan KNN, kemudian diambil mayoritas dari KNN untuk dijadikan prediksi dari sample uji.

Data untuk algoritma KNN terdiri dari beberapa atribut multi-variate Xyang akan digunakan untuk mengklasifikasikan Y. Data dari KNN dapat dalam skala ukuran apapun, dari ordinal ke nominal.

  • Kelebihan 
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar.

  • Kelemahan

Sedangkan kelemahan dari KNN adalah :
1. KNN perlu menentukan nilai dari parameter K (jumlah dari tetangga terdekat)
2. Pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang terbaik
3. Biaya komputasi cukup tinggi karena diperlukan perhitungan jarak dari tiap sample uji pada keseluruhan sample latih



OK sobat, itu yang bisa Q share, artikel  ini sudah dimuat di mana-mana, jadi saya tidak bisa mencantumkan sumbernya, makasih, semoga bermanfaat. ;) 

4 comments:

Anonymous said...

aplikasinya bos....

Anonymous said...

bos aplikasinya mana?

Unknown said...
This comment has been removed by the author.
Unknown said...

Apa sih maksud dari kelbihan knn yang tangguh terhadap training data yang noisy dan efektif apabila data latih nya besar.??? bisa dijelaskan!

Post a Comment

 

Followers

Waktu Sholat Kebumen

Pengunjung