Perbandingan Algoritma Naïve Bayes, K-NN, dan SVM dalam Pengklasifikasian Sentimen Media Sosial

Authors

  • Mohammad Hamid Asnawi Departemen Statistika FMIPA Universitas Padjadjaran
  • Isal Firmansyah Departemen Statistika FMIPA Universitas Padjadjaran
  • Rafly Novian Departemen Statistika FMIPA Universitas Padjadjaran
  • Resa Septiani Pontoh Departemen Statistika FMIPA Universitas Padjadjaran

DOI:

https://doi.org/10.1234/pns.v10i.85

Keywords:

Media sosial, Analisis Sentimen, Algoritma Klasifikasi, Naïve bayes classifier, K-Nearest Neighbor, Support Vector Machine

Abstract

Berdasarkan data yang didapat dari wearesosial.com pengguna media sosial di dunia pada Januari 2021 mencapai 4.1 miliar jiwa, angka ini bertumbuh sebesar 13.2% dibandingkan periode yang sama pada tahun sebelumnya. Menurut kementriean informasi dan teknologi, setiap harinya masyarakat Indonesia menghabiskan setidaknya 3.5 jam untuk berselancar di media sosial. Revolusi Industri 4.0 memaksa semua kegiatan terdigitalisasi, media sosial juga merupakan bentuk digitalisasi dari interaksi sosial manusia. Perkembangan teknologi berefek kepada maraknya kemunculan media sosial baru, hal ini menarik perhatian peneliti dimana kami ingin membantu pengguna media sosial untuk mengklasifikasi apakah media sosial tersebut cenderung positif atau negatif berdasarkan sentiment ulasan aplikasi tersebut, oleh karenanya analisis sentimen kami lakukan guna mengetahui kecenderungan tanggapan masyarakat terhadap aplikasi-aplikasi media sosial. Metode yang digunakan dalam penelitian ini adalah algoritma Naïve Bayes Classifier, K-Nearest Neighbor dan Support Vector Machine. Algoritma ini dapat mengklasifikasikan data atau kalimat sehingga menjadi suatu informasi. Data yang digunakan sebanyak 2000 data didapat dengan teknik web scrapping ulasan sepuluh aplikasi media sosial paling populer di dunia dari Google Playstore. Dari penelitian ini diketahui bahwa algoritma Naïve Bayes Classifier memiliki nilai akurasi lebih tinggi sebesar 79.8% dibandingkan algoritma K-Nearest Neighbor sebesar 50.23% dan Support Vector Machine sebesar 75.29%, sehingga algoritma Naïve Bayes Classifier lebih tepat digunakan untuk mengklasifikasi ulasan aplikasi media sosial.

Downloads

Download data is not yet available.

References

Kemp, S. (2021, Januari). DIGITAL 2021: THE LATEST INSIGHTS INTO THE ‘STATE OF DIGITAL. Retrieved Oktober 2021, from wearesocial.com: https://wearesocial.com/uk/blog/2021/01/digital-2021-the-latest-insights-into-the-state-of-digital/

Stephanie, C. (2021, Februari 23). Berapa Lama Orang Indonesia Akses Internt dan Medsos Setiap Hari? Retrieved Oktober 2021, from kompas.com: https://tekno.kompas.com/read/2021/02/23/11320087/berapa-lama-orang-indonesia-akses-internetdan-medsos-setiap-hari-[3] Reinaldi, H. (2021, July). 10 Aplikasi Media Sosial Terpopuler di Dunia, Paling Banyak Digunakan! Retrieved September 2021, from telset.id: https://telset.id/apps/aplikasi-media-sosial-populer/

C.Aggarwal, C., 2015. Data Classification: Algorithms and Applications. Berilustrasi penyunt. New York: CRC Press

Fitri, E., Yuliani, Y., Rosyida, S., & Gata, W. (2020). Analisis Sentimen Terhadap Aplikasi Ruangguru Menggunakan Algoritma Naive Bayes, Random Forest, dan Support Vector Machine. Transformatika, 71-80.

Teknomo, K. (2006). What is K-Nearest Neighbor Algoritm ? Dipetik 06 22, 2016, dari http://people.revolude.com/kardi/tutorial/KNN/What-isK-Nearest-Neighbor-Algorithm.html.

Syakuro, A. (2017). Analisis Sentimen Masyarakat Terhadap E-Commerce pada Media Sosial Menggunakan Metode Naive Bayes Classifier (NBC) dengan Seleksi . Malang.

V. N. Chawla, K. W. Bowyer, L. O. Hall dan W. P. Kegelmeyer, Journal of Artificial Intelligence Research [Internet], SMOTE: Synthetic Minority Over-Sampling Technique. [diunduh pada 2013 Mei 31] 16:321-357.Tersedia pada: http://arxiv.org/pdf/1106.1813.pdf, 2002.

V. N. Chawla, K. W. Bowyer, L. O. Hall dan W. P. Kegelmeyer, Journal of Artificial Intelligence Research [Internet], SMOTE: Synthetic Minority Over-Sampling Technique. [diunduh pada 2013 Mei 31] 16:321-357.Tersedia pada: http://arxiv.org/pdf/1106.1813.pdf, 2002.

S. Cost dan S. Salzberg, Machine Learning [Internet], A weighted Nearest Neighbor Algorithm for Learning with Symbolic Features. [diunduh pada 2013 Juli 17] 10:57-58. Boston (US): Kluwer Academic Publisher. Tersedia pada: http://parati.dca.fee.unicamp.br/media/Attachments/course IA368Q1S2012/Monografia/cost 1993.pdf, 1993.

Saadah, M. N., Atmagi, R. W., Rahayu, D. S., & Arifin, A. Z. (2013). Sistem Temu Kembali Dokumen Teks dengan Pembobotan Tf-Idf dan LCS. Jurnal Ilmiah Teknologi Informasi (JUTI), 17-20.

Liu, Bing. (2012). Sentiment Analysis and Opinion Mining. USA : Morgan & Claypool Publishers.

C.Aggarwal, C., 2015. Data Classification: Algorithms and Applications. Berilustrasi penyunt. New York: CRC Press

Vapnik, V dan Cortes, C. 1995. Support Vector Networks. Machine Learning, 20, 273-297.

Rachman, F dan Purnami, S.W. "Klasifikasi Tingkat Keganasan Breast Cancer dengan Menggunakan Regresi Logistik Ordinal dan Support Vector Machine (SVM)," Jurnal Sains dan Seni ITS, vol. 1, no. No. 1 ISSN : 2301-928X, 2012.

E. M. El Houby, N. I. Yassin, & S. Omran, “A Hybrid Approach from Ant Colony Optimization and K-nearest Neighbor for Classifying Datasets Using Selected Features,” Informatica, vol. 41, no. 4, 2017.

Downloads

Published

2021-12-30

How to Cite

Hamid Asnawi, M. ., Firmansyah, I. ., Novian, R. ., & Septiani Pontoh, R. . (2021). Perbandingan Algoritma Naïve Bayes, K-NN, dan SVM dalam Pengklasifikasian Sentimen Media Sosial. Prosiding Seminar Nasional Statistika, 10, 20. https://doi.org/10.1234/pns.v10i.85