ANALISIS SENTIMEN PADA ULASAN IMDb DENGAN ALGORITMA NAÏVE BAYES DAN SVM

Agustama, Andri Tri (2025) ANALISIS SENTIMEN PADA ULASAN IMDb DENGAN ALGORITMA NAÏVE BAYES DAN SVM. Undergraduate thesis, Uniersitas Nusantara PGRI Kediri.

[img] Text (Full text)
RAMA_57201_2113030051.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (2MB) | Request a copy
[img] Text (Similarity)
RAMA_57201_2113030051_SIMILARITY.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (964kB)
[img] Text (Cover sd BAB 1 + References)
RAMA_57201_2113030051_0731087703_0712108103_01_front_ref.pdf - Accepted Version
Available under License Creative Commons Public Domain Dedication.

Download (561kB)
[img] Text (BAB 2)
RAMA_57201_2113030051_0731087703_0712108103_02.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (177kB) | Request a copy
[img] Text (BAB 3)
RAMA_57201_2113030051_0731087703_0712108103_03.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (193kB) | Request a copy
[img] Text (BAB 4)
RAMA_57201_2113030051_0731087703_0712108103_04.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (407kB) | Request a copy
[img] Text (BAB 5)
RAMA_57201_2113030051_0731087703_0712108103_05.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (10kB) | Request a copy
[img] Text (References)
RAMA_57201_2113030051_0731087703_0712108103_06-ref.pdf - Bibliography
Available under License Creative Commons Public Domain Dedication.

Download (146kB)
[img] Text (Lampiran)
RAMA_57201_2113030051_0731087703_0712108103_07_lamp.pdf - Accepted Version
Restricted to Registered users only
Available under License Creative Commons Public Domain Dedication.

Download (862kB) | Request a copy

Abstract

Pertumbuhan ulasan film di platform IMDb memicu kebutuhan akan metode otomatis untuk mengklasifikasi sentimen secara efektif. Kompleksitas struktur bahasa, penggunaan kata informal, hingga adanya emotikon dan slang menjadi tantangan tersendiri dalam proses klasifikasi sentimen. Keterbatasan analisis manual, yang memerlukan waktu dan tenaga besar, mendorong pemanfaatan teknik Natural Language Processing (NLP) untuk meningkatkan efisiensi dan akurasi dalam menganalisis opini penonton. Penelitian ini bertujuan untuk membandingkan kinerja algoritma Naïve Bayes dan Support Vector Machine (SVM) dalam analisis sentimen ulasan film di IMDb menggunakan metode Machine learning. Data diperoleh dari Kaggle, kemudian melalui proses preprocessing seperti cleaning teks, tokenisasi, penghapusan stopword, dan stemming, serta pembobotan menggunakan metode TF-IDF. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score, serta didukung dengan visualisasi confusion matrix dan wordcloud. Hasil penelitian menunjukkan bahwa SVM memperoleh akurasi sebesar 89%, sedikit lebih tinggi dibandingkan Naïve Bayes yang mencatatkan akurasi 87%. Selain itu, SVM juga unggul dalam nilai presisi dan F1-score pada kedua kelas sentimen. Kedua model menunjukkan kemampuan yang baik dalam memetakan opini publik terhadap film, meskipun SVM lebih konsisten dalam performa klasifikasi. Kesimpulan dari penelitian ini menyatakan bahwa algoritma SVM lebih efektif untuk analisis sentimen ulasan IMDb dibandingkan Naïve Bayes. Meski demikian, Naïve Bayes tetap relevan untuk kebutuhan komputasi yang lebih ringan. Penelitian ini memiliki keterbatasan pada dua kategori sentimen saja (positif dan negatif) serta lingkup data IMDb. Pengembangan selanjutnya disarankan untuk menambahkan kategori netral, menerapkan algoritma lanjutan seperti LSTM atau BERT, serta memperluas dataset dari berbagai platform ulasan film lainnya.

Item Type: Thesis (Undergraduate)
Uncontrolled Keywords: Analisis Sentimen, IMDb, Naïve Bayes, Support Vector Machine, TF-IDF.
Subjects: 410 Engineering science > 457 Computer engineering
410 Engineering science > 459 Computer science
410 Engineering science > 461 Information systems
Divisions: Fakultas Teknik dan Ilmu Komputer > S1-Sistem Informasi
Depositing User: Andri Tri Agustama
Last Modified: 06 Aug 2025 14:37
URI: http://repository.unpkediri.ac.id/id/eprint/19805

Actions (login required)

View Item View Item