Pradhana, Akmal Hisyam (2025) MENGGALI ENTITAS PADA CERITA KLASIK SASTRA JAWA MENGGUNAKAN NAMED ENTITY RECOGNITION: PELESTARIAN BUDAYA MELALUI PENDEKATAN MACHINE LEARNING. Undergraduate thesis, Universitas Nusantara PGRI Kediri.
![]() |
Text (Full Text)
RAMA_57201_2113030019.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (2MB) | Request a copy |
![]() |
Text (Similarity)
RAMA_57201_2113030019_SIMILARITY.pdf - Accepted Version Available under License Creative Commons Public Domain Dedication. Download (964kB) |
![]() |
Text (Cover sd BAB 1 + References)
RAMA_57201_2113030019_0723058501_0706098902_01_front_ref.pdf - Accepted Version Available under License Creative Commons Public Domain Dedication. Download (823kB) |
![]() |
Text (BAB 2)
RAMA_57201_2113030019_0723058501_0706098902_02.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (608kB) | Request a copy |
![]() |
Text (BAB 3)
RAMA_57201_2113030019_0723058501_0706098902_03.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (260kB) | Request a copy |
![]() |
Text (BAB 4)
RAMA_57201_2113030019_0723058501_0706098902_04.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (450kB) | Request a copy |
![]() |
Text (BAB 5)
RAMA_57201_2113030019_0723058501_0706098902_05.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (179kB) | Request a copy |
![]() |
Text (References)
RAMA_57201_2113030019_0723058501_0706098902_06_ref.pdf - Bibliography Available under License Creative Commons Public Domain Dedication. Download (196kB) |
![]() |
Text (Lampiran)
RAMA_57201_2113030019_0723058501_0706098902_07_lamp.pdf - Accepted Version Restricted to Registered users only Available under License Creative Commons Public Domain Dedication. Download (1MB) | Request a copy |
Abstract
Cerita rakyat merupakan bagian penting dari warisan budaya Indonesia yang diwariskan secara turun-temurun dan mencerminkan nilai-nilai moral, sejarah, serta identitas lokal. Salah satu bentuk cerita rakyat yang menonjol adalah Cerita Klasik Sastra Jawa, yang seringkali dituturkan secara lisan dan memuat unsur mitos, legenda, serta simbol budaya. Di era digital saat ini, kebutuhan untuk mengolah cerita-cerita tersebut secara otomatis semakin mendesak, khususnya dalam konteks pelestarian dan pemanfaatan informasi budaya. Namun, proses identifikasi entitas penting seperti tokoh, lokasi, dan organisasi dalam cerita-cerita tersebut masih banyak dilakukan secara manual, yang memerlukan waktu lama dan berisiko tidak konsisten. Penelitian ini bertujuan untuk mengembangkan sistem otomatis dalam identifikasi entitas menggunakan metode Named Entity Recognition (NER) pada teks Cerita Klasik Sastra Jawa. Penelitian menggunakan pendekatan kuantitatif berbasis Natural Language Processing (NLP) dan mengimplementasikan dua model, yaitu NER dengan library spaCy dan arsitektur Bi-LSTM. Dataset yang digunakan berupa cerita Panji dalam format JSON. Proses meliputi ekstraksi entitas menggunakan model xx_ent_wiki_sm dari spaCy dan evaluasi kinerja model melalui metrik akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa model NER berbasis spaCy berhasil mengidentifikasi total 289 entitas, dengan dominasi entitas Person (73%). Akurasi rata-rata model spaCy mencapai 0,96 dengan F1-score tertinggi pada entitas Person dan Organization (0,99). Model Bi-LSTM menunjukkan akurasi lebih tinggi, yaitu 99%, meskipun performa terbaik hanya terlihat pada entitas dengan jumlah data pelatihan yang besar. Visualisasi entitas dalam bentuk diagram pie juga memperkuat temuan distribusi entitas dalam teks. Kesimpulan dari penelitian ini menegaskan bahwa NER mampu secara efektif mengidentifikasi entitas dalam cerita klasik sastra Jawa. Namun, terdapat keterbatasan pada variasi data dan kompleksitas bahasa naratif lokal. Penelitian selanjutnya disarankan untuk mengeksplorasi model berbasis Transformer seperti IndoBERT dan memperluas cakupan dataset agar sistem dapat lebih adaptif terhadap variasi budaya dan bahasa yang lebih luas di Indonesia.
Item Type: | Thesis (Undergraduate) |
---|---|
Uncontrolled Keywords: | Bi-LSTM, Cerita Rakyat, Named Entity Recognition, NLP, spaCy. |
Subjects: | 410 Engineering science > 459 Computer science 410 Engineering science > 461 Information systems 410 Engineering science > 462 Information technology |
Divisions: | Fakultas Teknik dan Ilmu Komputer > S1-Sistem Informasi |
Depositing User: | Akmal Hisyam Pradhana |
Last Modified: | 06 Aug 2025 09:11 |
URI: | http://repository.unpkediri.ac.id/id/eprint/18336 |
Actions (login required)
![]() |
View Item |