Najma Qalbi Dwiharani, - and Yudi Wibisono, - and Yaya Wihardi, - (2025) PENERAPAN LARGE LANGUAGE MODELS DALAM PEMBARUAN ARTIKEL BIOGRAFI WIKIPEDIA. S1 thesis, Universitas Pendidikan Indonesia.
Abstract
Wikipedia merupakan sumber informasi daring yang sangat populer di Indonesia, namun pembaruan artikelnya masih sangat bergantung pada kontribusi penyunting. Pada kategori artikel biografi, pembaruan informasi secara berkala sangat penting karena adanya perkembangan karier dan peristiwa terkini dari tokoh yang bersangkutan. Penelitian ini mengeksplorasi penerapan Large Language Models (LLM) untuk pembaruan artikel biografi Wikipedia Bahasa Indonesia dengan memanfaatkan berita daring sebagai sumber informasi. Data dikumpulkan dengan mengambil riwayat revisi dari artikel biografi Wikipedia Indonesia dan mengidentifikasi berita yang tercantum pada referensi artikel tersebut sebagai sumber informasi baru. Pasangan artikel Wikipedia sebelum pembaruan dan artikel berita terkait kemudian diformat menjadi prompt sebagai masukan bagi model. Penelitian ini menguji lima strategi prompting yang berbeda, yaitu simple prompt, system prompt Bahasa Inggris, system prompt Bahasa Indonesia, one-shot, dan prompt chaining. Tiga model digunakan, yaitu Phi-3-mini sebagai baseline, serta Gemma 3 varian 1B dan 4B sebagai model utama. Selain pengujian model pretrained, dilakukan pula fine-tuning menggunakan Unsloth pada Gemma 3 1B dan 4B untuk menyesuaikan model dengan domain Wikipedia. Evaluasi menggunakan metrik ROUGE menunjukkan bahwa kombinasi terbaik diperoleh pada Gemma 3 4B pretrained dengan strategi system prompt (en) dan Gemma 3 4B finetuned dengan strategi simple prompt. Hasil penelitian ini menunjukkan bahwa LLM, khususnya Gemma 3, dapat diterapkan secara efektif untuk pembaruan artikel biografi Wikipedia, dengan hasil optimal jika didukung perancangan prompt yang tepat dan fine-tuning menggunakan data relevan. Wikipedia is a widely popular online source of information in Indonesia, yet the updating of its articles still heavily relies on contributions from volunteer editors. In the case of biographical articles, regular updates are crucial due to the continuous developments in individuals' careers and public events. This study aims to explore the use of Large Language Models (LLMs) to assist in adding new information to Indonesian Wikipedia biography articles using a single online news article as a reference. The dataset was constructed by extracting revision histories of Indonesian Wikipedia biography articles and identifying news articles cited in their references as sources of novel factual content. Each pair—comprising the pre-update Wikipedia article and the corresponding news article—was formatted into prompts as model inputs. Five prompting strategies were evaluated: simple prompt, system prompt (English), system prompt (Indonesian), one-shot, and prompt chaining. Three models were examined: Phi-3-mini as the baseline, and Gemma 3 with 1B and 4B parameters as the primary models. In addition to inference on pretrained models, domain adaptation was performed via fine-tuning using the Unsloth framework on Gemma 3 1B and 4B to better align them with Wikipedia’s style and content. Performance was assessed using the ROUGE metric, with the best results achieved by Gemma 3 4B (pretrained) with the system prompt (English) strategy, and Gemma 3 4B (finetuned) with the simple prompt strategy. The findings demonstrate that LLMs—particularly Gemma 3—are highly effective for the task of Wikipedia biography article updating, achieving optimal outcomes when paired with well-engineered prompts and domain-specific fine-tuning.
![]() |
Text
S_KOM_2102843_Title.pdf Download (487kB) |
![]() |
Text
S_KOM_2102843_Chapter1.pdf Download (604kB) |
![]() |
Text
S_KOM_2102843_Chapter2.pdf Restricted to Staf Perpustakaan Download (1MB) |
![]() |
Text
S_KOM_2102843_Chapter3.pdf Download (376kB) |
![]() |
Text
S_KOM_2120843_Chapter4.pdf Restricted to Staf Perpustakaan Download (1MB) |
![]() |
Text
S_KOM_2120843_Chapter5.pdf Download (258kB) |
Item Type: | Thesis (S1) |
---|---|
Additional Information: | https://scholar.google.com/citations?user=TSCZUYAAAAAJ&hl=en&oi=sra ID SINTA Dosen Pembimbing: Yudi Wibisono: 260167 Yaya Wihardi: 5994413 |
Uncontrolled Keywords: | Wikipedia, Biografi, Berita, Pembaruan Artikel, Large Language Models. Wikipedia, Biography, News, Article Update, Large Language Models. |
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science T Technology > T Technology (General) |
Divisions: | Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer |
Depositing User: | Najma Qalbi Dwiharani |
Date Deposited: | 09 Sep 2025 02:27 |
Last Modified: | 09 Sep 2025 02:27 |
URI: | http://repository.upi.edu/id/eprint/138219 |
Actions (login required)
![]() |
View Item |