Muhammad Melvyn Maunti, - (2024) EKSTRAKSI FITUR KOMPETENSI SOAL ERROR IDENTIFICATION TOEFL MENGGUNAKAN NATURAL LANGUAGE PROCESSING. S1 thesis, Universitas Pendidikan Indonesia.
Text
S_KOM_1904575_Title.pdf Download (336kB) |
|
Text
S_KOM_1904575_Chapter2.pdf Restricted to Staf Perpustakaan Download (316kB) |
|
Text
S_KOM_1904575_Chapter1.pdf Download (67kB) |
|
Text
S_KOM_1904575_Chapter3.pdf Download (171kB) |
|
Text
S_KOM_1904575_Chapter5.pdf Download (37kB) |
|
Text
S_KOM_1904575_Appendix.pdf Restricted to Staf Perpustakaan Download (97kB) |
|
Text
S_KOM_1904575_Chapter4.pdf Restricted to Staf Perpustakaan Download (870kB) |
Abstract
Tes TOEFL (Test of English as a Foreign Language) merupakan salah satu tes standard yang digunakan untuk mengukur kemampuan Bahasa Inggris seseorang, terutama bagi mereka yang ingin melanjutkan studi atau bekerja di lingkungan internasional. Salah satu bagian dalam tes TOEFL adalah Error Identification, yang menguji kemampuan peserta dalam mengenali kesalahan gramatikal dalam kalimat. Penelitian ini bertujuan untuk membangun sebuah sistem yang mampu mengekstraksi fitur kompetensi gramatikal yang diujikan dalam soal Error Identification TOEFL menggunakan teknik Natural Language Processing (NLP). Penelitian ini menggunakan 50 soal latihan TOEFL sebagai dataset. Tahap awal penelitian melibatkan pengumpulan data, preprocessing teks, dan ekstraksi fitur menggunakan library Spacy dalam bahasa pemrograman Python. Terdapat 13 fitur dan kompetensi gramatikal yang diekstraksi, meliputi verbs, tenses, infinitives, passives, prepositions, dan lain-lain. Model NLP yang dibangun memanfaatkan informasi POS tagging dan dependency parsing untuk mengidentifikasi pola kesalahan gramatikal pada setiap soal. Evaluasi model dilakukan dengan membandingkan hasil ekstraksi fitur otomatis dengan hasil identifikasi manual oleh ahli di bidang Bahasa Inggris. Hasil evaluasi menunjukkan bahwa model mampu mengekstraksi fitur kompetensi gramatikal dengan akurasi rata-rata sebesar 72%. Penelitian ini menunjukkan potensi penerapan NLP dalam mengembangkan sistem otomatis untuk analisis soal TOEFL, khususnya pada bagian Error Identification. The TOEFL (Test of English as a Foreign Language) test is one of the standard tests used to measure a person's English ability, especially for those who want to continue their studies or work in an international environment. One part of the TOEFL test is Error Identification, which tests participants' ability to recognize grammatical errors in sentences. This study aims to build a system that is able to extract grammatical features and competencies tested in TOEFL Error Identification questions using Natural Language Processing (NLP) techniques. This study uses 50 TOEFL practice questions as a dataset. The initial stages of the study include data collection, text preprocessing, and feature extraction using the Spacy library in the Python programming language. There are 13 grammatical features and competencies extracted, including verbs, tenses, infinitives, passives, prepositions, and others. The NLP model built utilizes POS tagging information and dependency parsing to identify grammatical error patterns in each question. The evaluation model is carried out by comparing the results of automatic feature extraction with the results of manual identification by four experts in the field of English. The evaluation results show that the model is able to extract grammatical features and competencies with an average accuracy of 72%. This study shows the potential of applying NLP in developing an automated system for TOEFL question analysis, especially in the Error Identification section.
Item Type: | Thesis (S1) |
---|---|
Additional Information: | ID SINTA Dosen Pembimbing: Lala Septem Riza: 5975668 Yaya Wihardi: 5994413 |
Uncontrolled Keywords: | TOEFL, Error Identification, Natural Language Processing, Ekstraksi Fitur, Kompetensi Gramatikal. TOEFL, Error Identification, Natural Language Processing, Feature Extraction, Gramatical Competences. |
Subjects: | P Language and Literature > PE English Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer |
Depositing User: | Muhammad Melvyn Maunti |
Date Deposited: | 12 Sep 2024 06:07 |
Last Modified: | 12 Sep 2024 06:07 |
URI: | http://repository.upi.edu/id/eprint/124396 |
Actions (login required)
View Item |