Muhammad Ilham Nurfathiya, - (2020) DNA BARCODING DENGAN ALGORITMA PARTICLE SWARM OPTIMIZATION MENGGUNAKAN APACHE SPARK SQL. S1 thesis, Universitas Pendidikan Indonesia.
Abstract
Terdapat salah satu tahap dalam DNA barcoding yang masih menggunakan metode manual seperti similarity check yang mengakibatkan tahap ini ketelitian dan waktu yang cukup lama. Data sekuens DNA makhluk hidup merupakan data yang sangat banyak pada bidang biologi. Untuk itu penelitian in membuat sebuah model komputasi untuk mendapatkan DNA barcode secara cepat dan efektif dengan mengimplementasikan algoritma particle swarm optimization pada big data platform yaitu Apache Hadoop dan Apache Spark . Data yang digunakan pada penelitian kali ini adalah data RNA SARS-CoV-2. Hasil dari program yang dibangun berupa DNA barcode yang ditemukan dari sampel yang ada berserta waktu yang dibutuhkan untuk menyelesaikan kalkulasi. Dilakukan 2 skenario pengujian, skenario pertama yaitu dengan menggunakan 4 cores dan beberapa worker nodes dan yang kedua yaitu penggunaan cluster dengan 2 worker nodes dan beberapa cores. Hasil dari penelitian ini membuktikan bahwa model komputasi yang dibangun pada big data platform menunjukan adanya perkembangan fitur dan percepatan terhadap penelitian terdahulu. There is one stage in DNA barcoding that still uses manual methods such as similarity check which results in this stage of accuracy and quite a long time. DNA sequence data of living things is very much data in the field of biology. For this reason, this research creates a computational model to obtain DNA barcodes quickly and effectively by implementing the particle swarm optimization algorithm on the big data platform, Apache Hadoop, and Apache Spark. The data used in this study is SARS-CoV-2 RNA data. The results of the program that were built consisted of DNA barcodes found from the existing sample of time needed to complete calculations. The results of this study indicate that there is a significant acceleration between standalone and big data platform with 2 experimental scenarios. The first scenario is to use 4 cores and some worker nodes and the second is to use a cluster with 2 worker nodes and several cores. This research proves that the computational model built on the big data platform shows the development of features and acceleration of previous research.
![]() |
Text
S_KOM_1604564_Title.pdf Download (3MB) |
![]() |
Text
S_KOM_1604564_Chapter1.pdf Download (76kB) |
![]() |
Text
S_KOM_1604564_Chapter2.pdf Restricted to Staf Perpustakaan Download (1MB) |
![]() |
Text
S_KOM_1604564_Chapter3.pdf Download (136kB) |
![]() |
Text
S_KOM_1604564_Chapter4.pdf Restricted to Staf Perpustakaan Download (2MB) |
![]() |
Text
S_KOM_1604564_Chapter5.pdf Download (55kB) |
![]() |
Text
S_KOM_1604564_Appendix.pdf Restricted to Staf Perpustakaan Download (1MB) |
Item Type: | Thesis (S1) |
---|---|
Additional Information: | No Panggil : S KOM MUH d-2020; NIM : 1604564 |
Uncontrolled Keywords: | Big Data, algoritma Particle Swarm Optimization, similarity check, motif discovery, DNA barcoding Big Data, Particle Swarm Optimization algorithm, similarity check, discovery motive, DNA barcoding |
Subjects: | L Education > L Education (General) Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam > Program Studi Ilmu Komputer |
Depositing User: | Muhammad Ilham Nurfathiya |
Date Deposited: | 13 Jul 2020 01:58 |
Last Modified: | 13 Jul 2020 01:58 |
URI: | http://repository.upi.edu/id/eprint/49774 |
Actions (login required)
![]() |
View Item |