FDA VAERS aşı veritabanında dengesiz COVID-19 verilerinin veri madenciliği ve mongodb ile sorgulama sisteminin geliştirilmesi: Web uygulaması

No Thumbnail Available

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Covid-19 bulaşıcı hastalığı, bütün dünyada büyük oranda insanların hastalanmasına ve hayatlarını kaybetmesine neden olmuştur. Bu salgını önlemek için aşılar geliştirilmiş ve bu aşıların insanlar üzerindeki etkileri önemli bir araştırma konusu haline gelmiştir. Bu çalışmanın amacı, VAERS verileri ile Covid-19 aşılarının farklı değişkenler temelinde semptomlarının belirlenmesi ve semptomların ilişki düzeylerinin de belirlenmesidir. Bu çalışma iki aşamadan oluşmaktadır. Birinci aşamada VAERS veri seti kullanılarak WEKA programı yardımıyla veri madenciliği yapılmıştır. VAERS veri tabanından alınan verilerinde sınıf olarak seçilen ölüm durumu niteliği, dengesiz bir şekilde dağılmaktadır. Verilerin daha dengeli hale gelebilmesi için çeşitli örnekleme yöntemleri uygulanmış ve daha sonra sınıflandırma algoritmaları ile sınıflandırılarak, bu yöntemlerin performansları incelenmiştir. Çalışmanın ikinci aşamasında VAERS verileri kullanılarak MongoDB programı yardımıyla web ara yüzü geliştirilmiştir. Geliştirilen web ara yüz ile sorgulama yapılmakta, yapılan sorgulama ile aşıların en çok görülen semptomları görülmektedir. Semptomların aşı ile ilişki seviyesini belirten noktasal karşılıklı bilgi (PMI) değeri hesaplanmaktadır. Bu sayede bireyler aşılarda görülen en sık semptomları ve semptomların aşı ile ilişki düzeyini rahatlıkla görebilmektedir. Geliştirilen ara yüz kullanıcı dostudur ve rahatlıkla herhangi bir kişi tarafından kullanılabilmektedir. Ek olarak elde edilen sonuçlarda, dengesiz veri setleri için geliştirilen örnekleme yöntemlerinin sınıflandırma başarısını arttırdığı görülmüştür.
The COVID-19 contagious disease has caused a great deal of people to get sick and die all over the world. Vaccines have been developed to prevent this epidemic, and the effects of these vaccines on humans have become an important research topic. The aim of this study is to determine the symptoms of Covid-19 vaccines on the basis of different variables with VAERS data and to determine the relationship levels of symptoms. This study consists of two stages. In the first stage, data mining was carried out with the help of WEKA program using the VAERS data set. The death status attribute selected as a class in the data from the VAERS database is unevenly distributed. In order to make the data more balanced, various sampling methods were applied and then classified by classification algorithms and the performances of these methods were examined. In the second stage of the study, a web interface was developed with the help of MongoDB program using VAERS data. Query is made with the developed web interface, and the most common symptoms of vaccines are seen with the query. The point reciprocal information (PMI) value, which indicates the level of association of symptoms with the vaccine, is calculated. In this way, individuals can easily see the most common symptoms seen in vaccines and the level of relationship between the symptoms and the vaccine province. The developed interface is user-friendly and can be easily used by anyone. In addition, in the results obtained, it was seen that the sampling methods developed for unbalanced data sets increased the classification success.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Aşılar, Computer Engineering and Computer Science and Control, COVID 19, Vaccines, Sınıflandırma, COVID 19, Classification, Veri setleri, Data sets

Turkish CoHE Thesis Center URL

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page