Verimli seçmeli güvenli bir veri seti kümelemesi önerisi ve otonom sürüşe yönelik bir uygulaması

dc.contributor.advisorAkgün, Bekir Tevfik
dc.contributor.authorKızılırmak, Fahrettin Orkun
dc.date.accessioned2024-08-07T20:06:33Z
dc.date.available2024-08-07T20:06:33Z
dc.date.issued2019
dc.departmentFen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
dc.description.abstractBu çalışmanın amacı sürücüsüz araçlara yönelik örnek toplama açısından verimli bir uçtan uca derin öğrenme algoritması geliştirmektir. Bunu da elde edilen örnekleri seçici olarak sınıflandırma ile, sürüş politikasını geliştirmek adına, uzman sürücüyü en az sayıda çağırarak yapmaya çalışmaktır. Uçtan uca taklit öğrenmesi sürücüsüz sürüş politikalarında kullanılan popüler bir yöntemdir. Standart yaklaşım giriş (kamera görüntüleri) ve çıkış (direksiyon açısı vb.) ikililerini uzman sürücüden toplayıp bir derin sinir ağı içerisine yerleştirmek üzerinedir. Bu yaklaşım geçmişte bazı başarılı örnekler sergilemiş olsa da bir sürüş politikası öğrenmek uzman sürücüden alınan çok fazla örneğe ihtiyaç duymaktadır ki bu da kaynak açısından çok maliyetlidir. Bu çalışmada güvenli veri seti kümelemesi (SafeDAgger) yaklaşımı üzerine temellendirilmiş, öğrenilmiş politikanın farklı güzergâh sınıflarına ayrıldığı ve her bir sınıfın her bir tekrarda zayıflıklarına göre değerlendirildiği, özgün bir algoritma çerçevesi geliştirilmiştir. Her bir zayıf güzergâh parçası belirlendikten sonra, örnek toplayan algoritma yalnızca bu zayıf bölgelerde uzman politikayı çağırmak üzere tanımlanmıştır, bu da uzmana yapılan çağrıların sayısını ve politikanın yakınsama oranını önemli bir ölçüde azaltmaktadır. Yapılan simülasyon sonuçları göstermektedir ki yaklaşım uzmandan aynı sayıda örnek toplanırken standart SafeDAgger algoritmasına göre önemli ölçüde daha başarılı sonuçlar sunmuştur.
dc.description.abstractThe objective of this work is to develop a sample efficient end-to-end deep learning method for self-driving cars, where it is attempted to minimize number of times the expert driver is called to improve the driving policy, through selective analysis of the obtained samples. End-to-end imitation learning is a popular method for computing self-driving car policies. The standard approach relies on collecting pairs of inputs (camera images) and outputs (steering angle etc.) from an expert policy and fitting a deep neural network to this data to learn the driving policy. Although this approach had some successful demonstrations in the past, learning a good policy might require a lot of samples from the expert driver, which might be resource-consuming. In this work, a novel framework developed based on the Safe Dataset Aggregation (safe DAgger) approach, where the current learned policy is automatically segmented into different trajectory classes, and the algorithm identifies trajectory segments/classes with weak performance at each step. Once the weak trajectory segments are identified, sampling algorithm focuses on calling the expert policy only on these segments, which significantly lowers both the number of times the expert is called and the convergence rate. The presented simulation results show that the proposed approach can yield significantly better performance compared to the standard Safe DAgger algorithm, while using the same number of samples from the expert.en
dc.identifier.endpage86en_US
dc.identifier.urihttps://hdl.handle.net/20.500.14517/4943
dc.identifier.yoktezhttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=vjszP7PzV0HebcjFEvDfwHZY4i-IPjTSJgWmB_m7EOwFFaI-g1EpZG611wJrlJLw
dc.language.isotr
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleVerimli seçmeli güvenli bir veri seti kümelemesi önerisi ve otonom sürüşe yönelik bir uygulaması
dc.titleA sample efficient selective safe data aggregeration proposal and an application for autonomous driveen_US
dc.typeMaster Thesisen_US
dspace.entity.typePublication

Files