LEE- Elektronik Mühendisliği-Yüksek Lisans
Bu koleksiyon için kalıcı URI
Gözat
Yazar "Akgül, Tankut" ile LEE- Elektronik Mühendisliği-Yüksek Lisans'a göz atma
Sayfa başına sonuç
Sıralama Seçenekleri
-
ÖgeImplementation of the YOLOv8 convolutional neural network block on fpga(Graduate School, 2025-01-07) İlhan, Celilşamil ; Akgül, Tankut ; 504211237 ; Electronics EngineeringConvolutional Neural Networks (CNNs) are among the most extensively studied topics, with applications in areas such as computer vision, object detection, and image processing. CNN operations are divided into two main phases: training and inference. Training requires intensive computations, including forward and backward propagation. Forward propagation estimates output using current weights, while backward propagation calculates the error between predicted and actual outputs, updating weights iteratively using gradient descent. Hardware acceleration studies focus on improving either training or inference, given the computational intensity of CNNs, which often require millions of operations for a single output. Hardware platforms for CNNs include CPUs, GPUs, FPGAs, and ASICs. While ASICs offer high speed, their cost and single-purpose nature limit their use. CPUs lack flexibility for custom operations, and GPUs are best suited for tasks with high-density algorithms. However, GPUs show performance limitations for workloads with low-density algorithms. FPGAs fill this gap by offering reconfigurable architecture, parallelism, and pipelining, making them versatile for both simple and complex CNN layers. In this study, FPGA-based CNN implementations achieved a maximum frequency of 275 MHz, with most IP blocks operating at 250 MHz. Hard-wired structures were utilized for data storage, outperforming LUT-based approaches in terms of efficiency and temporal performance. BRAM-based FIFO structures with depths ranging from 16 to 512 entries provided substantial improvements, although benefits plateaued beyond 512 entries. Cascading also minimized delays caused by repeated memory fetches. In this study, parallelization is one of the main factors of performance increase. For example, with 8 parallel operations, the best execution time was 0.14 seconds, which could drop to around 0.07 seconds with 16 parallel operations. This highlights the importance of extensive parallelization, particularly in deeper CNN layers with more channels. Optimal performance requires segmented designs with minimal LUT and Flip-Flop utilization to maximize frequency and avoid internal resource bottlenecks. In conclusion, the study emphasizes parallelization, correct use of hard-wired structures, and cascading as critical strategies to enhance CNN performance on FPGAs while ensuring resource efficiency and scalability.
-
Ögeİnsansız hava araçlarında gömülü yapay zeka tabanlı görüntü eşleştirme yöntemi ve uygulaması(Lisansüstü Eğitim Enstitüsü, 2023) Öksüz, Engin ; Akgül, Tankut ; 817014 ; Elektronik Mühendisliği Bilim Dalıİnsansız Hava Araçları (İHA) günümüzde fotoğraf, gözetleme, haritalama ve araştırma amaçlı olarak yaygın bir şekilde kullanılmaktadır. Bir İHA'nın hava görevlerini sorunsuz bir şekilde yerine getirebilmesinin ön koşulu, kendi konumunun doğru bir şekilde konumlandırılmasıdır. Geleneksel İHA navigasyonu, konumlandırma için Küresel Navigasyon Uydu Sistemine (GNSS) dayanır; ancak bu sistem istikrarsızlık ve girişime yatkınlık gibi dezavantajlara sahiptir. İHA uygulamalarının hem endüstriyel hem de araştırma senaryolarında hızlanan gelişimi göz önüne alındığında, bu hava sistemlerinin, görüntü tabanlı yöntemlerle şehir içi veya kırsal ortamlarda yerelleştirilmesi ihtiyacı da artmaktadır. Bu tez çalışması kapsamında bir İHA'nın coğrafi koordinatlarını hesaplamak için derin öğrenme tabanlı özelliklerden yararlanan görsel tabanlı bir konumlandırma algoritması geliştirilmiş ve çalışması yapılmıştır.