LEE- Mekatronik Mühendisliği-Doktora

Bu koleksiyon için kalıcı URI

Gözat

Son Başvurular

Şimdi gösteriliyor 1 - 5 / 20
  • Öge
    Multi-agent planning with automated curriculum learning
    (Graduate School, 2025-06-11) Akgün, Onur ; Üre, Nazım Kemal ; 518182018 ; Mechatronics Engineering
    Reinforcement learning (RL) represents a formidable paradigm for training autonomous agents to master sequential decision-making tasks. Its core principle, learning through trial and error guided by a reward signal, has proven successful in a variety of domains. However, the efficacy of standard RL algorithms diminishes drastically in environments characterized by sparse rewards or complex, high-dimensional state spaces. In these challenging settings, an agent receives meaningful feedback only after executing a long and specific sequence of correct actions. This "credit assignment problem" makes exploration, the process of discovering rewarding behaviors, profoundly inefficient. An agent may wander aimlessly without ever stumbling upon the feedback necessary to learn, preventing standard algorithms from developing effective policies. To overcome this fundamental limitation, this thesis turns to curriculum learning (CL), a strategy inspired by the principles of human pedagogy. Just as we teach students arithmetic before calculus, CL structures the learning process by initially presenting the agent with simpler tasks and gradually increasing the difficulty as its competence grows. This guided approach helps the agent build foundational skills that can be leveraged to solve more complex problems. The primary bottleneck of traditional CL, however, is its reliance on manual design; creating an effective curriculum requires significant human expertise, intuition, and domain-specific knowledge, making it a process that is both laborious and difficult to generalize. This thesis addresses this critical gap by proposing a novel framework for the automated and adaptive generation of learning curricula. The central objective was to develop, implement, and rigorously evaluate an algorithmic framework, termed Bayesian Curriculum Generation (BCG), designed to dynamically construct and adapt a curriculum based on an understanding of the task's underlying structure and the agent's real-time progress. The aim is to significantly enhance the performance, stability, and sample efficiency of RL agents, particularly in complex, sparse-reward scenarios where traditional methods falter. The proposed BCG algorithm is built upon a synergistic integration of several key concepts. At its heart, the framework utilizes Bayesian Networks (BNs), a type of probabilistic graphical model, to represent the structural dependencies among the key parameters that define the tasks within an environment. For instance, in a navigation task, these parameters might include map size, the number of obstacles, or the presence of adversaries. The BN captures the probabilistic relationships between these parameters, serving as a powerful generative model. This allows the framework to sample a diverse yet coherent set of task configurations, moving beyond simple parameter randomization to generate tasks with a principled structure. A critical component of the framework is its ability to handle diverse input modalities through flexible task representation techniques. For visual environments like MiniGrid, where the state is an image, a convolutional autoencoder (CAE) is trained to compress high-dimensional observations into a low-dimensional latent feature vector. This vector captures the essential semantic content of the state, providing a compact and meaningful representation for analysis. For environments defined by a set of scalar parameters, such as the physics-based AeroRival simulator, normalized parameter vectors are used directly. Once tasks are represented in a common feature space, their difficulty is quantified. This is typically achieved by measuring the distance (e.g., Euclidean distance) between a given task's representation and that of the final target task. The intuition is that tasks with representations closer to the target are more similar in the skills they require. These raw distance values are then normalized and processed using unsupervised clustering algorithms, such as K-Means, to automatically group tasks into a discrete number of difficulty levels or "bins." This process effectively creates the structured stages of the curriculum. A defining feature of BCG is its adaptability. The curriculum is not a static, predefined sequence. Instead, the selection of tasks for the agent to train on is performed probabilistically, guided by the agent's real-time performance metrics, such as its average reward or task success rate. If an agent consistently succeeds at a certain difficulty level, the probability of sampling tasks from the next, more challenging level increases. Conversely, if the agent struggles, the framework can present it with easier tasks to help it consolidate its skills. This closed-loop system ensures the agent is always training at the edge of its capabilities, preventing both stagnation and frustration. Crucially, the BCG framework implicitly and effectively leverages transfer learning to accelerate skill acquisition. The policy and value function parameters, learned by the base RL agent (in our evaluations, Proximal Policy Optimization - PPO) on tasks from one curriculum stage, are used to initialize the learning process for the subsequent, more challenging stage. This prevents the agent from having to learn from scratch at each step, allowing it to build upon previously acquired knowledge and dramatically speeding up convergence to an optimal policy for the final task. The practical efficacy and robustness of the BCG framework were empirically validated through comprehensive experiments in two distinct and demanding RL environments. The first, MiniGrid (specifically, the DoorKey variant), provided a discrete, grid-based navigation challenge characterized by partial observability (the agent can only see a small portion of its surroundings) and a hierarchically sparse reward (the agent must first find a key, then navigate to a door, and only then receive a reward). The second, AeroRival Pursuit, offered a continuous control task involving high-speed adversarial interaction, dynamic hazard avoidance, and sparse rewards, simulating an aerial combat scenario. In both testbeds, BCG's performance was rigorously benchmarked against a baseline PPO agent (with no curriculum) and a diverse set of relevant contemporary algorithms designed to address similar challenges. The experimental results consistently and unequivocally demonstrated the superiority of the BCG approach. Across both the discrete MiniGrid and continuous AeroRival environments, agents trained with BCG achieved significantly higher final performance levels and converged on successful policies more reliably than all tested baselines. Furthermore, BCG exhibited greater learning stability, as evidenced by a lower variance in performance across multiple independent training runs, indicating that its success is not due to random chance. Notably, in MiniGrid, BCG enabled the agent to master tasks of progressively increasing complexity where many baselines failed to scale. In the highly complex AeroRival environment, BCG was the only method that consistently enabled the agent to learn a successful policy, whereas most baselines failed to obtain any positive rewards at all. This success across environments with fundamentally different dynamics underscores the versatility and generality of the framework. In conclusion, this research makes a significant contribution to the field of reinforcement learning by developing, implementing, and validating the Bayesian Curriculum Generation algorithm. BCG presents a robust, principled, and effective solution for automated and adaptive curriculum learning, particularly in challenging domains hampered by sparse rewards and complex state spaces. By synergistically combining probabilistic modeling of the task space, adaptive task selection driven by agent performance, and efficient knowledge transfer between stages, BCG successfully guides exploration and accelerates the acquisition of complex skills. While acknowledging certain limitations—such as the initial need for domain knowledge to identify parameters for the BN and the added computational overhead—the presented results are highly promising. Future work will focus on automating parameter selection, extending the framework to non-stationary environments, and further improving computational efficiency. Ultimately, BCG offers a powerful approach that advances the potential for training more capable, efficient, and autonomous AI agents in the complex scenarios of tomorrow.
  • Öge
    Özel bir piston ve kilit mekanizmasına sahip yüksek başlangıç ivmeli göğüs kompresyon cihazının tasarımı, simülasyonu ve üretimi
    (Lisansüstü Eğitim Enstitüsü, 2024-10-03) Kağızman, Ahmet ; Sezer, Volkan ; 518182013 ; Mekatronik Mühendisliği
    Kalp durması, kalbin dolaşımı sürdürebilecek yeterlilikte kan pompalama yetisini kaybetmesi durumudur. Bu durum, hipertansiyon ve damar tıkanıklığı gibi çeşitli kardiyovasküler hastalıkların yanı sıra boğulma, kaza ve elektrik çarpması gibi dış etkenler nedeniyle ortaya çıkabilir. Kalp durmasının tüm vakalarında uygulanması gereken evrensel müdahale yöntemi ise kardiyopulmoner resüsitasyon (KPR) olup, bu müdahalenin temel bileşeni göğüs kompresyonudur. Etkili bir KPR uygulaması için göğüs kompresyonlarının kalitesi kritik bir öneme sahiptir. Amerikan Kalp Derneği (AHA) yönergeleri, kalp durması vakalarında ilk tercih olarak önerilen KPR tekniğinin standart manuel KPR olması gerektiğini vurgulamaktadır. Manuel KPR'nin temel avantajı, doğru uygulandığında hastanın hayatta kalma şansını önemli ölçüde artırmasıdır; ancak bu yöntemin, kurtarıcının fiziksel durumu, yorgunluk seviyesi ve uygulama süresi gibi değişkenler nedeniyle tutarlılık ve etkinlik açısından sınırlamaları bulunmaktadır. Bu sınırlamaları aşmak ve daha stabil, ritmik ve etkin göğüs kompresyonları sağlamak amacıyla son yıllarda birçok mekanik KPR cihazı geliştirilmiştir. Geliştirilen bu cihazlar, AHA tarafından önerilen standart KPR parametrelerine ulaşabilmelerine rağmen, çeşitli randomize klinik ve gözlemsel çalışmalardan elde edilen hayatta kalma oranları, ortalama manuel KPR ile elde edilen sonuçların gerisinde kalmıştır. Bu bulgular ışığında, AHA, mekanik KPR cihazlarının rutin kullanımını önermemektedir. Göğüs kompresyonunun insan gücüyle yapılmasının, mekanik cihazlara kıyasla daha avantajlı olmasının olası nedenlerinden biri, insan vücudunun başlangıç momentumunu etkili bir şekilde kullanabilme kabiliyetidir. Yüksek başlangıç momentumuna sahip kompresyonlar, dolayısıyla yüksek kütle etkisi ve başlangıç ivmesiyle uygulanan göğüs kompresyonu, kan dolaşımının daha etkin bir biçimde sağlanmasına olanak tanıyabilir. Kalbin atım sürecinin de ani bir başlangıçla, adeta bir piston hareketi gibi gerçekleştiği bilinmektedir. Ancak günümüzde kullanılan KPR cihazları, sahip oldukları piston teknolojilerinin sınırlamaları nedeniyle, insanın üst vücut kütlesiyle gerçekleştirdiği bu dürtüsel kompresyonu tam olarak taklit edememekte ve dolayısıyla yeterli başlangıç ivmesini üretme kapasiteleri sınırlı kalmaktadır. AHA, manuel KPR uygulamalarında, kurtarıcının fiziksel kapasitesini zorlamadan kompresyon derinliği ve kalitesinin korunmasını sağlamak ve yorgunluğu minimize etmek amacıyla %50 görev döngüsü kullanılmasını önermektedir. Bu doğrultuda, mevcut KPR cihazları, AHA'nın belirlediği %50 görev döngüsüne uygun şekilde tasarlanmıştır. Bununla birlikte, son yıllarda yapılan bilimsel çalışmalar, daha düşük görev döngülerinin, ileriye doğru kan akışını artırma potansiyeline sahip olduğunu ortaya koymuştur. "İleriye doğru kan akışı", kalpten çıkan ve sistemik dolaşıma katılan kanın etkinliğini ifade eder; bu akışın artırılması, organlara ve dokulara daha fazla oksijenli kanın taşınmasını sağlar. Ayrıca, bu araştırmalar, düşük görev döngüsünün kan dolaşımının artması ve resüsitasyon sonuçlarının iyileşmesi gibi hemodinamik etkiler üzerinde olumlu sonuçlar doğurabileceğine dair bulgular sunmaktadır. Mevcut KPR cihazları, kalp durması anlarında hızlı ve etkili müdahale sağlama hedefi güderken, kurulum aşamasında sıkça zorluk yaşanmaktadır. Cihazın hastanın gövdesine uygun şekilde yerleştirilmesi, hizalanması ve sabitlenmesi, genellikle zaman alıcı ve teknik bilgi gerektiren bir süreçtir. Bu kurulum zorlukları, cihazın ergonomik tasarımı, kullanıcı arayüzü ve taşıma koşullarına bağlı olarak değişiklik göstermekte olup, acil durumlarda kritik zaman kaybına neden olabilir. Bu da resüsitasyon sürecinin etkinliğini doğrudan etkileyebilir ve hastanın iyileşme şansını azaltabilir. Bu bağlamda, cihazların kurulum süreçlerinin sadeleştirilmesi ve kullanıcı dostu hale getirilmesi, acil durum müdahalelerini hızlandırmak adına kritik bir gereklilik olarak öne çıkmaktadır. Bu tez çalışmasında, mevcut KPR cihazlarının eksikliklerini gidermek ve kalp masajı etkinliğini artırmak amacıyla, CardiS adı verilen yenilikçi bir otomatik KPR cihazı geliştirilmiş ve üretilmiştir. Geliştirilen bu cihaz, patentli piston mekanizması sayesinde, yüksek başlangıç ivmeli göğüs kompresyonları yapabilmekte ve görev döngüsünü geleneksel %50 seviyesinden daha düşük oranlarda uygulayarak, ileriye doğru kan akışını maksimize etmeyi amaçlamaktadır. Bu benzersiz piston mekanizması, çift kaydırıcı krank, dinamik biyel ve özel güç aktarma organları gibi bileşenlerle donatılmış olup, mevcut cihazlarda kullanılan klasik piston mekanizmalarından belirgin bir şekilde ayrılmaktadır. Ayrıca, cihazın taşınabilir ve kompakt yapısı, ayarlanabilir ve daha tutarlı kompresyon derinliği sunma yeteneği ile optimize edilmiştir. Cihazın hastaya hızlı ve zahmetsiz bir şekilde entegre edilebilmesi için ise, radyal ve eksenel kilitleme özelliklerine sahip otomatik sekiz dilli bayonet kilit mekanizması geliştirilmiş ve üretilmiştir. Herhangi bir hizalama gerektirmeyen ve daha düşük kuvvetle kilitleme sağlayan bu kilit sistemi sayesinde KPR cihazları için kritik bir öneme sahip olan hızlı kurulum işlemi etkili bir şekilde gerçekleştirilebilmektedir. Bu özellikleriyle, geliştirilen cihazın manuel KPR'ye kıyasla kardiyak fonksiyonları daha hassas bir şekilde taklit ederek, ani kalp durması vakalarında mortalite oranlarını anlamlı ölçüde azaltma potansiyeline sahip olduğu öngörülmektedir. Cihazın mekanik tasarımı, kalp masajı sırasında optimal bası ve ritmin sağlanabilmesi amacıyla, yapısal dayanıklılık, ergonomi ve işlevsellik unsurları göz önünde bulundurularak titizlikle kurgulanmıştır. Gövde malzemesi seçiminde, geleneksel karbon fiber ve fiberglas yerine, en uygun termoplastik malzemenin uygulanabilirliği, çok boyutlu analizlerle kapsamlı bir şekilde değerlendirilmiştir. Bu süreçte, mesafe tabanlı sezgisel bulanık Çok Kriterli Karar Verme (ÇKKV) yöntemleri etkin bir araç olarak kullanılmıştır. Ayrıca, cihazın teleskopik uzama mekanizması, yatay kolların hastaya uygun şekilde manuel olarak sağa-sola ve yukarı-aşağı hareket ettirilmesine olanak tanıyacak biçimde tasarlanmıştır, böylece cihaz farklı hasta anatomilerine kolayca uyum sağlayabilmektedir. Kompresyon derinliğinin aktüatörler aracılığıyla otomatik ayarlanabilmesi için geliştirilen doğrusal potansiyometre sistemi, hastanın göğüs derinliğini yüksek doğrulukla ölçme yeteneğine sahiptir. Buna ek olarak, cihazın otomatik kilit sistemi, üretim maliyetlerini düşürmek ve imalat sürecini verimli hale getirmek amacıyla çok parçalı bir yapıda tasarlanmıştır. Bu modüler yapı, yalnızca üretimde esneklik sağlamakla kalmayıp, aynı zamanda bakım ve onarım süreçlerini de kolaylaştıran önemli bir avantaj sunmaktadır. Elektronik tasarım sürecinde, cihazın güvenilir ve doğru bir şekilde çalışabilmesi için gerekli elektronik bileşenlerin seçim ve entegrasyonu titizlikle ele alınmıştır. Cihazın gövde tasarımında elektronik bileşenler için ayrılan alan, bu bileşenlerin optimal bir şekilde yerleştirilmesini gerektirdiğinden, güç dağıtımı ve yönetimini sağlayan güç kartı ile sistemin genel kontrolünü gerçekleştiren ana kart olmak üzere iki ayrı devre kartı tasarlanmış ve üretilmiştir. Sistemin yazılımı, konum ve hız bilgisi sağlayan Hall sensörleri ile donatılmış fırçasız DC motorun sürülmesi ve bu motorun hızının yüksek hassasiyetle kontrol edilebilmesi için STM32F091 mikrodenetleyici kullanılarak C dilinde geliştirilmiştir. Buna ek olarak, cihazın matematiksel modeli, kalp masajı sırasında uygulanan anlık kompresyon derinliği, hız ve ivme gibi hayati parametrelerin yüksek doğrulukla ölçülmesi ve analiz edilmesi amacıyla oluşturulmuştur. Geliştirilen cihazın üretim süreci üç aşamada ele alınmıştır. İlk aşamada, kompresyon modülünün üretimi, işlevsel gereksinimlere uygun olarak planlanmış ve yürütülmüştür. İkinci aşamada, cihazın hastanın anatomik yapısına uyum sağlayan yatay kollar ve teleskopik uzama mekanizmasının üretimi detaylandırılmıştır. Üçüncü ve son aşamada ise cihazın sırt tahtası ve bayonet kilit mekanizmasının üretimi gerçekleştirilmiştir. Her bileşenin tasarımı, üretim teknikleri ve kullanılan malzemeler titizlikle incelenmiş, böylece cihazın işlevselliği ve güvenilirliği artırılmıştır. Karmaşık tasarımlar için 3B yazıcı teknolojisi kullanılarak endüstriyel ölçekte ve maliyet etkin bir süreç benimsenmiştir. Bu yöntem, tekrarlı üretim süreçlerini kolaylaştırmanın yanı sıra düşük hacimli üretim ihtiyaçlarına da önemli avantajlar sunmuştur. 3B yazıcı teknolojisinin üretim sürecinde sağladığı esneklik, maliyet etkinliği ve hız avantajları, özellikle hızlı prototipleme ve özelleştirilmiş üretim süreçlerinde dikkate değer iyileştirmeler sağlamıştır. KPR cihazının performansını değerlendirmek amacıyla yapılan testler üç temel kategoriye ayrılmıştır. İlk olarak, CardiS cihazının piston mekanizmasının statik kuvvet analizi ANSYS yazılımı ile yapılmış, hareket simülasyonu ise Altair Inspire platformunda gerçekleştirilmiştir. Simülasyon sonuçları, LUCAS II ve Corpuls cihazlarıyla kıyaslanmıştır. Bu değerlendirme sırasında, cihazların anlık ivme, ortalama ivme ve maksimum hız gibi kritik parametreleri detaylı bir şekilde incelenmiştir. İkinci olarak, CardiS ve LUCAS II cihazlarının performansları, CPRLily PRO+ KPR mankeni üzerinde standart KPR parametreleri temel alınarak karşılaştırılmıştır. Bu kapsamda, her iki cihaz da dakikada 100 kompresyon yapacak şekilde ayarlanmış ve 1, 5 ve 10 dakikalık periyotlar halinde test edilmiştir. Her iki cihazın da tam geri tepme yeteneği gösterdiği tespit edilmiş, ancak CardiS cihazının kompresyon derinliğinde daha yüksek bir tutarlılık sağladığı belirlenmiştir. Kesintisiz kompresyon uygulaması tercih edildiği için kompresyon fraksiyonu ölçümüne ihtiyaç duyulmamıştır. Elde edilen bulgular, her iki cihazın da AHA yönergelerinde belirtilen KPR standartlarını karşıladığını, ancak CardiS cihazının kompresyon derinliği konusunda daha istikrarlı bir performans sergilediğini göstermiştir. Ayrıca, video analiz yöntemiyle yapılan incelemelerde, cihazların göğüs kompresyon zamanlamaları detaylı bir şekilde değerlendirilmiş ve bu analizler, CardiS cihazının standartlara uyumunu objektif olarak ortaya koymuştur. Son olarak, CardiS ve LUCAS 3 cihazlarının pistonlarına entegre edilen ivme sensörlerinden elde edilen anlık ivme verileri karşılaştırılarak, her iki cihazın performans dinamikleri detaylı bir şekilde analiz edilmiştir. Yapılan bu ölçümler, CardiS cihazının ivme ve performans parametreleri açısından üstün bir başarı sergilediğini ve bu başarıların, KPR uygulamaları için yeni bir standart oluşturma potansiyeline sahip olduğunu göstermiştir.
  • Öge
    Applications of deep reinforcement learning for advanced driving assistance systems
    (Graduate School, 2023-07-23) Yavaş, Muharrem Uğur ; Kumbasar, Tufan ; 518162005 ; Mechatronics Engineering
    Nowadays, advanced driving support systems are becoming more prevalent every day. For instance, although adaptive cruise control has been present in some mass-produced vehicles since 1980, it is now available in almost every new vehicle model and is becoming usable, especially in congested traffic situations, with the help of developing technology. On the other hand, the autonomous lane centering function developed for highway environments reduces the driving load on drivers. One of the main reasons for the advancement and prevalence of technology is the progress in environmental perception sensors. Decision-making algorithms can obtain high-accuracy positions of lanes and other vehicles' speed and positions on the road by blending data from intelligent camera and radar sensors. Thanks to advancements in artificial intelligence research, the main topic of this thesis is to evaluate the conditions of surrounding vehicles to achieve cruise follow speed, the amount of gas or brake applied, and finally, the lane changing decision by deep reinforcement learning. Deep reinforcement learning is the integration of reinforcement learning theory into new generation artificial neural networks that emerged with the deep learning revolution. In the proposed methods, both the adaptive cruise control and autonomous lane-changing functions designed with deep reinforcement learning have taken more optimal decisions than classical algorithms and the similarity between the decisions taken and those taken by human drivers has been revealed. Adaptive cruise control systems typically calculate the amount of acceleration required to maintain a safe following distance by using information about the distance to the closest vehicle. However, this method is not compatible with human driving behavior, as it involves scanning the entire traffic and taking into account the dynamic elements surrounding the vehicle being driven. In one of our proposed solutions, we designed the adaptive cruise control function using a model-based deep reinforcement learning method. In model-based reinforcement learning, the decision-making policy uses its own internal model during training to minimize interaction with the system. Therefore, one artificial neural network creates the decision-making policy, while a second network creates the internal model. By using the proposed meta-learning approach to train the two neural networks in a closed-loop fashion, we selected two leader vehicle data inputs for the algorithm instead of a single one. In our simulation environment, the model-based artificial intelligence algorithm performed better than the classical intelligent driver model. Additionally, we proposed a hybrid method that switches to the classical driver model if the internal model and real-world observations do not match for a certain period of time, with a fallback mechanism added to the system's internal model. xxiii In the second proposed study on adaptive cruise control, we suggested a discrete driver model inspired by human drivers' use of gas and brake pedals to manipulate them directly. In the analysis performed using data collected from real life, it was observed that drivers were driving at a stable state with certain gas and brake pedals and coped with dynamic conditions by applying delta brake or pedal. Different gas and brake delta levels were determined through statistical inference based on this dataset. In this case, as the inputs of the artificial intelligence algorithm, the position and speeds of all vehicles in a multi-lane highway in front of the vehicle were determined. When considering the superiority of the algorithms that work with a single leader vehicle compared to two leader vehicles on a single lane, the information of the vehicles on the adjacent lanes will help in case of changes in the leading vehicle of the ego vehicle. The deep Q-learning algorithm, which provides the best results in discrete outputs, was used as the decision-making algorithm. In the evaluations performed on both simulation and real test data, the proposed algorithm obtained the highest score. Especially, slowing down the vehicle in line with its own friction by giving a 0 output without pressing both gas and brake pedals, which can be evaluated as tactical decision-making, was frequently preferred by the designed algorithm. The other advanced driver assistance system studied in the thesis work is the autonomous lane-changing function. In the first original study, autonomous lane-changing was designed using deep reinforcement learning method, and the normally long training process was accelerated 5 times with the proposed safety reward feedback. In the autonomous lane-changing problem, the critical task is to process the position and speed information from all vehicles in front and behind in traffic and make safe maneuvers that will cause speed increase at the right time. Especially in complex traffic scenarios created in simulated environments, classical algorithms are adversely affected by sensor uncertainties and noises, and they cannot show optimal performance in the dynamic driving of multiple vehicles. With the uncertainty calculation in the designed deep reinforcement learning algorithm, the confidence level of the decisions made is observed, and progress is made in the important research area of explainable artificial intelligence. It seems that although deep reinforcement learning techniques have achieved significant successes, they still face integration issues in real-world applications. One of the main problems is the lengthy training process, which can take millions of steps, and the fact that policies are optimized through trial and error, making training in real systems impossible. One promising area of research is sim2real transfer, which involves transferring policies trained in simulation directly to real-world applications. In the second original study on autonomous lane changing, a new approach was introduced to measure the transferability between two simulators with different resolutions. The transferability was evaluated using a human-like usage score generated from the traffic situations when lane-changing decisions were made. In the training process, an adjusted reward function was used, and the proposed method outperformed reference methods in terms of both efficiency and safety, achieving the highest human-like lane-changing score.
  • Öge
    Developing mobile robot obstacle avoidance methods with model-based and learning-based methods
    (Graduate School, 2023-07-19) Özdemir, Aykut ; Bogosyan, Seta O. ; 518162010 ; Mechatronics Engineering
    Mobile robot navigation is a crucial area of research and development in robotics that focuses on enabling robots to move autonomously in their environments. Mobile robots are increasingly being used in a wide range of applications, including manufacturing, healthcare, transportation, and search and rescue missions. These robots have the potential to improve efficiency, reduce costs, and enhance safety in a variety of industries. However, for mobile robots to be effective, they must be able to navigate their surroundings with accuracy and reliability. Navigation involves the robot's ability to perceive its environment, plan a path, and execute that path while avoiding obstacles and other hazards. The development of mobile robot navigation systems has been a major area of focus in robotics research for several decades, and it continues to evolve rapidly. Advances in technologies such as sensors, computing, and machine learning have enabled mobile robots to navigate more complex environments and perform increasingly sophisticated tasks. As such, mobile robot navigation is a critical area of study for researchers and engineers who seek to develop intelligent and autonomous systems that can operate in real-world environments. Path planning and obstacle avoidance are two important topics in robotics that are closely related. Path planning refers to the process of determining a safe and efficient path for a robot to travel from its current location to a desired destination. This process takes into account the robot's movement capabilities, the environment it is operating in, and any obstacles that may be present. Obstacle avoidance, on the other hand, involves the robot's ability to detect and avoid obstacles as it navigates its environment. This is an essential component of path planning, as the robot must be able to react to changes in its environment and modify its path accordingly in order to avoid collisions and ensure safety. Both path planning and obstacle avoidance are critical for the development of autonomous robots that can navigate complex environments and perform tasks without human intervention. These topics are the focus of ongoing research in the field of robotics, and advances in technologies such as sensors, mapping algorithms, and machine learning are enabling robots to navigate increasingly complex environments with greater efficiency and safety. This study proposes three novel contributions in the field of robotics. The first is a novel model-based obstacle avoidance method that plans local trajectories by passing through gaps between obstacles. The second is a learning-based sampling method that improves the efficiency of trajectory planning for path planning algorithms. Finally, we proposed a non-holonomic local planner that uses a CNN-based sampling technique. These contributions aim to improve the navigation and path planning capabilities of robots, allowing them to operate more efficiently and safely in complex environments. Overall, this thesis demonstrates the potential of using advanced techniques and technologies, such as machine learning and local planning, to enhance the performance and capabilities of mobile robots.
  • Öge
    A novel gripper design based on series elastic actuator for object recognition and manipulation
    (Graduate School, 2023-03-03) Kaya, Ozan ; Ertuğrul, Şeniz ; 518162009 ; Mechatronics Engineering
    Because of Industry 4.0 and its following releases, robotic applications are becoming more significant. The goal of using robots is to automate industrial processes and increase production yield. However, there are still study topics that need to be explored for other problems, such as safety and cooperation. Furthermore, sensor technologies are another important subject for automation. In general, sensors like encoders, cameras, lidar, and proximity are chosen for the control algorithm's feedback sensors. Many times, when only one sensor is used, sensor technologies are insufficient to identify or describe incidental obstacles. Due to this, two or more sensors may be required for continuity and safety. Alternatively, it is proposed that a gripper design with external effect sensitivity may be useful in both reducing the number of sensors and inherently sensing the external effects. For this purpose, a novel gripper mechanism design based on SEA is achieved for object recognition and manipulation. For a low-cost solution, one actuator with a ball-screw mechanism as a linear actuator is used for the fingers' positions. As it is based on SEA, the spring is placed between the linear actuator and the fingers. With this method, the finger can be actuated by one motor. However, they can be rotated independently by external effects. To estimate the external force, the length of the spring is computed by using absolute encoders. As a result of these, the proposed gripper mechanism is sensitive to external effects and can be used for estimating force without any force/torque sensor or tactile sensor. For object recognition, the proposed gripper interacts with the objects placed at the workspace. However, this is not enough to recognize an object. Hence, a DNN model is needed to interpret the interaction between the gripper and an object. Therefore, a DNN model is created in order to achieve recognition by using the points on the defined objects' surfaces. For the training part of DNN, a synthetic data set is generated via CloudCompare. As a result of different hyperparameters' effects on the DNN model, the best model is achieved for the recognition of 11 objects. The experiments are conducted in MEAM laboratory with the gripper mounted on the Staubli Rx160 robot arm. It is proposed for object manipulation that the gripper has the ability to compensate for position faults caused by controller error, an inaccurate model, and so on. The proposed gripper can successfully perform common industrial tasks such as peg-in-hole and surfaces following in collaborative applications. To prove this approach, the experiments are conducted with a haptic device and the gripper mounted on the Staubli Rx160 robot arm and used untrained operators. The results are compared according to control strategies. For this purpose, the user operates the tasks in cases of no guidance and a rigid gripper mechanism, guidance and a rigid gripper mechanism, and a series elastic gripper mechanism with guidance.