
अलिकडच्या वर्षांत, संगणक शास्त्रज्ञांनी रोबोटिक एजंटच्या हालचाली निर्देशित करण्यासाठी वाढत्या प्रमाणात अत्याधुनिक अल्गोरिदम तयार केले आहेत. यामध्ये मॉडेल प्रेडिक्टिव कंट्रोल (एमपीसी) स्ट्रॅटेजी समाविष्ट आहेत ज्या एजंटच्या डायनॅमिक्सच्या मॉडेलचा वापर करून दिलेल्या लक्ष्याप्रती त्याच्या जवळ येणारे वर्तन ऑप्टिमाइझ करण्यासाठी अडथळ्यांच्या संचाचे समाधान करतात (उदाहरणार्थ, अडथळ्यांना न मारता).
मॉडेल प्रेडिक्टिव कंट्रोल स्ट्रॅटेजीज आणि आर्टिफिशियल न्यूरल नेटवर्क टेक्नॉलॉजीज
रिअल-टाइम न्यूरल MPC ही एक फ्रेमवर्क आहे जी कृत्रिम न्यूरल नेटवर्क्स (ANNs) वर आधारित जटिल मॉडेल आर्किटेक्चर्सला मोबाइल रोबोट्स (म्हणजे क्वाड्रोटर-ड्रोन्स) साठी MPC फ्रेमवर्कमध्ये समाकलित करते. हे नुकतेच म्युनिकच्या टेक्निकल युनिव्हर्सिटी आणि झुरिच विद्यापीठातील संशोधकांनी विकसित केले आहे. ही कल्पना, IEEE रोबोटिक्स आणि ऑटोमेशन लेटर्समध्ये नोंदवली गेली आहे, पूर्वी झुरिच रोबोटिक्स आणि परसेप्शन ग्रुप युनिव्हर्सिटीने तयार केलेली कल्पना विस्तारित करते.
म्युनिकच्या टेक्निकल युनिव्हर्सिटीच्या ऑटोनॉमस एअर सिस्टीम ग्रुपचे संशोधक टिम साल्झमन आणि मार्कस रायल टेक म्हणाले: “डेव्हिड स्कारामुझ्झा यांच्या नेतृत्वाखालील रोबोटिक्स आणि सेन्सिंग ग्रुपचे डेटा असण्याची त्यांची मूळ कल्पना विकसित करण्यासाठी आम्ही उत्कृष्ट काम पाहिले. -चालित (शिकलेले) घटक जे 'पारंपारिक' नियंत्रण अल्गोरिदमला सामर्थ्य देतात. आम्ही लगेच मोहित झालो.
“गॉसियन प्रोसेसेस (GPs) चा वापर करून त्यांचा दृष्टिकोन सामान्य न्यूरल नेटवर्क्स (डीप लर्निंग मॉडेल्स) पर्यंत विस्तारित करण्यासाठी प्रूफ-ऑफ-संकल्पना विकसित केल्यानंतर, आम्ही झुरिच विद्यापीठातील रोबोटिक्स आणि परसेप्शन ग्रुपसमोर आमची कल्पना मांडली. या क्षणापासून, दोन प्रयोगशाळांचे तांत्रिक कार्य आणि चाचणी संयुक्तपणे प्रगती केली आणि एक नवीन भागीदारी प्रज्वलित केली. ”
डीप लर्निंग मॉडेल्स आणि ऑनलाइन MPC ऑप्टिमायझेशन Salzmann, Ryll et al यांनी प्रस्तावित केलेल्या नवीन फ्रेमवर्कमध्ये एकत्र केले आहे. डीप लर्निंग एक्स्प्रेशन मॉडेल्सना खूप गणनेची आवश्यकता असते. तरीही, हे मॉडेल रिअल-टाइममध्ये ऑनलाइन प्रभावीपणे प्रस्तुत करण्यासाठी फ्रेमवर्क स्पेशलाइज्ड हार्डवेअर (GPUs) वापरू शकते. हे त्यांच्या सिस्टमला रिअल टाइममध्ये रोबोट्ससाठी सर्वोत्तम कृतीचा अंदाज लावू देते.
Salzmann आणि Ryll म्हणाले: “रिअल-टाइम न्यूरल MPC फ्रेमवर्क दोन डोमेन्सना इष्टतम नियंत्रण आणि सखोल शिक्षण एकत्र करण्यास सक्षम करते, दोन्ही भागांना त्यांच्या स्वत:च्या अत्यंत ऑप्टिमाइझ केलेल्या फ्रेमवर्क आणि संगणकीय उपकरणांचा लाभ घेण्यास अनुमती देते. “म्हणून, CPU वर संकलित केलेल्या C कोडमध्ये कंट्रोल ऑप्टिमायझेशन केले जाऊ शकते, तर डीप लर्निंग कंप्युटेशन्स PyTorch/Tensorflow मधील GPU वर करता येतात. हे ऑन-बोर्ड क्वाड्रोटर इष्टतम नियंत्रणासारख्या आत्तापर्यंत अव्यवहार्य असलेल्या अनुप्रयोगांमध्ये सखोल शिक्षण वापरण्यास सक्षम करते.
संशोधक सिम्युलेशन आणि फील्ड-आधारित चाचण्यांच्या मालिकेद्वारे त्यांच्या फ्रेमवर्कचे मूल्यांकन करतात. या अभ्यासांमध्ये, हे विशेषतः रिअल टाइममध्ये उच्च मोबाइल क्वाड्रोटरच्या हालचाली नियंत्रित करण्यासाठी वापरले जाते.
रिअल टाइममध्ये मोबाइल रोबोट्सच्या हालचालींचे नियमन करण्यासाठी पूर्वी वापरल्या जाणार्या पॅरामेट्रिक क्षमतेच्या न्यूरल नेटवर्क टोपोलॉजीज 4.000 पट जास्त वापरण्याची क्षमता त्यांना खूप आशादायक परिणाम प्राप्त करण्यास अनुमती देते. त्यांनी हे देखील शोधून काढले की त्यांनी विकसित केलेले फ्रेमवर्क सखोल शिक्षण घटकाशिवाय पारंपारिक MPC दृष्टिकोनांच्या तुलनेत स्थानिक ट्रॅकिंग त्रुटी 82% पर्यंत कमी करू शकते.
साल्झमन आणि रायल यांच्या मते, "रोबोटिक्समध्ये, आम्ही नियंत्रित प्रणालींच्या गतिशीलतेचे आणि पर्यावरणाशी त्यांच्या परस्परसंवादाचे अर्थपूर्ण नमुने शोधतो (उदा. वायुगतिकीय प्रभाव, टायरचे घर्षण इ.)". "याचे विश्लेषण करणे अनेकदा कठीण असले तरी, शिकण्यावर आधारित पद्धती, विशेषत: न्यूरल नेटवर्क वापरणाऱ्या, डायनॅमिक्स आणि परस्परसंवाद प्रभाव कॅप्चर करू शकतात. तथापि, न्यूरल नेटवर्कच्या आकारासह मॉडेलची अचूकता वाढते. जेव्हा रीअल-टाइम न्यूरल MPC मध्ये डीप लर्निंग मॉडेल्स वापरले जातात, तेव्हा हे मॉडेल पूर्वीच्या शक्यतेपेक्षा अधिक शक्तिशाली आणि भविष्यसूचक नियंत्रणात कार्यक्षम असते.”
नुकत्याच सादर केलेल्या Nvidia Jetson प्लॅटफॉर्मद्वारे दाखवल्याप्रमाणे GPU चिप्स हळूहळू एम्बेडेड सिस्टममध्ये प्रवेश करत आहेत. संशोधकांच्या या चमूने लवकरच एक फ्रेमवर्क विकसित केले आहे जे डिझाइनरना अत्याधुनिक डेटा-चालित AI तंत्रांच्या उच्च अंदाज शक्तीचा लाभ घेण्यास सक्षम करेल ज्यामुळे रोबोट्सची गतिशीलता आणि पर्यावरणासह परस्परसंवाद अधिक चांगल्या प्रकारे मॉडेल करता येईल, अपघातांचा धोका कमी होईल आणि नेव्हिगेशन क्षमता सुधारेल, एकत्रीकरण GPU चिप्स.
साल्झमन आणि रायल यांनी नमूद केले की पुढील अभ्यासासाठी अनेक अनपेक्षित शक्यता आहेत. प्रशिक्षण डेटा (नॉन-डिस्ट्रिब्युटेड OOD) मध्ये समाविष्ट नसलेल्या परिस्थितींसाठी सखोल शिक्षण पद्धतींचे आउटपुट अप्रत्याशित असू शकते. OOD परिस्थितींमध्ये मजबूतता त्या परिस्थितींचा शोध घेण्यापासून आणि सिस्टम स्थिर करण्यासाठी नियंत्रणासाठी फॉलबॅक प्रदान केल्याने येईल.
स्रोत: techxplore.com/news
Günceleme: 13/03/2023 14:09