KBÜ'den yapılan açıklamaya göre, Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü Dr. Öğretim Üyesi Doğan Urgun, "TÜBİTAK 3501 Kariyer Geliştirme Programı" kapsamında desteklenmeye hak kazanan projesiyle yapay zeka alanında yeni yaklaşıma öncülük ediyor.
Modern yapay zeka sistemlerinin karmaşık enerji problemlerini çözme kapasitelerini artırmaya odaklanan ve çoklu erkinli takviyeli öğrenme (MARL) yöntemini temel alan çalışmada, birden fazla yapay zeka erkinin (ajanın) daha verimli öğrenmesi için otonom ödül fonksiyonu tasarlanacak.
Proje, özellikle büyük dil modelleri ve pekiştirmeli öğrenme yöntemleri kullanılarak otonom sistemlerin optimizasyonuna odaklanıyor. Bu yenilikçi yaklaşımın, enerji verimliliği ve sürdürülebilirlik konularında önemli katkılar sağlaması bekleniyor.
Proje kapsamında, ödül fonksiyonları yapay zeka tarafından analiz edilip optimize edilecek ve sistemin öğrenme süreci iteratif şekilde iyileştirilecek. Bu süreçte yapay zeka, ödül sistemindeki eksiklikleri tespit ederek kendini güncelleyecek ve daha etkili öğrenme ortamı sağlayacak. Böylece insan müdahalesine duyulan ihtiyaç en aza indirilecek, yapay zekanın karmaşık enerji problemlerini çözme kapasitesi artırılacak.
- "Projemiz ödül mekanizmasının tasarımı üzerine odaklanıyor"
Açıklamada görüşlerine yer verilen Urgun, projenin pekiştirmeli öğrenme sistemlerinin iyileştirilmesi üzerine tasarlanan bir çalışma olduğunu belirtti.
Pekiştirmeli öğrenmenin yapay zekanın deneme-yanılma yöntemiyle eğitilmesine dayalı sistem olduğunu anlatan Urgun, "Yapay zeka kendisine tanınan alan içerisinde aksiyon alır ve bu aksiyonun sonucunda olumlu ya da olumsuz ödül kazanır. Yapay zekanın amacı mümkün olduğunca fazla olumlu ödül toplamaktır. Projemiz özellikle bu ödül mekanizmasının tasarımı üzerine odaklanıyor." ifadesini kullandı.
Urgun, pekiştirmeli öğrenme sistemlerinde ödül fonksiyonlarının kritik rol oynadığını ve kompleks sistemlerde birden fazla yapay zekanın rekabet veya işbirliği içinde olabileceğine dikkat çekerek, şunları kaydetti:
"Bu sistemin tasarlanması için genellikle ödül fonksiyonu dediğimiz tasarıma ihtiyaç duyulmakta. Bu fonksiyonun nasıl tasarlanacağıyla ilgili genel bir yöntem şu anda bulunmamaktadır. Genellikle alanın uzmanları tarafından sisteme yönelik ve her sistem için yeni fonksiyon tanımlanır. Projedeki amacımız bu ödül fonksiyonunun dil modelleri, büyük dil modelleri kullanarak iteratif şekilde otonom algoritma içerisinde otonom şekilde bu ödül fonksiyonunun tasarlanabilir mi? Bunun üzerine araştırmalarımızı gerçekleştireceğiz. Bir nevi bir yapay zekanın başka bir yapay zekayı eğitmesi gibi düşünebilirsiniz."