DeepMind, karmaşık yazılım zorluklarını çözmek için çalışma kodu oluşturabilen bir araç geliştirdi
İngiltere merkezli bir yapay zeka şirketi olan DeepMind, bazı makinelerine bilgisayar yazılımı yazmayı öğretti ve rekabette değerlendirildiğinde neredeyse ortalama bir insan programcı kadar iyi performans gösteriyor.
DeepMind, yeni AlphaCode sisteminin mantık, eleştirel düşünme ve doğal dili anlama yeteneğinin bir kombinasyonunu gerektiren yazılım problemlerini çözebileceğini iddia ediyor. Araç, insan katılımcıların kodlama becerilerini test ettiği programlama yarışması web sitesi Codeforces‘ta 10 turda uygulandı. Bu 10 turda, AlphaCode ortalama rakibin seviyesinde yer aldı. DeepMind, bunun bir AI kod yazma sisteminin programlama yarışmalarında rekabetçi bir performans düzeyine ilk kez ulaştığını söylüyor.
AlphaCode, GitHub yazılım deposundan ve Codeforces yarışmalarına daha önce katılanlardan alınan birçok kodlama örneğinde bir sinir ağının eğitilmesiyle oluşturuldu. Yeni bir problemle sunulduğunda, hem C++ hem de Python programlama dillerinde çok sayıda çözüm üretir. Daha sonra bunları filtreler ve ilk 10’da sıralar. Alphacode rekabette test edildiğinde, insanlar bu çözümleri değerlendirdi ve en iyilerini sundu.
[affiliate_news id=”893″]
Belirli bir çıktının başarıya ne kadar yakın olduğunu değerlendirmek zor olduğundan, kod oluşturmak AI için özellikle zorlu bir sorundur. Kilitlenen ve dolayısıyla amacına ulaşamayan kod, mükemmel çalışan bir çözümden tek bir karakter uzakta olabilir ve birden çok çalışma çözümü kökten farklı görünebilir. Programlama yarışmalarını çözmek, aynı zamanda, İngilizce yazılmış bir problemin tanımından anlam çıkarmak için bir yapay zeka gerektirir.
Microsoft‘a ait GitHub, geçen yıl Copilot adlı benzer ancak daha sınırlı bir araç oluşturdu. Milyonlarca insan kaynak kodunu paylaşmak ve yazılım projelerini düzenlemek için GitHub’ı kullanıyor. Yardımcı pilot bu kodu aldı ve onunla bir sinir ağını eğiterek benzer programlama problemlerini çözmesini sağladı.
Ancak araç, birçok kişinin bu eğitim verilerini doğrudan intihal edebileceğini iddia ettiği için tartışmalıydı. Sentry yazılım şirketinden Armin Ronacher, Copilot‘tan orijinal programcının yorumlarıyla birlikte 1999 bilgisayar oyunu Quake III Arena‘dan telif hakkıyla korunan kod önermesini istemenin mümkün olduğunu buldu . Bu kod izin alınmadan tekrar kullanılamaz.
Copilot’un lansmanında GitHub, kod önerilerinin yaklaşık yüzde 0,1’inin eğitim setinden kelimesi kelimesine kaynak kodunun “bazı parçacıkları” içerebileceğini söyledi. Şirket ayrıca, Copilot’un telefon numaraları, e-posta adresleri veya adlar gibi gerçek kişisel verileri vermesinin mümkün olduğu ve çıktı alınan kodun “önyargılı, ayrımcı, taciz edici veya saldırgan çıktılar” sunabileceği veya güvenlik açıkları içerebileceği konusunda uyardı. Kodun kullanımdan önce incelenip test edilmesi gerektiğini söylüyor.
AlphaCode, Copilot gibi, ilk olarak GitHub’da barındırılan herkese açık kodlar üzerinde eğitildi. Daha sonra programlama yarışmalarından kod üzerinde ince ayar yapıldı. DeepMind, AlphaCode’un önceki örneklerden kod kopyalamadığını söylüyor. İngiltere‘deki Manchester Üniversitesi‘nden Riza Theresa Batista-Navarro , DeepMind’ın baskı öncesi makalesinde sağladığı örnekler göz önüne alındığında, eğitim verilerinden insanların halihazırda yaptığından yalnızca biraz daha fazla kod kopyalarken sorunları çözüyor gibi göründüğünü söylüyor .
Ancak AlphaCode, karmaşık zorlukları çözmek için o kadar ince ayarlanmış görünüyor ki, AI kodlama araçlarındaki önceki son teknoloji, daha basit görevlerde hala daha iyi performans gösterebiliyor.
Batista-Navarro, “Fark ettiğim şey, AlphaCode’un rekabet mücadelelerinde GPT gibi en son teknolojiye sahip yapay zekalardan daha iyi performans gösterebilmesine rağmen, başlangıç zorluklarında nispeten daha zayıf olduğudur” diyor. “Varsayım şu ki, giriş seviyesindeki problemlerden ziyade daha zorlu programlama problemlerinin üstesinden gelmek için rekabet düzeyinde programlama problemleri yapmak istiyorlardı. Ancak bu, modelin daha karmaşık problemler üzerinde o kadar iyi ayarlandığını gösteriyor ki, bir bakıma giriş seviyesindeki problemleri unutmuş gibi görünüyor.”
DeepMind görüşme için müsait değildi, ancak DeepMind’den Oriol Vinyals bir açıklamada şunları söyledi: “ML’nin [makine öğreniminin] rakipler arasında insan ortalamasına ulaşmasını asla beklemiyordum. Ancak, en yüksek performans gösterenler seviyesine ulaşmak ve yapay zeka sistemlerimizin problem çözme yeteneklerini geliştirmek için hala yapılacak işler olduğunu gösteriyor.”