Son altı ay boyunca, yapay zeka alanında muazzam gelişmeler gözlemledik. Stabil Diffusion’ın piyasaya sürülmesi sanat dünyasını değiştirdi ve ChatGPT-3, şarkı yazabilme, araştırma makalelerini taklit edebilme ve sıkça Google’da aranan sorulara ayrıntılı ve akıllıca cevaplar verebilme yeteneğiyle interneti sarsarak dikkatleri üzerine çekti.

Bu üretken yapay zeka gelişmeleri, yapay zeka devriminin eşiğinde olduğumuzun daha fazla bir kanıtı sunuyor.

Ancak, bu üretken yapay zeka modellerinin çoğu temel modellerdir: büyük miktarda veriyle eğitim yapan yüksek kapasiteli, gözetimsiz öğrenme sistemleridir ve bunları yapmak için milyonlarca dolarlık işlem gücüne sahip olan yalnızca iyi finanse edilmiş kurumlar yapabilirler.

Teknolojinin yaygın kullanımını sağlayan uygulama katmanlı yapay zeka geliştirme çoğu şirket tarafından hala etiketli eğitim verilerini kullanan gözetimli öğrenmeye dayanmaktadır. Temel modellerin etkileyici başarılarına rağmen, hala yapay zeka devriminin başlangıç ​​dönemlerindeyiz ve çeşitli engeller, uygulama katmanlı yapay zekanın yaygınlaşmasını engelliyor.

Bilinen veri etiketleme sorununun aşağısında, daha sonraki aşama yapay zeka gelişimini ve üretim ortamlarına dağıtımını engelleyecek ek veri engelleri bulunmaktadır.

GÖZAT!  Yapay Zeka Nedir?

Bu sorunlar, 2014’ten beri otonom araçlar gibi teknolojilerin yalnızca bir yıl uzakta olmasına rağmen, erişilebilirliği engelliyor.

Bu heyecan verici konsept modelleri, araştırma ortamlarında standart veri setlerinde iyi performans gösterirken, gerçek dünyaya yayıldığında doğru tahminler yapmakta zorlanıyorlar. Yüksek riskli üretim ortamlarında gerekli olan daha yüksek performans eşiği ile ilgili önemli bir sorun var ve sağlamlık, güvenilirlik ve bakım için önemli olan performans kriterlerini karşılayamıyorlar.

Örneğin, bu modeller genellikle aykırı değerleri ve sınır durumlarını ele alamazlar, bu nedenle otonom araçlar, bisiklet yansımalarını bisikletlerin kendisiyle karıştırır. Robot barista her beş kezden ikisinde mükemmel bir kapuçino yapabiliyor.

Sonuç olarak, “bu güzel” ve “bu kullanışlı” arasındaki yapay zeka üretim boşluğu, ML mühendislerinin ilk başta beklediğinden daha büyük ve daha zorlu oldu.

Karşı-intuitif olarak, en iyi sistemler aynı zamanda en çok insan etkileşimi gerektirir. Neyse ki, daha fazla ML mühendisi veri merkezli bir yaklaşım benimsedikçe, aktif öğrenme stratejilerinin uygulanması artmaktadır. En sofistike şirketler, bu teknolojiyi kullanarak yapay zeka üretim boşluğunu aşacak ve daha hızlı bir şekilde doğada çalışabilen modeller oluşturacaklar.

GÖZAT!  Opera Kenar Çubuğuna Chat GPT'yi Ekliyor

Aktif öğrenme nedir?

Aktif öğrenme, bir denetimli modelin eğitimini yineleyen bir süreç haline getirir. Model, büyük bir veri kümesinden başlangıçta işaretlenmiş bir veri alt kümesi ile eğitilir. Daha sonra, öğrendiklerine dayanarak geri kalan işaretsiz veriler üzerinde tahminler yapmaya çalışır. ML mühendisleri, modelin tahminlerinde ne kadar emin olduğunu değerlendirir ve çeşitli kazanım fonksiyonlarını kullanarak, işaretlenmemiş örneklerden birinin işaretlenmesinin eklenen performans faydasını nicelendirebilir.

Tahminlerinde belirsizlik ifade ederek, model eğitimi için en faydalı olacak ek verileri kendisi belirler. Böylece, bir sonraki eğitim turunda o alt kümede daha yoğun bir şekilde eğitilebilmek için işaretleyicilerden yalnızca o belirli veri tipinin daha fazla örneğini sağlamalarını ister. Bir öğrenciye hangi konuda eksik bilgisi olduğunu anlamak için sınav yapmak gibi düşünebilirsiniz. Sorunları neyin eksik olduğunu bildiğinizde, öğrencilere o konunun belirli bir yönünü daha iyi anlamaları için kitaplar, sunumlar ve diğer materyaller sağlayabilirsiniz.

Aktif öğrenme ile bir modelin eğitimi, güçlü bir geri bildirim döngüsü olan dairesel bir süreç haline gelir.

 

Paylaş