Bugün, yüksek matematik, istatistik, stokastik, sadece endüstri mühendisliğinde okutulan gezgin satıcı problemi, en kısa yol algoritması ve benzeri konuların işlendiği yöneylem araştırması gibi dersleri vererek yapay zekayı anlamamın mutluluğunu yaşatan tüm öğretmenlerime teşekkür ediyorum.
Onlarca yıllık bir geçmişi olsa da, bir google çalışanının 2017 yılında yazdığı “Tüm ihtiyacın dikkat” (Attention is all you need) başlığı ile Beatles’ın “all you need is love” şarkısına gönderme yapan makalesi, ChatGPT devriminin ve genel yapay zeka tartışmalarının başlangıcı sayılıyor.
Peki ne anlatıyor bu makale? Özetle, hayatta her şeyi
a0x0+a1x1..+b
şeklinde bir fonksiyon ile ifade edebiliriz.
Diyelim ki meslek seçerken tüm dikkatimizi verdiğimiz şey maaş olsun. a’nın 1, b’nin 0 olduğu ax+b fonksiyonunda x yerine maaş yazarak beynimizde tek bir nöronla kolayca karar verebiliriz.
Ama hayat o kadar basit değil. Diyelim ki bir de elimize aşağıdaki tablo geçti.
Şimdi x0 ve x1 olmak üzere iki bilinmeyen var:
a0x0+a1x1+b.
Maaş ve işsiz kalma olasılıklarını iki bilinmeyen yaparsak, bunların hangisinin bizim için daha önemli olduğuna göre saptadığımız a0 ve a1 ağırlıkları ile çarpıp toplarsak karşımıza bir çizgi çıkar. Çizginin üstünde kalanlardan birini meslek olarak kendimize seçeriz, altında kalanlardan uzak dururuz.
Ama hayat daha da kompleks. Elimizde sadece yukarıdaki tablo ve maaş bilgisi verisi olsa dahi beynimiz sorular üretmeye başladı, yeni değişkenler geliyor. Örneğin 20 yıl sonra seçtiğiniz meslek yok olacaksa kaç yıl çalışacağınız da önemli bir kriter. Artık denklem 3 bilinmeyenli. Ama mantık hala aynı:
a0x0+a1x1+a2x2+b .
Yeni datalar geldikçe hangi iş beni mutlu eder, hangi iş için eleman açığı var gibi bir sürü yeni değişken ekleyerek fonksiyonu genişletebiliriz. Artık bir kağıda 2 boyutlu bir x,y düzlemi bir de çizgi çizip ya da üçüncü boyutta bir düzlem çizip karar veremeyiz, çok boyutlu bir dünyadayız.
Bu durumda fonksiyon artık çizemediğimiz, hayal etmesi zorlaşan bir hiper düzlem.
Başa dönersek; yaptığımız hatayı farkettiniz mi? Hayatta çözümler aradığımız çok kompleks problemleri, değişkenleri verip tek bir çizgi, veya tek bir hiper düzleme yakınsadığımız fonksiyonlar ile kararlar vermeye çalıştık.
Eğer öyle olsa idi otonom araçlar çok kaza yapardı, beynimiz çok yanlış kararlar alırdı. Gerçekte fonksiyon çok daha kompleks. Örneğin mesleğimize karar verirken bir noktaya kadar maaş önemlidir de bir noktadan sonra işsiz kalmanın etkisi karesi ile artabilir.
Aslında fonksiyon çok kompleks de olsa basitçe bir çizgiye yakınsayabiliriz ama kararlarımız çok hatalı, zayıf bir zekanın ürünü olur. O zaman daha mükemmel kararlar için ne yapabiliriz?
İnsan beyninin nöronlar ile çalışma şeklini taklit ederek problemi binlerce hatta milyarlarca node’a bölebiliriz. Her bir node’da a0x0+a1x1+…anxn+b fonksiyonu çalışır sonucu bir sonraki node’a iletir.
Peki ama böyle devasa bir problemde a’ları, b’leri nasıl bulacağım? Ben bulmayacağım, bilgisayar bulacak, hem de deneyerek, öğrenerek, problemin çeşidine göre belli algoritmalar kullanarak. İşte yapay zeka bu!
Böylesine dev bir problem bolca matrisler ve vektörler çarpımı gerektiriyor. Bu sebepledir ki, matris çarpımlarının esas olduğu ekran kartı üreticisi NVIDIA, hisseleri son günlerde tavan yaparak, dünyanın en değerli firması oldu.
Tüm ihtiyacın dikkat! makalesi yıllardır zaten büyük gelişmeler gösteren dil algoritmalarına bir node ekleyerek devrim yarattı. Cümle içinde her bir kelimenin diğerine ne kadar dikkat edeceği. a’lar b’lerden oluşan yeni bir node, yeni bir matris, bilgisayarın daha iyi cümleler kurabilmesini, daha iyi çeviriler yapabilmesini sağladı.
Ama yapay zekanın bu günlerde bu kadar gündemde olmasının tek sebebi ChatGPT değil. Daha önemli bir gelişme var. Artık arkasındaki matematiği anlamadan, algoritmaları tam olarak bilmeden programlama dilleri ile programcılar ürün geliştirebiliyorlar. Sadece bol bol veri vererek öğrenmesini, gelişmesini karar vermesini bekliyorlar. İş kolaylaştı, matematikçilerin elinden programcıların eline geçti. ChatGPT gibi uygulamaların arkasındaki büyük veriyi, dev matematiği tek bir bilgisayar komutu ile kullanabiliyorlar.
Yapay zekayı öğrenin diyenler de, arkasındaki matematiği kastetmiyor, ona emir vermeyi öğrenerek insanlık adına (daha çok ekonomi adına) bir şeyler üretin diyorlar.
İnsanoğlu insan beynindeki nöronların nasıl çalıştığını hala anlamadı, ama konuşma dilleri geliştirerek onları anlamadan, hükmetmeyi öğrendi. Yapay zeka da şu aşamada onun gibi.
Peki bölünmeyi, kopyalamayı, çoğalmayı, kendini korumayı ve değiştirmeyi, verileri toplayabilecekleri göz, kulak gibi uzuvlar geliştirebilmeyi öğretirsek tek bir OL komutu ile milyonlarca yıl da süre versek…
İşte o zaman başımız gerçekten belada!
Bir yanıt yazın