Anthropic, iki yıl içinde yapay zekanın kara kutusunu açmak istiyor

Yapay Zeka Şirketi Anthropic, Yapay Zekanın “Kara Kutusu”nu Açmaya Hazırlanıyor!

Yapay zeka teknolojileri her geçen gün daha güçlü hale gelirken, bu sistemlerin nasıl çalıştığı halen tam anlamıyla çözülebilmiş değil. Anthropic CEO’su Dario Amodei, yayınladığı dikkat çekici bir makalede, bu bilinmezliğin tehlikelerine dikkat çekerek şirketinin 2027 yılına kadar yapay zeka modellerindeki sorunların büyük kısmını tespit edebilecek seviyeye ulaşmayı hedeflediğini açıkladı.

Yapay Zekanın Çalışma Mekanizmaları ve Güvenlik Riskleri!

“The Urgency of Interpretability” başlıklı makalede Amodei, mevcut yapay zeka modellerinin nasıl karar verdiğini tam olarak anlayamamanın ciddi bir güvenlik riski oluşturduğunu ifade ediyor. Amodei, “Bu sistemler ekonomi, teknoloji ve ulusal güvenlik için kesinlikle merkezi öneme sahip olacak ve o kadar fazla özerklik kapasitesine sahip olacaklar ki, insanlığın nasıl çalıştıklarından tamamen habersiz olmasının temelde kabul edilemez olduğunu düşünüyorum” sözleriyle durumu özetliyor.

Anthropic’in kurucularından Chris Olah’ın ifadesine göre yapay zeka modelleri “inşa edilmekten ziyade büyütülüyor.” Araştırmacılar zeka seviyelerini artırabiliyor olsa da, bu gelişimin ardındaki mekanizmaları henüz açıklayamıyorlar. Bu da yapay zekanın belirli kararları neden aldığı, bir kelimeyi başka bir kelimeye göre neden tercih ettiği ya da genellikle doğru olmasına rağmen neden ara sıra hata yaptığı gibi konularda ciddi bir bilgi boşluğuna işaret ediyor.

Örneğin, yakın geçmişte OpenAI, daha iyi performans gösteren, ancak aynı zamanda diğer modellerine göre daha fazla hayal gören o3 ve o4-mini adlı yeni muhakeme modellerini yayınladı. Ayrıca firma, bu modellerin neden daha fazla halüsinasyon gördüğü konusunda da bir fikirlerinin olmadığının altını çizdi.

Bu durum aslında bizi korkutmalı. Anthropic, yapay zekanın bu “kara kutusu” üzerinde çalışan, spesifik araştırmalar yapan nadide şirketlerden birisi. Çoğu AI şirketi en azından kamu önünde bu konuyu derinlemesine araştırdıklarını söylemiyor bile.

Yapay Zeka ve AGI Yolculuğunda Önemli Adımlar!

Bununla birlikte Anthropic, modellerin karar süreçlerini “devreler” üzerinden takip ederek nasıl düşündüklerine dair ilk sinyalleri almaya başladı. Ancak bu, halen küçük bir adım. Pandora’nın kutusu daha yeni açılıyor, zira bu tür devrelerden milyonlar hatta milyarlarca olabileceği düşünülüyor.

Amodei, bu modellerin nasıl çalıştığını anlamadan AGI’ye (insan seviyesinde yapay zeka, yapay genel zeka) ulaşmanın tehlikeli olabileceğini söylüyor. Ek olarak Amodei’nin uzun vadeli vizyonu ise oldukça iddialı: Yapay zeka modellerine adeta bir “beyin taraması” yapılması. Bu taramalar sayesinde modellerin dürüstlükten sapma eğilimi, güç kazanma isteği gibi tehlikeli eğilimleri önceden tespit edilebilecek. Bu tür gelişmiş analiz araçlarının geliştirilmesinin beş ila on yıl alabileceği öngörülüyor.

Anthropic’in CEO’su, makalesinde yalnızca kendi şirketine değil, sektöre de bir çağrıda bulunuyor. OpenAI ve Google DeepMind gibi devlerin yorumlanabilirlik araştırmalarına daha fazla kaynak ayırması gerektiğini vurgulayan Amodei, hükümetlere ise regülasyonlarla bu araştırmaları teşvik etme çağrısı yaptı.

Yapay zeka ve özellikle derin öğrenme konusundaki çalışmalarla günümüz yapay zekaların doğmasında büyük pay sahibi olan, bu konuda Nobel Fizik Ödülü’nü alan Geoffrey Hinton’ın kendisi de 2023’te bu ağların nasıl çalıştığını bilmediğini söylemişti. Aşağıdaki videoyu izlemenizi tavsiye ederim.

Related Posts

Trump’tan ‘Tiktok’ kararı

ABD Başkanı Trump, sosyal medya platformu Tiktok’un engellenmesine dair kanunun uygulanmasını 90 gün süreyle erteleyen kararnameyi imzaladı.

Dev asteroidin Ay’a çarpma ihtimali giderek artıyor

Bir dönem Dünya’ya çarpma ihtimali gündeme gelen, ama daha sonra rotasını Ay’a çeviren 2024 YR4 asteroidinin, uydumuza çarpma ihtimali giderek artıyor.

Dünyanın sonu senaryolarına ve iletişimsizliğe çözüm: ‘Meshtastic’ ile altyapısız mesajlaşma devri

Tüm iletişim ağları çökmüş, telefonunuz işe yaramaz hale gelmiş ve internet işlevsel olarak yok olmuş durumda. Güvendiğiniz insanlarla yardım ve hayatta kalmak için bağlantı kurmanız gerekiyor. Peki ne yaparsınız? Daha da önemlisi, buna nasıl …

2025 Ordu Triatlon Türkiye Kupası sona erdi

Ordu Büyükşehir Belediyesinin ev sahipliğinde 6’ncısı düzenlenen ‘2025 Ordu Triatlon Türkiye Kupası’ sona erdi. Heyecan dolu yarışlarda dereceye giren sporculara ödülleri verildi. Organizasyona 20 ilden 400 sporcu katıldı.

Uzaydan dönen Çinli astronotun Dünya’ya bakışı tamamen değişti!

Çinli astronot Cai Xuzhe, Çin’in Tiangong uzay istasyonunda altı ay geçirdikten sonra kısa süre önce Dünya’ya farklı bir bakış açısıyla döndü. Birçok uzay yolcusunun deneyimlediği bu değişim, onun gezegenimize ve insanlığın onu korumadaki rolüne dair görüşünü yeniden şekillendirdi.

Apple, WWDC 2025 etkinliğinde neler tanıtmayı planlıyor?

Apple Dünya Geliştiriciler Konferansı 9 Haziran’da başlıyor. WWDC 2025 etkinliğinde iPhone, iPad, Apple Watch ve Mac’ler için şimdiye kadarki en büyük görsel değişiklik içeren yazılımlar tanıtılacak.