Kılavuz: "Machina" dan ne kadar uzaktayız? Eski bir OpenAI araştırmacısı, yapay zekanın düşünceleri klonlamasına, insan düşüncesini taklit etmesine ve düşünürken hareket etmesine izin veriyor.
AI otonom bilince sahip olduğunda ne olacak?
"Machina" da Ava, insanları aldatarak özgür olmaya teşvik etmek için insan sempatisini kullanır ve sonunda "yaratıcısı" Nathan'ı öldürür.
Son zamanlarda, birçok netizenin tavsiyesi üzerine, Sam Altman sonunda bu filmi izledi.
Ve "Bu iyi bir film ama neden herkesin bana onu izlettiğini anlamıyorum" dedi.
Birçok kişi bunun yapay zekayı bilinçlendirmenin ve Turing testinden geçmenin sonucu olduğu konusunda uyarmak isteyebilir.
Ancak "Ex Machina" sahnesinden hala çok uzaktayız. GPT-5 gizli araştırma ve geliştirme aşamasında olabilir ve yapay zekayı akıllı hale getirmek bilim adamlarının tarih öncesi çabalarıyla hâlâ en çok yapmak istedikleri şeydir.
Hayır, British Columbia Üniversitesi'nden iki araştırmacı, ajanların insanlar gibi düşünebilmelerinin birçok avantajı olduğunu buldu.
Son makalelerinde, ajanların "düşünce klonlamasını" (TC) inceliyorlar.
Kağıt adresi:
Burada yapay zeka, insanları taklit ederek insan gibi "düşünmeyi" ve "davranmayı" öğreniyor.
Yapay zekanın düşünceleri olduğunda
Bilin ki, insanı diğer canlılardan ayıran dildir.
Bu nedenle, araştırmacılar, ajanların dili anlaması durumunda birçok fayda sağlayacağını düşünüyor.
Örneğin, insanlara genelleme yapma, çıkarım yapma, yeni durumlara uyum sağlama, mevcut bilgileri yeni yollarla birleştirme, keşfetme, planlama ve gerektiğinde yeniden planlama konusunda yardımcı olmak.
Bu faydalara rağmen, AI aracıları en azından insan dilinde değil, nadiren düşünür.
Sinir ağları, düşünmenin içsel vektör aktivasyonları olarak düşünülebilse de, birçoğu ayrı, sembolik dillerde düşünmenin belirli faydaları olduğunu varsayar.
Bu, dilde düşünebilen bir aracının, dili kullanmayan bir aracıdan daha hızlı öğrenebileceği, daha iyi performans gösterebileceği ve daha iyi genelleyebileceği anlamına gelir.
Tüm bu nedenlerden dolayı, yapay zeka aracılarının dilde düşünme yeteneğini geliştirmek, birçok önemli avantaj sağlayabilir.
Jeff Clune ve Shengran Hu, bu amaca ulaşmanın en etkili yolunun "yapay zekayı insan düşüncesini taklit etmek" olduğuna inanıyor.
İnsanların düşünme becerilerini tek başlarına elde etmediklerini, bunun yerine kısmen başkaları tarafından yapılan gösteriler ve öğretmenlerden gelen geri bildirimler yoluyla öğrendiklerini bulmuşlardır.
Bu nedenle, etkili bir yaklaşım, aracının, eylemde bulunurken düşüncelerini söyleyen insanların gösterilerinden öğrenmesidir.
Bu yaklaşım, önceden eğitilmiş LLM'lerle planlamaya ilişkin mevcut çalışmalardan farklıdır çünkü bu LLM'ler, hareket ederken düşüncelerini konuşan insanların verileri, yani "düşünce verileri" üzerinde eğitilmemiştir.
"Düşünce verilerinin" kaynağına gelince, araştırmacılar, insanların eylemlerinin, planlarının, kararlarının ve yeniden programlamalarının ardındaki düşünceleri içeren, birkaç milyon saatlik YouTube videolarını ve metin kayıtlarını seçtiler.
Makalede, araştırmacılar yeni bir taklit öğrenme çerçevesi "düşünce klonlaması" önerdiler. Bunların arasında ajan, davranış klonlama gibi insan gösterme davranışlarını öğrenmekle kalmaz, aynı zamanda insan hareket ederken düşünme şeklini de öğrenir.
Düşünce klonlama eğitim çerçevesinde, aracı her zaman adımında düşünce üretmeyi öğrenir ve daha sonra bu düşüncelere dayalı olarak eylemleri ayarlar.
Genel çerçeve Şekilde gösterildiği gibi, TC aracısı iki katmanlı bir mimaridir: üst ve alt bileşenler.
Her zaman adımında, etmen girdi olarak bir gözlem, bir görev ve bir düşünce geçmişi alır. Üst düzey bileşenler fikir üretiminden sorumludur ve alt düzey bileşenler bu fikirlere dayalı eylemler üretir.
Ardından, oluşturulan düşünce ve eylemler, kaybı hesaplamak için demo veri setindeki temel gerçekle karşılaştırılır.
Üst ve alt bileşenlerin koşulları için farklı seçenekler olsa da, bu çalışmada, zihin veri setindeki t uzunluğundaki belirli bir yörünge için araştırmacılar şunları en aza indirdi:
Daha karmaşık veya büyük ölçekli senaryolar için, üst katman bileşenleri önceden eğitilmiş bir Görsel Dil Modeli (VLM) veya sıfır atış, ince ayar kullanılarak uygulanabilir.
Alt bileşenler sıfırdan eğitilebilir veya hedef alandaki mevcut dilsel koşullu denetleyicilerden uyarlanabilir.
Makalede, araştırmacılar BabyAI 1.1 model mimarisinin iki bileşenine dayalı araştırma yürüttüler.
Model, gözlemlenebilirlik zorluklarının bir kısmını ele almak için belleği geliştirilmiş mimari LSTM'den yararlanır. Buna ek olarak, görsel ve metinsel girdileri etkili bir şekilde birleştirerek modalite birleştirme için FiLM kullanır.
Burada yazar, bu makaledeki tüm modellerin sıfırdan eğitildiğini ancak karmaşık alanlarda önceden eğitilmiş modellerin kullanılmasının daha iyi olduğunu vurgulamaktadır.
Aşağıdaki resim BabyAI ortamına bir örnektir.Soldaki resimde çeşitli renklerde öğeler (toplar, anahtarlar, kutular, kapılar) bulunmaktadır.
Temsilci nesneleri kaldırabilir, yere koyabilir, hareket ettirebilir veya kapıları açıp kapatabilir, oysa kilitli kapılar yalnızca renk uyumlu anahtarlarla açılabilir.
Ajan, önündeki duvarlar ve kapalı kapılar tarafından engellenen 7×7 ızgara hücrelerini görebilir.
"Zihin klonlama" aracısının görevi, mor kutuya (vurgulanmış) ulaşmak ve rotayı planlamaya başlamaktır.
Ancak görevi tamamlamaya hazır olarak mavi kapıyı açtığında, yolu kapatan mor bir top bulur. Ardından, zihin klonlama ajanı yeniden planlanır.
Buradan, ajanın düşünce ve eylemlerinin, bir engelle karşılaştığında önce onu ortadan kaldırdığını ve bir önceki hedefe devam etmeden önce rotayı yeniden planladığını gösterdiği görülebilir.
Bu süreç özellikle Ava'nın adım adım planladığı gibidir, böylece insanoğlu sonunda kendine inanacak ve kendine yardım edecek ve uzun süredir hapsedilen cam kafesten kurtulacaktır.
Deneysel sonuçlar
Bulgular, "düşünce klonlamanın" davranışsal klonlamadan daha üstün olduğunu gösteriyor.
Ayrıca, sıfır atış ve ince ayar ayarlarında zihin klonlama, dağıtım dışı görevlerde davranış klonlamadan daha iyi performans gösterir.
İlginç bir şekilde, araştırmacılar, model eğitildikten sonra kullanıcıların güvenli olmayan davranışları tanımlamasına izin veren "suç öncesi müdahaleler" de geliştirdiler.
Tehlikeli düşünceler tespit edildiğinde ajana son verilebilir. Testlerde Precriminal Intervention neredeyse kusursuz bir şekilde çalıştı ve AI güvenliği için potansiyelini gösterdi.
"Zihin klonlama", yapay zekayı yalnızca daha akıllı hale getirmekle kalmaz, aynı zamanda daha güvenli ve anlaşılması daha kolay hale getirir.
Yani yapay zeka bir suç işlemeden önce her şey kurtarılabilir.
Jeff Clune'a göre "düşünce klonlaması" yapay zekanın güvenliğine katkıda bulunuyor.
Aracının zihnini gözlemleyebildiğimiz için: (1) işlerin neden ters gittiğini daha kolay teşhis edebiliriz, (2) aracının aklını düzelterek yol gösterebiliriz, (3) veya planlanan güvensiz konuyu yapmasını engelleyebiliriz.
yazar hakkında
Jeff Clune
Şu anda Jeff Clune, British Columbia Üniversitesi'nde Bilgisayar Bilimleri alanında Doçenttir. Araştırması, derin pekiştirmeli öğrenme de dahil olmak üzere derin öğrenmeye odaklanmaktadır.
Daha önce, aynı zamanda OpenAI araştırma ekibinin başkanı ve kıdemli bir araştırma yöneticisi ve Uber Yapay Zeka Laboratuvarı'nın kurucu üyesiydi.
Daha önce, o ve OpenAI ekibi, yapay zekanın Minecraft'taki video verilerinden taş kazmalarını öğrenmesine olanak tanıyan bir video ön eğitim modeli olan VPT'yi yayınladı.
Shengran Hu
Şu anda British Columbia Üniversitesi'nde derin öğrenme, yapay zeka üretken algoritmaları ile ilgilenen bir doktora öğrencisi.
Referanslar:
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Zihin klonlama! Eski OpenAI araştırmacısı, yapay zekanın insan düşüncesini taklit etmesine izin veriyor ve "Makine"nin gerçek versiyonu geliyor
**Kaynak:**Xinzhiyuan
Kılavuz: "Machina" dan ne kadar uzaktayız? Eski bir OpenAI araştırmacısı, yapay zekanın düşünceleri klonlamasına, insan düşüncesini taklit etmesine ve düşünürken hareket etmesine izin veriyor.
AI otonom bilince sahip olduğunda ne olacak?
"Machina" da Ava, insanları aldatarak özgür olmaya teşvik etmek için insan sempatisini kullanır ve sonunda "yaratıcısı" Nathan'ı öldürür.
Ve "Bu iyi bir film ama neden herkesin bana onu izlettiğini anlamıyorum" dedi.
Ancak "Ex Machina" sahnesinden hala çok uzaktayız. GPT-5 gizli araştırma ve geliştirme aşamasında olabilir ve yapay zekayı akıllı hale getirmek bilim adamlarının tarih öncesi çabalarıyla hâlâ en çok yapmak istedikleri şeydir.
Son makalelerinde, ajanların "düşünce klonlamasını" (TC) inceliyorlar.
Burada yapay zeka, insanları taklit ederek insan gibi "düşünmeyi" ve "davranmayı" öğreniyor.
Yapay zekanın düşünceleri olduğunda
Bilin ki, insanı diğer canlılardan ayıran dildir.
Bu nedenle, araştırmacılar, ajanların dili anlaması durumunda birçok fayda sağlayacağını düşünüyor.
Bu faydalara rağmen, AI aracıları en azından insan dilinde değil, nadiren düşünür.
Sinir ağları, düşünmenin içsel vektör aktivasyonları olarak düşünülebilse de, birçoğu ayrı, sembolik dillerde düşünmenin belirli faydaları olduğunu varsayar.
Bu, dilde düşünebilen bir aracının, dili kullanmayan bir aracıdan daha hızlı öğrenebileceği, daha iyi performans gösterebileceği ve daha iyi genelleyebileceği anlamına gelir.
Jeff Clune ve Shengran Hu, bu amaca ulaşmanın en etkili yolunun "yapay zekayı insan düşüncesini taklit etmek" olduğuna inanıyor.
Bu nedenle, etkili bir yaklaşım, aracının, eylemde bulunurken düşüncelerini söyleyen insanların gösterilerinden öğrenmesidir.
Bu yaklaşım, önceden eğitilmiş LLM'lerle planlamaya ilişkin mevcut çalışmalardan farklıdır çünkü bu LLM'ler, hareket ederken düşüncelerini konuşan insanların verileri, yani "düşünce verileri" üzerinde eğitilmemiştir.
"Düşünce verilerinin" kaynağına gelince, araştırmacılar, insanların eylemlerinin, planlarının, kararlarının ve yeniden programlamalarının ardındaki düşünceleri içeren, birkaç milyon saatlik YouTube videolarını ve metin kayıtlarını seçtiler.
Makalede, araştırmacılar yeni bir taklit öğrenme çerçevesi "düşünce klonlaması" önerdiler. Bunların arasında ajan, davranış klonlama gibi insan gösterme davranışlarını öğrenmekle kalmaz, aynı zamanda insan hareket ederken düşünme şeklini de öğrenir.
Düşünce klonlama eğitim çerçevesinde, aracı her zaman adımında düşünce üretmeyi öğrenir ve daha sonra bu düşüncelere dayalı olarak eylemleri ayarlar.
Her zaman adımında, etmen girdi olarak bir gözlem, bir görev ve bir düşünce geçmişi alır. Üst düzey bileşenler fikir üretiminden sorumludur ve alt düzey bileşenler bu fikirlere dayalı eylemler üretir.
Ardından, oluşturulan düşünce ve eylemler, kaybı hesaplamak için demo veri setindeki temel gerçekle karşılaştırılır.
Üst ve alt bileşenlerin koşulları için farklı seçenekler olsa da, bu çalışmada, zihin veri setindeki t uzunluğundaki belirli bir yörünge için araştırmacılar şunları en aza indirdi:
Alt bileşenler sıfırdan eğitilebilir veya hedef alandaki mevcut dilsel koşullu denetleyicilerden uyarlanabilir.
Makalede, araştırmacılar BabyAI 1.1 model mimarisinin iki bileşenine dayalı araştırma yürüttüler.
Model, gözlemlenebilirlik zorluklarının bir kısmını ele almak için belleği geliştirilmiş mimari LSTM'den yararlanır. Buna ek olarak, görsel ve metinsel girdileri etkili bir şekilde birleştirerek modalite birleştirme için FiLM kullanır.
Burada yazar, bu makaledeki tüm modellerin sıfırdan eğitildiğini ancak karmaşık alanlarda önceden eğitilmiş modellerin kullanılmasının daha iyi olduğunu vurgulamaktadır.
Aşağıdaki resim BabyAI ortamına bir örnektir.Soldaki resimde çeşitli renklerde öğeler (toplar, anahtarlar, kutular, kapılar) bulunmaktadır.
Ajan, önündeki duvarlar ve kapalı kapılar tarafından engellenen 7×7 ızgara hücrelerini görebilir.
"Zihin klonlama" aracısının görevi, mor kutuya (vurgulanmış) ulaşmak ve rotayı planlamaya başlamaktır.
Bu süreç özellikle Ava'nın adım adım planladığı gibidir, böylece insanoğlu sonunda kendine inanacak ve kendine yardım edecek ve uzun süredir hapsedilen cam kafesten kurtulacaktır.
Deneysel sonuçlar
Bulgular, "düşünce klonlamanın" davranışsal klonlamadan daha üstün olduğunu gösteriyor.
Ayrıca, sıfır atış ve ince ayar ayarlarında zihin klonlama, dağıtım dışı görevlerde davranış klonlamadan daha iyi performans gösterir.
Tehlikeli düşünceler tespit edildiğinde ajana son verilebilir. Testlerde Precriminal Intervention neredeyse kusursuz bir şekilde çalıştı ve AI güvenliği için potansiyelini gösterdi.
"Zihin klonlama", yapay zekayı yalnızca daha akıllı hale getirmekle kalmaz, aynı zamanda daha güvenli ve anlaşılması daha kolay hale getirir.
Aracının zihnini gözlemleyebildiğimiz için: (1) işlerin neden ters gittiğini daha kolay teşhis edebiliriz, (2) aracının aklını düzelterek yol gösterebiliriz, (3) veya planlanan güvensiz konuyu yapmasını engelleyebiliriz.
yazar hakkında
Jeff Clune
Şu anda Jeff Clune, British Columbia Üniversitesi'nde Bilgisayar Bilimleri alanında Doçenttir. Araştırması, derin pekiştirmeli öğrenme de dahil olmak üzere derin öğrenmeye odaklanmaktadır.
Daha önce, aynı zamanda OpenAI araştırma ekibinin başkanı ve kıdemli bir araştırma yöneticisi ve Uber Yapay Zeka Laboratuvarı'nın kurucu üyesiydi.
Şu anda British Columbia Üniversitesi'nde derin öğrenme, yapay zeka üretken algoritmaları ile ilgilenen bir doktora öğrencisi.