Çoklu duyularla donanmış AI daha esnek zeka kazanabilir

İnsan zekası, duyular ve dil yeteneklerimizin birleşiminden ortaya çıkar. Belki aynı şey yapay zeka için de geçerlidir.



çok modlu yapay zeka tek

Selman Tasarım

24 Şubat 2021

  • Neden önemli:

    Hissedebilen ve konuşabilen yapay zeka, yeni zorluklarda gezinme ve insanlarla birlikte çalışma konusunda çok daha iyi olacak.






  • Anahtar oyuncular:

    • OpenAI

    • AI2

    • Facebook




  • kullanılabilirlik:

    Şimdi

2012'nin sonlarında, AI bilim adamları ilk olarak nasıl elde edileceğini anladılar. Görmek için sinir ağları. İnsan beynini gevşek bir şekilde taklit etmek için tasarlanan yazılımın mevcut bilgisayarlı görme sistemlerini önemli ölçüde iyileştirebileceğini kanıtladılar. Alan, o zamandan beri, sinir ağlarının nasıl taklit edileceğini öğrenmiştir. muhakeme et, duy, konuş ve yaz .

Ancak yapay zeka, belirli bir görevi yerine getirme konusunda kayda değer ölçüde insan benzeri – hatta insanüstü – büyümüş olsa da, hala insan beyninin esnekliğini yakalayamıyor. Becerileri bir bağlamda öğrenebilir ve başka bir bağlamda uygulayabiliriz. Buna karşılık, DeepMind'ın oyun oynama algoritması AlphaGo dünyanın en iyi Go ustalarını yenebilir, bu stratejiyi tahtanın ötesine taşıyamaz. Başka bir deyişle, derin öğrenme algoritmaları, kalıpları toplamada ustadır, ancak değişen bir dünyayı anlayamaz ve uyum sağlayamazlar.

ilerleme sorunu

Bu hikaye Mart 2021 sayımızın bir parçasıydı



  • Sorunun geri kalanına bakın
  • Abone

Araştırmacıların bu sorunun nasıl üstesinden gelinebileceğine dair birçok hipotezi var, ancak özellikle biri ilgi gördü. Çocuklar dünyayı hissederek ve onun hakkında konuşarak öğrenirler. Kombinasyon önemli görünüyor. Çocuklar sözcükleri görüntüler, sesler ve diğer duyusal bilgilerle ilişkilendirmeye başladıkça, giderek daha karmaşık fenomenleri ve dinamikleri tanımlayabilir, nedensel olanı yalnızca korelasyonu yansıtan şeylerden ayırabilir ve karmaşık bir dünya modeli oluşturabilirler. Bu model daha sonra tanıdık olmayan ortamlarda gezinmelerine ve yeni bilgi ve deneyimleri bağlama oturtmalarına yardımcı olur.

DeepMind'ın yapay zekası artık StarCraft II'deki neredeyse tüm insan oyuncuları geride bıraktı AlphaStar, popüler galaktik savaş oyununu fethetmek için yeni stratejiler öğrenmek için kendisiyle işbirliği yaptı.

Öte yandan AI sistemleri, aynı anda bunlardan yalnızca birini yapmak için inşa edilmiştir. Bilgisayarlı görme ve işitsel tanıma algoritmaları nesneleri algılayabilir ancak bunları tanımlamak için dili kullanamaz. Bir doğal dil modeli kelimeleri manipüle edebilir, ancak kelimeler herhangi bir duyusal gerçeklikten kopuktur. Eğer duyular ve dil birleşerek bir AI, yeni bilgileri toplamak ve işlemek için daha insan benzeri bir yol , nihayet dünyayı anlamak gibi bir şey geliştirebilir mi?

Umut, insan zekasının hem duyusal hem de dilsel modlarına erişimi olan bu çok modlu sistemlerin, yeni durumlara veya sorunlara daha kolay uyum sağlayabilen daha sağlam bir yapay zeka türüne yol açmasıdır. Bu tür algoritmalar daha sonra daha karmaşık sorunların üstesinden gelmemize yardımcı olabilir veya günlük hayatımızda bizimle iletişim kurabilen ve işbirliği yapabilen robotlara aktarılabilir.

OpenAI'nin GPT-3'ü gibi dil işleme algoritmalarındaki yeni gelişmeler yardımcı oldu. Araştırmacılar şimdi, dil manipülasyonunu, onu algılama yetenekleriyle birleştirmeyi potansiyel olarak daha verimli hale getirmek için yeterince iyi bir şekilde nasıl kopyalayacaklarını anlıyorlar. Başlangıç ​​olarak, alanın elde ettiği ilk algılama yeteneğini kullanıyorlar: bilgisayar görüşü. Sonuçlar basit iki modlu modeller veya görsel dil yapay zekası .

Geçen yıl, bu alanda birkaç heyecan verici sonuç elde edildi. Eylül ayında, Allen Yapay Zeka Enstitüsü, AI2'deki araştırmacılar, bir metin başlığından bir resim oluştur , algoritmanın kelimeleri görsel bilgilerle ilişkilendirme yeteneğini gösterir. Kasım ayında, Kuzey Karolina Üniversitesi, Chapel Hill'deki araştırmacılar bir yöntem geliştirdiler. görüntüleri mevcut dil modellerine dahil eder , bu da modellerin okuduğunu anlama becerisini artırdı.

2021

10 Çığır Açan Teknoloji

OpenAI daha sonra bu fikirleri GPT-3'ü genişletmek için kullandı. 2021'in başında, laboratuvar iki görsel dil modeli yayınladı. Bir görüntüdeki nesneler, onları bir başlıkta tanımlayan kelimelere bağlanır. Diğeri, öğrendiği kavramların bir kombinasyonuna dayalı olarak görüntüler üretir. Örneğin, güneş doğarken bir tarlada oturan bir kapibara resmi yapmasını isteyebilirsiniz. Bunu daha önce hiç görmemiş olsa da, düzinelerce örnek hayal etmek için resimler, kapibaralar, tarlalar ve gün doğumları hakkında bildiklerini karıştırabilir ve eşleştirebilir.

3d baskılı silah planları

Daha esnek zeka elde etmek, yalnızca yeni AI uygulamalarının kilidini açmakla kalmaz, aynı zamanda onları daha güvenli hale getirir.

Daha sofistike multimodal sistemler de daha fazlasını mümkün kılacaktır. gelişmiş robotik asistanlar (sadece Alexa'yı değil, robot uşaklarını düşünün). Mevcut nesil AI destekli robotlar, çevrelerinde gezinmek ve etkileşim kurmak için öncelikle görsel verileri kullanır. Bu, bir depodaki siparişleri yerine getirmek gibi kısıtlı ortamlarda basit görevleri tamamlamak için iyidir. Ancak AI2 gibi laboratuvarlar, dil eklemek ve ses ve dokunsal veriler gibi daha fazla duyusal girdileri birleştirmek için çalışıyor, böylece makineler komutları anlayabilir ve biri kapıyı çaldığında bir kapıyı açmak gibi daha karmaşık işlemleri gerçekleştirebilir.

Uzun vadede, çok modlu atılımlar, AI'nın en büyük sınırlamalarından bazılarının üstesinden gelmeye yardımcı olabilir. Örneğin uzmanlar, dünyayı anlama konusundaki yetersizliğinin, aynı zamanda kolayca başarısız olmasının veya kandırılmasının nedeni olduğunu savunuyorlar. (Bir görüntü, insanlar tarafından algılanamayacak şekilde değiştirilebilir, ancak yapay zekanın onu tamamen farklı bir şey olarak tanımlamasını sağlar.) Daha esnek zeka elde etmek, yalnızca yeni yapay zeka uygulamalarının kilidini açmaz: aynı zamanda onları daha güvenli hale getirir. Özgeçmişleri tarayan algoritmalar, cinsiyet ve ırk gibi alakasız özellikleri yetenek belirtileri olarak görmez. Kendi kendine giden arabalar, tanıdık olmayan ortamlarda yönlerinden sapmaz ve karanlıkta veya karlı havalarda kaza yapmazdı. Multimodal sistemler, hayatlarımızda gerçekten güvenebileceğimiz ilk yapay zekalar olabilir.

Gerçek Teknolojiler

Kategori

Kategorize Edilmemiş

Teknoloji

Biyoteknoloji

Teknoloji Politikası

İklim Değişikliği

İnsan Ve Teknoloji

Silikon Vadisi

Bilgi Işlem

Mit Haber Dergisi

Yapay Zeka

Uzay

Akıllı Şehirler

Blok Zinciri

Özellik Hikayesi

Mezun Profili

Mezun Bağlantısı

Mit Haber Özelliği

1865

Benim Görüşüm

77 Toplu Cadde

Yazarla Tanışın

Cömertlik Içindeki Profiller

Kampüste Görüldü

Mezun Mektupları

Haberler

Seçim 2020

İle Indeksi

Kubbenin Altında

Yangın Hortumu

Sonsuz Hikayeler

Pandemi Teknoloji Projesi

Başkandan

Kapak Hikayesi

Fotoğraf Galerisi

Tavsiye