Microsoft’ta metin içeren fotoğraflar hakkında YENİ BİR GELİŞME

Teknoloji

Microsoft, Kosmos-1 adlı çok modlu bir yapay zeka modeli sundu.

Sunulan bu yapay zeka modeli, fotoğrafların içeriğini analiz edebilir, grafik bulmacaları çözebilir, metinleri tanımlayabilir, görsel IQ testlerinden geçebilir ve doğal dil komutlarını anlayabilir. Bilim insanlarına göre metin, ses ve video dahil olmak üzere farklı grafik modlarıyla çalışabilen çok modlu bir yapay zeka modelinin oluşturulması, genel yapay zekanın (AGI) oluşumuna yönelik önemli bir adım. Bu tür genel yapay zeka, insan düzeyinde çeşitli görevleri yerine getirebilir.

Uzmanlara göre, çok modlu algı, bilgi edinme ve gerçek dünya etkileşimi bağlamında AGI oluşturmak için gerekli bir unsurdur. Kosmos-1’in fotoğrafları inceleyerek kendileri hakkındaki soruları yanıtlayabileceği bilgisinde bahsedildi. Ayrıca metinleri okuyabilir, resimler için altyazılar oluşturabilir ve görsel IQ testlerini geçebilir. Genel yapay zekanın yaratılmasının, entelektüel görevleri yerine getirme konusunda insanları tamamen değiştirmeyi mümkün kılacağına inanılıyor.

Son zamanların popüler yapay zeka tabanlı ChatGPT chat-bot’unun yaratıcısı OpenAI şirketinin ana hedefi de bu. Ancak Kosmos-1 modelinin tamamen Microsoft’a ait bir proje olma ihtimali yüksek. Araştırmacılar bu modeli büyük çok modlu dil modeli (MLLM) olarak adlandırıyorlar.

Makaleyi değerlendir
Bugunbildim.com
Yorum ekle