Google, Görsel Analizlere Devrim Getiren PaliGemma 2’yi Tanıttı (Duygu Analizi Yapabilme Özelliğiyle!)
“`html
Google, yeni yapay zeka modeli PaliGemma 2’yi tanıttı. Bu modelin en dikkat çekici özelliği, görsellerdeki bireylerin duygularını tanıyabilme yeteneğidir. Ancak bu özellik henüz tamamen işlevsel değil.
PaliGemma 2, görüntüleri analiz etme ve gözlemlediği kişiler hakkında açıklamalar yapabilme kapasitesine sahiptir. Önceki sürümünün geliştirilmiş bir versiyonu olarak, görüntülerdeki eylemleri, duyguları ve hikayeyi daha detaylı bir şekilde belirleyebilmektedir.
PaliGemma 2 Özellikleri
Google, PaliGemma 2 modelinin görselleri ayrıntılı bir şekilde analiz ederek, sahnelerdeki eylemleri, duyguları ve genel hikayeyi tanımladığını bildirmiştir. Ancak, duygusal tespit özelliği henüz başlangıç aşamasında ve gerçek anlamda kullanıma sunulmamıştır.
PaliGemma 2, görsel içeriklere daha kapsamlı başlıklar ekleyerek basit nesne tanımlarını aşmayı hedefliyor. Artık sahnedeki eylemleri, duyguları ve genel hikayeyi doğru bir şekilde tanımlayabilen model, 3B, 10B ve 28B parametre seçenekleri ile sunuluyor. Ayrıca, görüntülerin çözünürlük seçenekleri 224px, 448px ve 896px şeklinde belirlenmiştir. PaliGemma 2’nin sunduğu diğer avantajlar arasında, optik karakter tanıma (OCR) ve belgelerdeki tabloların yapısını anlama yer alıyor. PaliGemma 2, özellikle kimyasal formül tanıma, müzik notası tanıma ve göğüs röntgeni raporu üretme gibi alanlarda da çözüm sunabilme kapasitesine sahip olacak.
PaliGemma 2’nin duygu tanıma özelliği, tam olarak kullanıma sunulmadan önce önemli etik tartışmalara yol açıyor. Uzmanlar, bu teknolojinin yanlış kullanımı durumunda toplumsal sorunlara neden olabileceği konusunda uyarılarda bulunuyor. Bu tür gelişmelerin ilerleyen dönemlerde daha kapsamlı etik değerlendirmelere tabi tutulması bekleniyor.
“`