OpenAI, Bilgisayarınızı Kontrol Edebilecek ‘Operatör’ü Bu Hafta Tanıtıyor!

OpenAI’nin “Operator” isimli bilgisayar kullanıcı ajanını bu hafta piyasaya sürmeye hazırlandığı bildiriliyor. Kullanıcının web tarayıcısında işlemleri onun adına gerçekleştirebilen bu özel araç, Google ve Anthropic gibi diğer büyük şirketlerin de üzerinde çalıştığı benzer “ajanlar” arasında yer alıyor. Amaç, yapay zekanın insan tarafından yapılan görevleri devralmasını sağlayarak önemli bir atılım gerçekleştirmek.

The Information‘a göre, Operator kullanıcılara seyahat, yeme-içme ve etkinlikler gibi kategorilerde önerilen istekler sunacak. Örneğin, kullanıcı Operator’dan New York’tan Maui’ye çok geç varmayacak bir uçuş bulmasını isteyebilir. Ancak satın alma işlemi tamamlanmıyor; kullanıcı sürece dahil edilerek işlemi kendisi tamamlıyor.

Gizmodo, yorum almak için OpenAI’ye ulaştı; fakat henüz bir dönüş alamadı.

Ajanların faydalı olabileceği pek çok durum imajine edilebiliyor. Bilgisayar konusunda deneyimsiz yaşlı bireyler, Operator’dan e-posta göndermelerine yardımcı olmasını isteyebilir ve bu sayede Gmail’e gidip bir e-posta yazma penceresi açabilirler. Teknolojiye hakim kişiler bu tür yardıma ihtiyaç duymasa da, eski jenerasyonlar genellikle basit görevlerde bile internette gezinirken zorluk çekebiliyor. Botlar, kalite kontrol testleri gibi yeni web sitelerinin ya da hizmetlerin düzgün çalıştığını test etmesi gereken alanlarda da yardımcı olabilir.

Bununla birlikte, “bilgisayar kullanıcı ajanları” bazı riskler taşıyor. Zaten bir girişim, pazar döngülerine spam gönderiyi otomatikleştiren bir web gezgini botu tanıttı. Son kullanıcı istemcisinin kontrolünü ele geçiren botlar, otomasyonu engellemek için koyulan API sınırlamalarını aşabiliyor. Yapay zeka girişimleri, suiistimali önlemek için bazı önlemler almalı; aksi takdirde web siteleri spam ile daha da dolabilir.

Operator gibi ajanlar, kullanıcıların tarayıcılarının ekran görüntülerini alarak OpenAI’ye analiz için gönderiyor. Modeller görev için gereken bir sonraki adımı belirlediğinde, bir komut bu bilgileri alıp tarayıcıdaki uygun hedefe fareyi sürüp tıklatmak ya da bir kutuya yazmak için geri gönderiliyor. OpenAI ve diğerleri tarafından geliştirilen çok modlu teknolojiyi, yani metin ve görseller gibi birden farklı bilgi formatlarını yorumlayabilen bir sistemi kullanıyor.

Son dönemdeki yapay zeka girişimlerinin tüm vaadi, neredeyse tüm insan görevlerini yerine getirebilecek yapay genel zeka (AGI) geliştirmek ve herkesin hayatını daha verimli hale getirmek. Dil modellerinin performansındaki büyük kazanımlar yavaşladıkça, bu şirketler bu hedefe ulaşmak için yeni yollar arıyor ve bilgisayar kullanıcı ajanları da bu açıdan bir çıkış yolu. Yapay zeka, insanları tamamen devralmak için sadece yazmakla kalmayıp, aynı zamanda elektronik tabloları gezmek, videolar izlemek gibi görevleri de yapabilmeli.

Anthropic, bilgisayar kullanıcı botunun ilk önizlemesini yayımladıktan sonra, erken kullanıcılar şikayet etti; botun işini bitiremediği zamanlarda takıldığını, görevi unuttuğunu ya da Google Görseller’de doğa resimlerine bakmaya başladığını söylediler. Ayrıca yavaş ve çalıştırması pahalı. Operator’un ne kadar maliyetli olacağı henüz belirsiz.

Bu denli üst düzey kontrol ve kritik veri erişimi verilen bir botta, kullanıcıların sürece dahil edilmesi elzem olacak. Bilgisayar kullanıcı ajanları, kendini sürebilen arabalara benzetilebilir. Google bir otomobilin kendi başına düz bir yolda gitmesini kolaylaştırdı; ancak kenar vakaları çözmek yıllar aldı. OpenAI, başlangıçta Operator’un kullanım alanlarını sınırlayabilir.

AGI’nin nasıl ölçüleceği ve ne zaman “gerçekleşeceği” konusunda tartışmalar var; fakat OpenAI, en büyük destekçisi Microsoft’a AGI’ye ulaşıldığına, yapay zekalarının en az 100 milyar dolar kâr elde edebildiği zaman inanacaklarını bild

Bunları da sevebilirsiniz

Yapay Zeka Artık Yalan Söylemeyi Biliyor!

OpenAI ile 10 Milyar Dolarlık İş Birliği!

Apple’ın Merakla Beklenen Çin Stratejisi!

Bir yanıt yazın Yanıtı iptal et