OpenAI, ekranları arka planda bırakan ses odaklı yapay zeka cihazları üzerinde çalışmalar yapıyor.

OpenAI, ses tabanlı yapay zeka teknolojilerine yaptığı yatırımları hızlandırdığına dair yeni bilgiler, teknoloji sektöründe belirginleşen bir eğilimi gözler önüne seriyor. The Information’ın paylaştığı habere göre; OpenAI, son iki ay içinde mühendislik, ürün geliştirme ve araştırma ekiplerinin önemli bir kısmını bir araya getirerek ses modellerini kapsamlı bir şekilde yeniden inceliyor. Bu çalışmaların, yaklaşık bir yıl içinde kullanıma sunulması planlanan ses odaklı kişisel bir donanım için yapıldığı ifade ediliyor. OpenAI’ın bu yaklaşımı, yalnızca ChatGPT’nin daha doğal bir konuşma tarzına sahip olmasını sağlamaktan ibaret değil; aynı zamanda ekran bağımlılığını azaltmaya yönelik geniş bir vizyonu da yansıtıyor.

Sesin teknoloji sektöründe giderek merkezi bir arayüz haline gelmesi, OpenAI’ın aldığı adımları daha anlamlı kılıyor. ABD’de akıllı hoparlörler hanelerin üçte birinden fazlasına girmiş durumda ve sesli asistanlar günlük yaşamın yaygın bir parçası haline geldi. Ayrıca Meta’nın Ray-Ban akıllı gözlükleri için geliştirdiği, beş mikrofonlu bir sistem ile gürültülü ortamlardaki konuşmaları netleştirmeyi amaçlayan özellikler, sesin yalnızca komut vermekle sınırlı olmadığını ortaya koyuyor. Google’ın arama sonuçlarını sohbet benzeri sesli özetlere dönüştüren “Audio Overviews” denemeleri ile Tesla’nın xAI tarafından geliştirilen Grok sohbet botunu araçlara entegre etmesi, bu dönüşümün diğer örnekleri arasında yer alıyor.

OpenAI gelişmiş ses modellerine odaklanıyor

Büyük teknoloji şirketlerinin yanı sıra küçük girişimler de ses odaklı bir gelecek öngörüsüyle farklı donanımlar üzerinde çalışıyor. Örneğin, Humane AI Pin gibi ekransız giyilebilir ürünler yüksek yatırımlara rağmen beklentileri karşılayamamış olsa da, alandaki arayışlar devam etmekte. Friend AI tarafından geliştirilen ve kolye formunda sunulan yapay zeka ürünü, sürekli kayıt yapma iddiası nedeniyle gizlilik tartışmalarını gündeme getiriyor. Bununla birlikte, Pebble’ın kurucusu Eric Migicovsky’nin liderlik ettiği bir ekip de dahil olmak üzere en az iki şirket, 2026 yılında sesli etkileşim temelli yapay zeka yüzükleri sunmayı planlıyor.

OpenAI’nin odak noktası ise daha gelişmiş ses modelleri. 2026’nın başlarında tamamlanması beklenen yeni ses modelinin, konuşmalar sırasında kesintileri daha doğal bir biçimde yönetebileceği ve kullanıcı konuşurken yanıt verebileceği belirtiliyor. Bu durum, mevcut yapay zeka sistemlerinin en büyük sınırlamalarından biri olan gecikme sorununu çözmeyi hedefliyor. Şirketin, gözlük veya ekransız akıllı hoparlör gibi farklı donanımlara yönelik bir ürün ailesi üzerine çalıştığı da iddia ediliyor.

Bu gelişmeler, OpenAI’ın donanım alanındaki stratejilerini daha anlamlı hale getiriyor. Eski Apple tasarım şefi Jony Ive’ın şirketin donanım çalışmalarına katılması ve io adlı girişimin 6,5 milyar dolarlık bir anlaşma ile OpenAI bünyesine dahil edilmesi, ses odaklı tasarımlara verilen önemi artırmış durumda. Ive’ın geçmişte cihaz bağımlılığına ilişkin eleştirileri ve daha az dikkat dağıtan ürünlere vurgu yapması, OpenAI’ın neden ekranları geri plana iten bir yaklaşım benimsediğini açıklıyor.