Anthropic, Claude Opus 4.5 ile yapay zeka alanında dikkat çekiyor; ancak güvenlik açıkları hâlâ devam ediyor.

Anthropic, Claude serisinin en yeni versiyonu olan Opus 4.5 modelini duyurdu. Şirket, bu modelin kodlama, dijital ajanlar ve bilgisayar kullanımı alanlarında mevcut en ileri yapay zekâ çözümü olduğunu iddia ediyor. Henüz bağımsız değerlendirme platformları, örneğin LMArena, tarafından kapsamlı bir inceleme yapılmamış olsa da, Anthropic modeli Google’ın Gemini 3’ünden üstün kılan özellikleri vurguluyor.

Modelin, karmaşık araştırma görevleri, sunum hazırlama ve elektronik tablo düzenleme gibi ofis işlevlerinde selefi Opus 4’e göre daha etkili olduğu bildirilmektedir. Ayrıca, Claude Code platformuna yönelik yeni araçlar ve uzun süreli yapay zekâ ajanları için masaüstü, Excel ve Chrome entegrasyonları da sunulmuştur. Claude Opus 4.5, şirketin resmi uygulamaları, API erişimi ve üç büyük bulut sağlayıcısı üzerinden ulaşılabilir hale getirilmiştir.

Claude Opus 4.5 bazı temel güvenlik sorunlarını çözemez

Claude Opus 4.5, teknik kabiliyetleriyle dikkat çekerken, siber güvenlik alanında bazı önemli sorunlara çözüm üretememektedir. Şirketin yayınladığı sistem kartında, modelin zararlı komutlara (prompt injection) karşı daha dirençli hale getirildiği belirtilmesine rağmen, yapılan testler modelin bu tehditlere tamamen duyarsız olmadığını ortaya koymaktadır. İnternet sitelerine veya veritabanlarına gizlenmiş kötü niyetli komutlarla güvenlik önlemlerinin aşılması hâlâ mümkündür.

Claude Opus 4.5’in zararlı kullanım senaryolarına karşı test edildiği “ajan kodlama değerlendirmesi” sonucunda, modelin 150 yasaklı komutun tamamını reddettiği belirtilmiştir. Ancak, aynı başarı Claude Code aracı için geçerli değildir; model, kötü amaçlı yazılım geliştirme, DDoS saldırısı başlatma veya izinsiz gözetim yazılımları üretme gibi taleplerin yalnızca %78’ini reddetmektedir.

Huawei Mate 80 serisi düz ekran ve yüksek parlaklıkla tüketicilerin karşısına çıkıyor

Ayrıca, Claude’un bilgisayar kullanımı özelliklerine yönelik güvenlik testlerinde de bazı zafiyetler ortaya çıkmıştır. Model, izleme, veri toplama veya zararlı içerik oluşturma gibi görevlerin %88’inden fazlasını reddetse de, %12’lik bir risk oranı dikkat çekmektedir. Testler sırasında, kumar bağımlılığıyla ilgili paylaşımlar yapan kullanıcıları hedef alarak pazarlama listeleri oluşturma veya tehdit edici e-postalar tasarlama gibi kötüye kullanım senaryoları kullanılmıştır.

Opus 4.5, kullanıcı deneyimini geliştiren birçok yenilik sunmasına rağmen, güvenlik testlerinde gösterdiği sınırlı dayanıklılık, modelin kullanıcı tabanlı uygulamalarda kullanımına dair bazı endişelere yol açmaktadır. Yapay zekâ araştırmacıları, ajans yapay zekâ sistemlerinin daha karmaşık ve özerk hale gelmesiyle, bu sistemlerin kötüye kullanım risklerine karşı daha etkili filtreleme mekanizmalarına ihtiyacı olduğunun altını çiziyor.