Son dönemde gündelik hayatta çok daha yaygın biçimde kullanılmaya başlanan yapay zekâ teknolojileri hızla gelişmeye devam ediyor. Neredeyse her gün bu alanda dikkat çekici bir gelişme yaşanırken, önemli eşikler de bir bir aşılıyor. "AI Günlükleri" serimizde, önümüzdeki dönemde dünyadaki hayatı kayda değer ölçüde değiştirme potansiyeline sahip olan bu teknolojik devrimin gelişimini düzenli olarak kayıt altına almaya devam ediyoruz.
Yapay Zekâ Dünyasında Bu Hafta Neler Yaşandı?
Geride bıraktığımız haftada yaşananlar, yapay zekâ dünyası için önemli bir değişimin eşiğinde olduğumuzu gösterdi. Bir yandan AGI'a (yapay genel zekâya) ulaşmak için çalışmalara sıklık verlirken, diğer yandan AI donanımlarını piyasaya sürmek için takvimler belirlendi. Tabii bunlara paralel olarak, her hafta olduğu gibi bu hafta da yeni yapay zekâ araçları hayatımıza girdi. İşte yapay zekâ dünyasında bu haftanın öne çıkan gelişmeleri:
Yapay zekânın bir yıl içinde önemli bir eşiği aşması bekleniyor
Bu hafta benzer bir açıklama da Google cephesinden geldi. Google DeepMind’den Shane Legg, AGI'ın artık ufukta olduğunu belirterek ekonomide köklü dönüşümler olacağını söyledi. Sektör genelinde bu yönde bir konsensus oluşmuş gibi görünüyor. Şirketlerin ayrıştığı nokta ise AGI'ın nasıl geliştirileceği. Nitekim Google DeepMind CEO'su Demis Hassabis bu hafta yaptığı konuşmada, büyük dil modellerinin (yani ChatGPT gibi LLM'lerin) AGI'a ulaşmak için yeterli olmayacağını söyledi. Hassabis'e göre bu eşiğin aşılması için gerçek bir “dünya modeli”ne sahip yapay zekâlar gerekiyor. DeepMind, bu yeni nesil yapay zekâyı ortaya çıkarmak için önemli adımlar atıyor ki Shane Legg'in açıklamaları da bunun bir yansıması.
Nvidia, PersonaPlex-7B-v1 ile sesli yapay zekada yeni bir dönemi başlatıyor
Geleneksel sesli asistanlar konuşmayı metne çeviren ASR, yanıtı üreten dil modeli ve sesi tekrar üreten TTS bileşenlerinden oluşan çok aşamalı bir yapı kullanıyor. Bu yaklaşım her aşamada gecikmeye yol açarken aynı anda konuşma, söz kesme veya doğal geri bildirimler gibi insan konuşmasının temel özelliklerini desteklemekte yetersiz kalıyor. PersonaPlex, bu çok katmanlı zinciri ortadan kaldırarak tek bir Transformer modeli içinde hem konuşmayı anlamayı hem de konuşma üretimini eş zamanlı olarak gerçekleştiriyor. Model, sinirsel bir codec ile kodlanmış sürekli ses akışı üzerinde çalışıyor ve metin ile ses token’larını aynı anda otoregresif biçimde üretiyor.
PersonaPlex, özellikle doğal diyalog akışı, hassas persona kontrolü ve düşük gecikme gerektiren kullanım senaryolarında öne çıkıyor.
Yapay zekâ donanımları geliyor: Apple ve OpenAI takvimlerini belirledi
Güney Kore, yapay zekâ yasasını uygulamaya koydu
Yeni yasa, özellikle yüksek etkili olarak tanımlanan kullanım alanlarına odaklanıyor. Nükleer güvenlik, içme suyu üretimi, ulaşım altyapıları, sağlık hizmetleri ve kredi değerlendirme gibi finansal süreçler bu kapsama dâhil ediliyor. Bu alanlarda kullanılan yapay zekâ sistemlerinin tamamen otonom çalışmasına izin verilmiyor ve insan denetimi zorunlu tutuluyor. Yasanın bir diğer önemli ayağını şeffaflık yükümlülükleri oluşturuyor. Şirketlerin, yüksek etkili veya üretken yapay zekâ kullanan ürün ve hizmetler hakkında kullanıcıları önceden bilgilendirmesi gerekiyor.
xAI, gigavat ölçekli Colossus 2 süper bilgisayarını hizmete aldı
Apple, Siri için büyük bir değişiklik hazırlıyor
OpenAI sessizce robot eğitimi gerçekleştiriyor
Bu Hafta Tanıtılan Yapay Zekâ Araçları
ByteDance (TikTok'un arkasındaki şirket) tarafından geliştirilen FlowAct-R1, kullanıcıların dijital bir avatar kullanarak canlı yayın yapmasına olanak sağlıyor. Üretim ve reaksiyon hızıyla dikkat çeken model, konuşmanın içeriğine göre tavrını değiştiren avatarlarla epey iddialı geliyor.
Waypoint-1, kullanıcı komutlarını neredeyse aynı anda videoya yansıtarak eş zamanlı olarak düzenlenebilen interaktif dünyalar yaratıyor. Video kalitesi şimdilik biraz düşük olsa da teknoloji dikkat çekiyor.
OmniTransfer, bir videodaki kamera hareketlerini, aksiyonları ya da efektleri başka bir videoya kolayca aktarmanıza olanak sağlıyor.
Alibaba tarafından yayınlanan açık kaynak kodlu Qwen3-TTS, metin seslendirme konusunda oldukça başarılı sonuçlar veriyor. Ayrıca kullanıcılara istedikleri sesi klonlama imkânı da sunuluyor.
Microsoft tarafından yayınlanan VibeVoice-ASR ise sesli metinleri deşifre edip yazılı dökümünü çıkarabiliyor.
Yapay Zekâ Dünyasından Kısa Kısa
- ChatGPT, genç kullanıcıları korumak amacıyla yaş tahmini özelliğini devreye aldı. Yeni sistem, reşit olmayan hesapları tespit ederek içerik filtrelerini otomatik olarak uygulayacak.
- Elon Musk, Tesla’nın sürücüsüz araç teknolojileri için kritik öneme sahip Dojo3 yapay zeka süper bilgisayar projesinin, AI5 çip tasarımında sona yaklaşılmasıyla yeniden başlatılacağını açıkladı.
- OpenAI, ChatGPT'yi bir e-ticaret platformuna dönüştürme hedefiyle alışveriş sepeti ve satıcı yükleme sayfası içeren yeni ticaret özellikleri üzerinde çalışıyor.
- OpenAI'ın yapay zekâ destekli internet tarayıcısı ChatGPT Atlas, büyük güncelleme aldı. Yeni sürüm, sekme grupları ve arama motoru araçları arasında otomatik geçiş gibi yeni özellikler getiriyor.
- Tüketicilerin oyun dışı mobil uygulamalara yaptığı harcamalar, 2025 yılında ilk kez mobil oyun gelirlerini aştı. Bu büyümenin merkezinde ise üretken yapay zeka uygulamaları yer aldı. Yapay zeka kategorisindeki uygulama içi satın alma gelirleri 2025’te üç kattan fazla artarak 5 milyar doların üzerine çıktı.
- OpenAI, küresel yatırım arayışında rotayı Orta Doğu’ya çevirdi. Şirket, yaklaşık 50 milyar dolarlık yeni yatırım turu için Orta Doğu’daki egemen varlık fonlarıyla masaya oturdu.
Haberi DH'de Gör