Son dönemde gündelik hayatta çok daha yaygın biçimde kullanılmaya başlanan yapay zeka teknolojileri hızla gelişmeye devam ediyor. Neredeyse her gün bu alanda dikkat çekici bir gelişme yaşanırken, önemli eşikler de bir bir aşılıyor. "AI Günlükleri" serimizde, önümüzdeki dönemde dünyadaki hayatı kayda değer ölçüde değiştirme potansiyeline sahip olan bu teknolojik devrimin gelişimini düzenli olarak kayıt altına almaya devam ediyoruz.
Yapay Zeka Dünyasında Bu Hafta Neler Yaşandı?
Yapay zeka dünyası için bu hafta biraz durgun geçmiş olsa da dikkat çekici birkaç gelişme de yaşandı. Bu haftanın en dikkat çekici yapay zeka aracı Google'dan geldi. Google tarafından kullanıcılara sunulan Gemini 2.5 Flash Image (ya da ilk ortaya çıktığı adıyla nano banana), görsel düzenleme konusunda şu ana kadar gördüğümüz en iyi yapay zeka aracı olarak öne çıkıyor. Tabii bu hafta yeni bir AI aracı çıkaran tek şirket Google olmadı. Microsoft, OpenAI, Nvidia gibi şirketler de bu hafta yapay zeka alanında yeni ürün ve araçlar ortaya koydu.
Gemini'nin Görsel Düzenleme Yetenekleri Sınıf Atladı
Google, geçtiğimiz hafta "nano-banana" takma adıyla ortaya çıkan yeni görsel düzenleme modelini bu hafta Gemini'a resmi olarak ekledi. Gemini 2.5 Flash Image adıyla kullanıma sunulan bu yeni model, kullanıcıların doğal dilde verdiği komutlara göre fotoğrafları düzenliyor. Üstelik yüzler, hayvanlar ve karmaşık görsel detayların bozulmadan korunmasını sağlıyor. Fotoğraf düzenleme konusunda şu anda piyasadaki en gelişmiş birkaç modelden biri, hatta belki de birincisi olduğunu söyleyebileceğimiz Gemini 2.5 Flash Image, normalde Photoshop gibi araçlarla yapılan pek çok düzenlemeyi saniyeler içinde yerine getirebiliyor.
Microsoft, İlk Kez Kendi Yapay Zeka Modellerini Tanıttı
MAI-Voice-1 ve MAI-1-preview adını taşıyan bu modeller, şimdiden Microsoft Copilot'un bazı araçlarında kullanılmaya başlandı. MAI-Voice-1, yalnızca tek bir GPU üzerinde bir dakikalık ses üretimini bir saniyeden kısa sürede gerçekleştirebiliyor. Microsoft, MAI-1-preview modelini ise özellikle günlük sorulara anlamlı ve faydalı yanıtlar verebilecek bir yardımcı olarak konumlandırıyor.
Nvidia, Bugüne Kadarki En Gelişmiş AI GPU'sunu Duyurdu: Blackweel Ultra GB300
Blackwell Ultra GB300, 288GB'a kadar HBM3E belleği destekliyor. 8192-bit bellek arayüzüyle 8 TB/sn bant genişliği sunan bu sistem, kendisinden önce gelen GB200'e kıyasla yüzde 50 daha fazla bellek kapasitesi sağlıyor. Nvidia, bu sayede trilyonlarca parametreye sahip büyük AI modellerinin tam bellekte çalıştırılabileceğini, uzun bağlam pencerelerinin desteklenebileceğini ve daha verimli eğitim süreçleri sunulabileceğini belirtiyor.
OpenAI, En Gelişmiş Konuşma Modelini Tanıttı: gpt-realtime
OpenAI, karmaşık talimatları daha iyi takip eden, doğal sesler üreten ve yüzde 20 daha ucuz olan yeni konuşma modeli gpt-realtime’i tanıttı. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor. Yeni modelin çıkışına paralel olarak Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.
ChatGPT, Bir Gencin İntiharıyla Suçlanıyor
Apple, Görsel-Dil Modeli (VLM) FastVLM'yi Kullanıma Sundu
Apple, yapay zeka alanında rakiplerinin epey gerisinde kalmış olsa da bu hafta dikkat çekici bir modelle karşımıza çıktı. Şirket, önemli bir adım atarak FastVLM adını verdiği yeni görsel-dil modelini (VLM) kullanıcıların beğenisine sundu. İlk olarak 2024’te tanıtılan FastVLM, görselleri ve metinleri aynı anda anlayabilen bir yapay zeka modeli olarak öne çıkıyor. Modelin amacı, yüksek hızda işlem yapmak, farklı görsel-dil görevlerinde güçlü sonuçlar elde etmek ve eğitim süreçlerini daha verimli hale getirmek.
FastVLM, özellikle gerçek zamanlı uygulamalarda, mobil, bulut ve uç cihazlarda kullanılmak üzere optimize edilmiş bir çözüm sunuyor. Üstelik WebGPU desteği sayesinde FastVLM, ek bir kurulum gerektirmeden doğrudan tarayıcı üzerinden gerçek zamanlı çalışabiliyor.
Beyinden Esinlenerek Tasarlanan Yapay Zeka, Performansıyla Dikkat Çekti
Büyük dil modellerinin çoğu, karmaşık bir problemi ara adımlara bölerek çözen zincirleme akıl yürütme (chain-of-thought) yöntemini kullanıyor. Hiyerarşik Akıl Yürütme Modeli (HRM) olarak adlandırılan bu yeni model ise insan beynindeki hiyerarşik işleyişi örnek alıyor. Çeşitli bölgelerinde bilgiyi farklı sürelerde işleyip daha sonra bütünleştirebilen insan beyni gibi bu model de farklı zaman ölçeklerinde çalışan iki modülden oluşuyor: Üst düzey modül daha yavaş fakat soyut planlamaları yürütürken, alt düzey modül hızlı ve ayrıntılı hesaplamaları üstleniyor. Bu mimari sayesinde HRM, ara akıl yürütme adımlarını tek tek yazıp doğrulamaya gerek kalmadan, farklı modüllerin eşzamanlı çalışmasıyla doğrudan nihai cevabı üretebiliyor.
Bu Haftanın Öne Çıkan Üretken Yapay Zekaları
ByteDance'in bu hafta tamamen ücretsiz olarak yayınladığı USO, verdiğiniz obje ile stili harmanlayarak etkileyici görseller oluşturabiliyor:
ByteDance'in bu hafta yayınladığı bir diğer araç olan OmniHuman-1.5 ise verdiğiniz görsel ve ses dosyası ya da metni harmanlayarak, sesi senkronize ettiği videolar oluşturabiliyor.
Bu hafta benzer bir AI aracı da Alibaba'dan geldi. Alibaba tarafından yayınlanan Wan2.2-S2V de verdiğiniz ses dosyası ile görüntüden yola çıkarak, ses dosyasına uygun videolar üretebiliyor:
Sync tarafından yayınlanan lipsync-2-pro ise istediğiniz ses dosyasını istediğiniz videoya ekleyip, ses ile dudakların hareketini senkronize etmenizi sağlıyor:
Microsoft'un metin seslendirebilen yapay zekası VibeVoice TTS, verdiğiniz metinin içeriğini analiz ederek seslendirmeyi ona uygun ton ve duygu ile yapıyor:
HeyGen tarafından yayınlanan Avatar IV, yapay zeka ile dijital bir avatarınızı oluşturup videolarda o avatarı kullanmanıza olanak sağlıyor:
Yapay Zeka Dünyasından Kısa Kısa:
- xAI, Apple ve OpenAI’ye dava açtı. Elon Musk, iPhone’a entegre edilen ChatGPT’nin rekabeti engellediğini, App Store’un ise rakip yapay zeka uygulamalarını geri plana ittiğini iddia ediyor.
- Meta'nın yapay zekâ birimi Superintelligence Labs, kendi modelleri daha iyi hâle gelene kadar Meta AI sohbet botunda Google'ın Gemini modelini kullanmayı düşünüyor. Aynı şekilde, OpenAI'ın modellerinin de farklı uygulamalarda kullanılabileceği iddia ediliyor.
- Nvidia, yapay zeka talebinin etkisiyle rekor gelir açıkladı. Blackwell çipleri 27 milyar dolarlık satışla veri merkezlerinde liderliği sürdürürken toplam gelir 46,7 milyar dolar oldu.
- Bu yaz dikkat çekici teklifler yaparak rakiplerinden önemli isimleri transfer eden Meta, yapay zeka ekibine kattığı bu isimleri daha şimdiden kaybetmeye başladı. Yakın zamanda transfer edilen üç önemli isim, daha şimdiden Meta AI'dan ayrıldı.
- Çin’de yapay zekâ destekli sesli asistan rekabetinden geri kalmak istemeyen Tesla, Çin'de ByteDance ve DeepSeek ile iş birliği yapmaya başladı.
- Microsoft’un yapay zeka asistanı Copilot, Samsung’un 2025 model TV ve akıllı monitörlerinde kullanıma sunuldu.
- Çin, dışa bağımlılığı azaltmak adına önümüzdeki yıllarda yapay zeka çip üretimini üç kata kadar artırmayı planlıyor. Ülkenin hedefi, yapay zeka çiplerinde tamamen bağımsız hâle gelmek.
Haberi DH'de Gör