Uygulama ile Aç

AI Günlükleri: Yapay zeka dünyasında bu hafta (1 Eylül 2025)

Yapay zeka dünyasında bu hafta neler yaşandı; Yeni neler tanıtıldı? "AI Günlükleri" serimizde, hızla büyüyen bu alanda neler olup bittiğini haftalık olarak kayıt altına almaya devam ediyoruz.

Son dönemde gündelik hayatta çok daha yaygın biçimde kullanılmaya başlanan yapay zeka teknolojileri hızla gelişmeye devam ediyor. Neredeyse her gün bu alanda dikkat çekici bir gelişme yaşanırken, önemli eşikler de bir bir aşılıyor. "AI Günlükleri" serimizde, önümüzdeki dönemde dünyadaki hayatı kayda değer ölçüde değiştirme potansiyeline sahip olan bu teknolojik devrimin gelişimini düzenli olarak kayıt altına almaya devam ediyoruz.

Yapay Zeka Dünyasında Bu Hafta Neler Yaşandı?

Yapay zeka dünyası için bu hafta biraz durgun geçmiş olsa da dikkat çekici birkaç gelişme de yaşandı. Bu haftanın en dikkat çekici yapay zeka aracı Google'dan geldi. Google tarafından kullanıcılara sunulan Gemini 2.5 Flash Image (ya da ilk ortaya çıktığı adıyla nano banana), görsel düzenleme konusunda şu ana kadar gördüğümüz en iyi yapay zeka aracı olarak öne çıkıyor. Tabii bu hafta yeni bir AI aracı çıkaran tek şirket Google olmadı. Microsoft, OpenAI, Nvidia gibi şirketler de bu hafta yapay zeka alanında yeni ürün ve araçlar ortaya koydu.

Gemini'nin Görsel Düzenleme Yetenekleri Sınıf Atladı

Google, geçtiğimiz hafta "nano-banana" takma adıyla ortaya çıkan yeni görsel düzenleme modelini bu hafta Gemini'a resmi olarak ekledi. Gemini 2.5 Flash Image adıyla kullanıma sunulan bu yeni model, kullanıcıların doğal dilde verdiği komutlara göre fotoğrafları düzenliyor. Üstelik yüzler, hayvanlar ve karmaşık görsel detayların bozulmadan korunmasını sağlıyor. Fotoğraf düzenleme konusunda şu anda piyasadaki en gelişmiş birkaç modelden biri, hatta belki de birincisi olduğunu söyleyebileceğimiz Gemini 2.5 Flash Image, normalde Photoshop gibi araçlarla yapılan pek çok düzenlemeyi saniyeler içinde yerine getirebiliyor.

Microsoft, İlk Kez Kendi Yapay Zeka Modellerini Tanıttı

Bugüne kadar OpenAI ile birlikte yol yürüyen Microsoft, bu sayede yapay zeka alanında öncü şirketlerinden birine dönüştü. Ancak şirket artık kendisi için OpenAI'dan bağımsız bir yol da çiziyor. Bu amaç doğrultusunda kendi yapay zeka departmanını kurup büyüten Microsoft, bu hafta ilk kez kendi yapay zeka modellerini tanıttı.

MAI-Voice-1 ve MAI-1-preview adını taşıyan bu modeller, şimdiden Microsoft Copilot'un bazı araçlarında kullanılmaya başlandı. MAI-Voice-1, yalnızca tek bir GPU üzerinde bir dakikalık ses üretimini bir saniyeden kısa sürede gerçekleştirebiliyor. Microsoft, MAI-1-preview modelini ise özellikle günlük sorulara anlamlı ve faydalı yanıtlar verebilecek bir yardımcı olarak konumlandırıyor.

Nvidia, Bugüne Kadarki En Gelişmiş AI GPU'sunu Duyurdu: Blackweel Ultra GB300

Nvidia, Hot Chips 2025 etkinliğinde yapay zekâ odaklı en güçlü GPU'su olan Blackwell Ultra GB300'ün ayrıntılarını paylaştı. Blackwell Ultra GB300, çift kalıp (dual-die) tasarımıyla geliyor; NV-HBI yüksek bant genişlikli ara bağlantı teknolojisi sayesinde iki ayrı GPU tek bir çip gibi çalışıyor. 208 milyar transistör barındıran bu tasarım, TSMC'nin N4P üretim süreciyle üretiliyor.

Blackwell Ultra GB300, 288GB'a kadar HBM3E belleği destekliyor. 8192-bit bellek arayüzüyle 8 TB/sn bant genişliği sunan bu sistem, kendisinden önce gelen GB200'e kıyasla yüzde 50 daha fazla bellek kapasitesi sağlıyor. Nvidia, bu sayede trilyonlarca parametreye sahip büyük AI modellerinin tam bellekte çalıştırılabileceğini, uzun bağlam pencerelerinin desteklenebileceğini ve daha verimli eğitim süreçleri sunulabileceğini belirtiyor.

OpenAI, En Gelişmiş Konuşma Modelini Tanıttı: gpt-realtime

OpenAI, karmaşık talimatları daha iyi takip eden, doğal sesler üreten ve yüzde 20 daha ucuz olan yeni konuşma modeli gpt-realtime’i tanıttı. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor. Yeni modelin çıkışına paralel olarak Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.

ChatGPT, Bir Gencin İntiharıyla Suçlanıyor

OpenAI bu hafta yeni bir model tanıttı tanıtmasına ama şirket asıl konu olduğu suçlamalarla gündeme taşındı. ABD'de intihar eden 16 yaşındaki bir gencin ailesi, çocuklarının intihar yöntemleri konusunda ChatGPT'den destek aldığını fark edince OpenAI'a dava açtı. OpenAI bu suçlamaları doğrudan kabul etmese de mevcut güvenlik önlemlerinin uzun sohbetler sırasında bazen etkisiz kalabileceğini kabul etti. Şirket, bu sorunu giderecek bir güncelleme üzerinde çalıştıklarını, ayrıca ChatGPT'ye yakında daha fazla ebeveyn kontrolü eklemek için çalışmalara başladıklarını açıkladı.

Apple, Görsel-Dil Modeli (VLM) FastVLM'yi Kullanıma Sundu

Apple, yapay zeka alanında rakiplerinin epey gerisinde kalmış olsa da bu hafta dikkat çekici bir modelle karşımıza çıktı. Şirket, önemli bir adım atarak FastVLM adını verdiği yeni görsel-dil modelini (VLM) kullanıcıların beğenisine sundu. İlk olarak 2024’te tanıtılan FastVLM, görselleri ve metinleri aynı anda anlayabilen bir yapay zeka modeli olarak öne çıkıyor. Modelin amacı, yüksek hızda işlem yapmak, farklı görsel-dil görevlerinde güçlü sonuçlar elde etmek ve eğitim süreçlerini daha verimli hale getirmek.

FastVLM, özellikle gerçek zamanlı uygulamalarda, mobil, bulut ve uç cihazlarda kullanılmak üzere optimize edilmiş bir çözüm sunuyor. Üstelik WebGPU desteği sayesinde FastVLM, ek bir kurulum gerektirmeden doğrudan tarayıcı üzerinden gerçek zamanlı çalışabiliyor.

Beyinden Esinlenerek Tasarlanan Yapay Zeka, Performansıyla Dikkat Çekti

Singapur merkezli bir yapay zeka şirketi olan Sapient'te görevli araştırmacıların beyinden ilham alarak geliştirdikleri yeni model, performans testlerinde aldığı sonuçlarla dikkatleri üzerine çekmeyi başardı. Bu yeni model özellikle akıl yürütme gerektiren görevlerde, bugün yaygın olarak kullanılan büyük dil modellerinden daha iyi sonuç veriyor. Üstelik bunu çok daha az kaynak kullanarak yapıyor.

Büyük dil modellerinin çoğu, karmaşık bir problemi ara adımlara bölerek çözen zincirleme akıl yürütme (chain-of-thought) yöntemini kullanıyor. Hiyerarşik Akıl Yürütme Modeli (HRM) olarak adlandırılan bu yeni model ise insan beynindeki hiyerarşik işleyişi örnek alıyor. Çeşitli bölgelerinde bilgiyi farklı sürelerde işleyip daha sonra bütünleştirebilen insan beyni gibi bu model de farklı zaman ölçeklerinde çalışan iki modülden oluşuyor: Üst düzey modül daha yavaş fakat soyut planlamaları yürütürken, alt düzey modül hızlı ve ayrıntılı hesaplamaları üstleniyor. Bu mimari sayesinde HRM, ara akıl yürütme adımlarını tek tek yazıp doğrulamaya gerek kalmadan, farklı modüllerin eşzamanlı çalışmasıyla doğrudan nihai cevabı üretebiliyor.

Ayrıca bkz.

AI veri merkezleri devasa maliyetlerle ekonomiyi tehdit ediyor

Bu Haftanın Öne Çıkan Üretken Yapay Zekaları

ByteDance'in bu hafta tamamen ücretsiz olarak yayınladığı USO, verdiğiniz obje ile stili harmanlayarak etkileyici görseller oluşturabiliyor:

ByteDance'in bu hafta yayınladığı bir diğer araç olan OmniHuman-1.5 ise verdiğiniz görsel ve ses dosyası ya da metni harmanlayarak, sesi senkronize ettiği videolar oluşturabiliyor.

Bu hafta benzer bir AI aracı da Alibaba'dan geldi. Alibaba tarafından yayınlanan Wan2.2-S2V de verdiğiniz ses dosyası ile görüntüden yola çıkarak, ses dosyasına uygun videolar üretebiliyor:

Sync tarafından yayınlanan lipsync-2-pro ise istediğiniz ses dosyasını istediğiniz videoya ekleyip, ses ile dudakların hareketini senkronize etmenizi sağlıyor:

Microsoft'un metin seslendirebilen yapay zekası VibeVoice TTS, verdiğiniz metinin içeriğini analiz ederek seslendirmeyi ona uygun ton ve duygu ile yapıyor:

HeyGen tarafından yayınlanan Avatar IV, yapay zeka ile dijital bir avatarınızı oluşturup videolarda o avatarı kullanmanıza olanak sağlıyor:

Yapay Zeka Dünyasından Kısa Kısa:



Haberi DH'de Gör Yorumlar ve Diğer Detaylar
Whatsapp ile Paylaş