OpenAI, GPT-4’ün eğitiminde YouTube’u kullandı
Geçtiğimiz Eylül 2022’de OpenAI, konuşma tanıma ve transkripsiyona yönelik yapay zeka modeli Whisper’ı tanıttı. New York Times'ın raporuna göre Whisper, YouTube videolarındaki sesleri yazıya dökerek GPT-4’ü daha akıllı hale getirecek yeni konuşma metinleri oluşturdu. OpenAI’ın Whisper’ı kullanarak 1 milyon saatten fazla videonun transkripsiyonunu yaptığı bildiriliyor. Times, OpenAI başkanı Greg Brockman'ın kullanılan videoların toplanmasında bizzat çalıştığını yazıyor.
Bu haberin YouTube CEO'su Neal Mohan’ın geçtiğimiz günlerde verdiği bir röportajdan sonra gelmesi dikkat çekici. Mohan, röportajda OpenAI'ın yeni metinden video oluşturucusu Sora'yı eğitmek için YouTube videolarını kullandıysa bunun platformun politikalarının açık ihlali olacağını söylemişti.
Google sözcüsü Matt Bryant, yaptığı açıklamada, Google kuralları uyarınca YouTube içeriğinin izinsiz olarak kazınması ya da indirilmesinin yasak olduğunu ve OpenAI’ın böyle bir kullanıma giriştiğinden de haberdar olmadıklarını söyledi. Öte yandan OpenAI ise bunun yasal olarak tartışmalı bir konu olduğunu ancak yine de “adil kullanım” alanına girdiğine inanıyordu. Ek olarak Google da Gemini gibi yapay zekalarını eğitmek için sınırlı YouTube içeriğini kullandığını kabul ediyor, ancak bunlar onayı alınmış içerik üreticilerin videolarını kapsıyor.
Veri, yeni altın oldu
Wikipedia ve Reddit gibi sitelerin bulunduğu internet yıllarca sonsuz bir veri kaynağı olarak kullanıldı. Ancak yapay zeka geliştikçe, teknoloji şirketleri daha fazla veriye aç hale geldi, artık bu sitelerdeki veriler tüketildi. Her gün arama sorguları ve sosyal medya gönderileri üreten milyarlarca kullanıcısı olan Google ve Meta, gizlilik yasaları ve kendi politikaları nedeniyle yapay zeka için bu içeriğin çoğundan yararlanamıyordu. Ancak geçtiğimiz aylar ve yıllarda yapılan değişikliklerle bazı içeriklerin eğitim verisi olarak kullanılmasının önü açıldı.
Bununla birlikte teknoloji şirketlerinin internetteki yüksek kaliteli verileri 2026 yılına kadar tüketmesi bekleniyor. Yani şirketler veriyi üretildiğinden daha hızlı kullanmaya başlıyor. Teknoloji şirketleri yeni verilere o kadar aç ki bazıları "sentetik" bilgi geliştiriyor. Sentetik verileri insanlar tarafından oluşturulan organik veriler değil, bizzat yapay zeka tarafından üretilen (ses, görsel, metin ve kodlar) verileri içeriyor. Başka bir deyişle, sistemler kendi ürettikleri verilerden öğreniyorlar.
Kaynakça https://www.engadget.com/openai-and-google-reportedly-used-transcriptions-of-youtube-videos-to-train-their-ai-models-163531073.html https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html Bu haberi, mobil uygulamamızı kullanarak indirip,istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
Efsane Türkiye’ye gelse alırım..
O ışık efektleri sadece yanlarda değil üstte de olmalıydı. Böylece tabancayı kullanan, kafasını yana eğmek zorunda kalıp, fıtık olmaz. Aynısını küçükken ışıklı ayakkabımda yaşamıştım oradan biliyorum. Ayakkabıma yan bakmaktan düz yürüyemiyordum. Hava atmaktan ziyade o havayı yaşamayı tercih ederim. 7 de olsam 70 de olsam kararım değişmeyecek.
Mukemmel bir silah acaba ne kadar hızlı atıyor. [resim]
Fiyat makul olsa efsane olur gerçekten ya.
Vay bee, bu cihaz xiaomi çıktı ben de diyordum kim üretmiş..
hocam 4x daha iyi direk hs attirir
Über
Evet ama 6x scop daha iyi gider buna daha uzaktaki hedefler için. Gerektiğinde 3x'e de çekebilirsin falan :D
Muskun alev tabancası vs bu
İstilacı güvercinlere karşı iyi olur. 5 10 dk da bir sopayı alıp kovalamak yordu artık.
Yakında su atan F18 falanda yaparlar :)
Hazneye kezzaplı su doldurup nişan almak yapmayın böyle şeyler yahu...
Xiaomi kendini çok geliştirdi artık her alanda kaliteli işler yapıyorlar.
fışkırttığı su mermi gibi isabetli gitmeyeceği için gereksiz diye düşünmüş olabilirler.
Lazer nişangah da eklenseymiş tadından yenmezmiş.