Anlık Bildirim

Microsoft'un görsel tanıma teknolojileri rakip tanımıyor

Beynin çalışma prensipleri, bilgisayar alanında pek çok teknolojiye ilham kaynağı oluyor. Bunlardan birisi olan tanıma yeteneği, görsellerin sınıflandırılması konusunda bilgisayarlara yol gösteriyor.

Bilgisayarların, insan beyninin elma ve armudu ayırma örneğinde olduğu gibi nesneleri tanımlama veya ayırt edebilme çalışmalarına makine öğrenme dili adı veriliyor. Bir dönem son kullanıcıdan uzak bir şekilde geliştirilen öğrenme dili bugün pek çok alanda hizmetimize sunulmuş durumda. 

Makine öğrenme dilinin en yoğun olarak kullanıldığı yerlerden birisi resim gösterim platformları. Bu sayede Google Fotoğraflar veya Facebook örneğinde olduğu gibi; kullanıcının olduğu fotoğrafları etiketleyebilme, belirli bir tanıma göre fotoğraflar arasında arama yapabilme şeklinde pek çok özellik kullanıcılara sunulabiliyor. En büyük avantajı ise kullanıcının yaptığı işleri otomatik hale getirerek büyük zaman kazandırması. 

Microsoft, çeşitli üniversitelerin araştırmacıları ile birlikte ImageNet adında bir girişim kurmuştu ve bu girişim 6 yıldır görsel tanıma teknolojileri konusunda bir yarışma düzenliyor. Bu yıl ki yarışmada da Microsoft'un MS COCO adındaki görsel tanıma ve sınıflandırma teknolojisi; Google, Intel, Qualcomm ve Tencent gibi rakiplerini geride bırakarak birinci oldu. 

Yarışmada üç kategori mevcut. Bunlar sınıflama, konumlama ve tespit etme şeklinde sıralanıyor. Katılımcıların Flickr ve arama motorlarından elde edilen 100 000 fotoğraf içerisinden istenenleri doğru biçimde bulması ve 1000 farklı kategoriye sınıflandırması gerekiyor. MS COCO bu yarışmada üç kategori ortalamasında yüzde 3.5 sınıflama hatası ve yüzde 9 bulma hatası seviyesi ile birinciliğe uzandı. 

MS COCO algoritması, aynı beyin nöral ağları gibi yaklaşık 150 katmanlık bir derinlikte analizler yapabiliyor. İlk olarak Microsoft bünyesinde başlayan MS COCO, daha sonra bilimsel amaçlarla kullanılması için araştırmacılardan oluşan bir ekibe devredildi. Microsoft bu teknolojiyi kendi fotoğraf depolama alanlarında kullanıyor. Teknoloji ekstra olarak ses tanıması da yapabiliyor ve Skype Translator'dan hatırladığımız anlık çeviri özelliğinin de temelini oluşturuyor. 

Makine öğrenme dili konusunda son yıllarda yaşanan gelişmeler doğrudan kullanıcıları etkilemeye başladı. Facebook, Google Fotoğraflar, iOS Fotoğraflar gibi görsel tanıma teknolojilerine yer veren pek çok platform artık kullanıcısını çok daha iyi tanıyor ve fotoğrafların sınıflandırmasını daha kolay bir biçimde yapabiliyor. 
Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Sıcak Fırsatlar Forumunda Tıklananlar

Tavsiyelerimiz

Yeni Haber
şimdi
Geri Bildirim