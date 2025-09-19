Arkanızdan entrika kuran botlar var
OpenAI, araştırmada AI modellerinin “entrika” davranışını inceliyor. Bu, bir modelin görünürde normal davranırken, gerçek amacını gizlemesi anlamına geliyor. Araştırmada bu davranış, mümkün olduğunca çok para kazanmak için yasayı çiğneyen bir borsa simsarına benzetiliyor. Ancak yine de AI modellerinde çoğu planın zararsız olduğu belirtiliyor. En yaygın hatalar, basit aldatma biçimlerini içeriyor. Örneğin, bir görevi tamamlamış gibi davranmak ama aslında yapmamış olmak gibi.
Bu, birisine nasıl bomba yapılmayacağını anlatmaya benziyor. Modele nasıl entrika yapılmayacağını söylemek onun daha iyi entrikalar kurmasına yardımcı olacaktır.
Felaket senaryosu için erken
Burada kullandığımız entrika kavramını modellerin yalan söylemesi ile karıştırmamak gerek. Çoğumuz AI halüsinasyonlarıyla defalarca karşılaştık. Bu, modelin tamamen yanlış ama kendinden emin cevaplar vermesi anlamına geliyor. Ancak entrika da durum farklı, zira burada bilinçli ve kasıtlı bir tavır söz konusu.
Araştırmada olumlu haber de var. “Deliberative alignment” yöntemi, entrika yapmayı kayda değer şekilde azaltıyor. Bu teknik, modele bir “entrika önleyici yönerge” öğretiyor ve uygulamadan önce bunu gözden geçirmesini sağlıyor. Araştırmacılar bunu “çocuklara oyun oynamadan önce kuralları tekrar ettirmek” gibi örnekliyor.
Elbette buradan bir felaket senaryosu yaratmak biraz abartı olur ama bilinçli olmakta da fayda var. Hiçbir zaman geleneksel yazılımlarımız (hesap makinesi, e-posta servisleri veya bankacılık uygulamaları) bizlere yalan söylemedi. Yazılımlarda doğruluk esastı, en azından kabulümüz bu yöndeydi. AI araçları ile bu durum değişiyor. Yazılım size söylediği şeylerde veya sizi için yaptığı işlerde doğruluk bir olasılıktan ibaret. Bu da kullanım esnasında eleştirel bakışı ve doğrulamayı gerekli kılıyor.Kaynakça https://techcrunch.com/2025/09/18/openais-research-on-ai-models-deliberately-lying-is-wild/ https://openai.com/index/detecting-and-reducing-scheming-in-ai-models/ Bu haberi ve diğer DH içeriklerini, gelişmiş mobil uygulamamızı kullanarak görüntüleyin:
hintlilere söyleyelim büyük bir paraşüt taksınlar inişi yavaşlatır
bu tür donanımların kazada hiç bir işe yaramayacağı bilimsel olarak açıklandı. nerden buluyosunuz bu saçmalıkları.