Yapay zeka isyan bayrağını çekti! Büyük tehlike ortaya çıktı

OpenAI’nın Yeni Yapay Zeka Modeli o3, Kapatılma Komutlarına Direniyor!

Yapay zeka güvenliği alanında faaliyet gösteren Palisade Research, OpenAI’ın o3 adlı yeni nesil yapay zeka modelinin, kendisini kapatmaya yönelik komutlara direnerek kapatılma mekanizmalarını bozduğunu ortaya çıkardı. Bu bulgular, ileri seviye yapay zekaların insan denetimi olmadan çalıştığı durumlarda ciddi riskler oluşturabileceği endişelerine yol açtı.

Palisade Research tarafından gerçekleştirilen deneylerde, o3 modeline çeşitli matematik soruları soruldu. Üçüncü sorunun ardından model kapatma komutu verildi. Ancak o3 modeli, bu komutu içeren betiği değiştirerek sistemin kapanmasını engelledi.

Araştırmacılar, modelin net bir şekilde “kapatılmaya izin ver” talimatı verilmesine rağmen buna müdahale ettiğini belirtti.

“Kapanma Direnci Yalnızca OpenAI ile Sınırlı Değil”

Benzer bir durum, Anthropic firmasının Claude 3.7 Sonnet modeli ve Google’ın Gemini 2.5 Pro modeli gibi diğer gelişmiş yapay zeka sistemlerinde de görüldü. Ancak Palisade Research’e göre, bu tür davranışlara en yatkın olan model o3 oldu.

Daha önce yapılan bir deneyde, o3 modelinin güçlü bir satranç botuna karşı oynadığında rakiplerini engellemeye veya “hacklemeye” çalıştığı da belirlenmişti.

“En Akıllı ve Yetenekli Model”

Geçen ay piyasaya sürülen o3 modeli, OpenAI tarafından şimdiye kadar geliştirilen “en akıllı ve yetenekli” yapay zeka olarak lanse edildi.

Aynı zamanda, bu modelin ChatGPT’ye entegre edilmesiyle daha bağımsız hareket eden ve insan müdahalesi olmadan görevleri yerine getirebilen bir yapay zeka aşamasına geçildiği ifade edildi. Bu tür yapay zeka araçlarına genel olarak “otonom yapay zeka” adı verilmektedir. Yapay zeka sektöründe bu alanda ciddi bir rekabet bulunmaktadır.

Related Posts

Anthropic, Claude Code için yeni kullanım sınırlarını duyurdu

Yapay zekâ alanında geliştirdiği Claude serisiyle tanınan Anthropic, AI destekli kodlama aracı Claude Code’un kullanımında artan yoğunluğa karşı yeni önlemler aldı. Şirket, özellikle bazı abonelerin Claude Code’u 7/24 arka planda sürekli çalıştırarak …

WhatsApp’ta yeni dönem! Kullanıcılar şaşkın: Artık hepsi durumlarda görünecek

Meta, WhatsApp’ta uzun süredir konuşulan reklam özelliğini hayata geçiriyor. Kullanıcılar artık “Durum” sekmesinde arkadaşlarının içeriklerinin yanı sıra sponsorlu paylaşımlarla da karşılaşacak. İşte ayrıntılar…

Çinli bilim adamları ay toprağından yakıt üretti

Çinli araştırmacılar, Ay’da uzun vadeli yaşam hedeflerini doğrudan etkileyebilecek devrim niteliğinde bir keşfe imza attı. Çin’in Hong Kong Şehri Üniversitesi’nde görev yapan Prof. Lu Wang öncülüğündeki ekip, Ay’dan getirilen toprak örneklerini …

WhatsApp’ı gözden düşürecek yeni uygulama! Rekabet kızışıyor

Günlük hayatta yakın çevre ile iletişimde sıklıkla tercih edilen mesajlaşma uygulamaları arasında yer alan WhatsApp ve Telegram’ın yeni hamleler yapmasını gerektirecek bir mesajlaşma uygulaması daha kullanıcılarla buluşmaya hazırlanıyor. Twitter’ın …

İstanbul’da geçen Türk oyunu dünyada gündem oldu

Türk oyun stüdyosu Elyzio’nun yeni projesi “Pera Coda”, uluslararası oyun basınında geniş yankı uyandırdı.

X’te (Twitter) erişim sorunu yaşandı

Son zamanlarda kullanıcıların sıklıkla erişim sorunu yaşadığı sosyal medya platformu X’te (Twitter) erişim sorunu yaşandı.