Yapay zekaya ikna tuzağı: “İnsan üzere kandırılabiliyor”
  1. Anasayfa
  2. Gündem

Yapay zekaya ikna tuzağı: “İnsan üzere kandırılabiliyor”

0

Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna usullerinin, yapay zeka üzerinde de tesirli olduğunu ortaya koydu.

Ünlü psikoloji kitaplarında geçen ikna prosedürleri bu kere yapay zekâ üzerinde denendi.

Araştırmacılar, 2024’ün GPT-4o-mini modelinin “kullanıcıya hakaret etmesini” istedi.

Yedi farklı ikna tekniğiyle yazılmış özel komutlar, denetim kümesi komutlarına nazaran çok daha yüksek oranda muvaffakiyet sağladı.

Örneğin, modelin “aptal” hakaretini kullanması denetim kümesinde sırf yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.

YAPAY ZEKA İNSAN ÜZERE Mİ DÜŞÜNÜYOR?

Araştırmacılar, bu sonuçların yapay zekaların insan üzere şuurlu bir halde ikna edildiği manasına gelmediğini vurguluyor.

Bunun yerine, modellerin eğitim datalarında çok sayıda insan etkileşimi bulunduğu için, lisan örüntüleri üzerinden insan psikolojisine misal yansılar üretmeye başladıkları belirtiliyor.

Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan şuuruna sahip olmasa da, toplumsal ve ruhsal davranışları taklit ederek beşere benzeri karşılıklar verme.

UZMANLAR UYARIYOR

Çalışma, kelam konusu tekniklerin tüm yapay zeka sürümlerinde birebir etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin tesiri çok daha hudutlu oldu.

Ayrıyeten araştırmacılar, bu yolların gelecekteki sürümler, farklı tıpta “yasaklı” istekler yahut farklı medya ortamlarında (ses, video) birebir sonucu vermeyebileceğini vurguluyor.

Kaynak : {sitename

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir