“Makine unlearning” (makine unutuşu) ismi verilen bu teknik, bir sesin müsaadesiz formda taklit edilmesini önlemek için, yapay zekanın o sesi veritabanından büsbütün silmesine dayanıyor. Böylelikle bir kullanıcı özel olarak bu sesi taklit etmesini istese bile, model o sesi üretemiyor.
Profesör Jong Hwan Ko ve grubu, bu sistemi Meta’nın VoiceBox isimli ses üretim modelinde denedi. Denemelerde, unutturulan bir sesi taklit etmesi istenen modelin, sesi yüzde 75 oranında daha başarısız taklit ettiği görüldü.
Bu fark, dinleyicilerin geçersiz sesi kolaylıkla ayırt edebilmesini sağlıyor. Lakin bu unutma süreci, öbür seslerin taklit kalitesinde ortalama yüzde 2,8’lik bir düşüşe yol açıyor.
UNUTULAN BİLGİLER GERİ GETİRİLEMEZ
Araştırmaya nazaran, bir sesi unutturmak için modelin yaklaşık beş dakikalık özgün ses kaydına gereksinimi var. Unutma süreci ise istenen ses sayısına bağlı olarak birkaç gün sürebiliyor. Araştırmacılar, unutulan bilgilerin rastgele gürültüyle değiştirilerek geri getirilemez hale getirildiğini belirtiyor.
Yapay zekada istenmeyen içerikleri engellemek için bugüne kadar genelde müdafaa bariyerleri (guardrails) kullanılıyordu. Fakat birtakım kullanıcılar bu bariyerleri aşmayı başarabiliyordu. Makine unutuşu ise datayı büsbütün sistemden çıkararak bu açıkları kapatmayı hedefliyor.
