Machine Unlearning Nedir? Yapay Zekâ Öğrendiğini Unutabilir Mi?

Machine unlearning, Türkçeye “makine öğrenmesinde unutma”, “makine unutması” veya “yapay zekâda veri unutturma” olarak çevrilebilecek bir kavramdır. En kısa tanımıyla machine unlearning, eğitilmiş bir yapay zekâ veya makine öğrenmesi modelinden belirli bir verinin, kişi kaydının, içerik parçasının, davranış kalıbının ya da bilgi etkisinin çıkarılmasını amaçlayan teknikler bütünüdür. Buradaki temel hedef, modeli baştan eğitmeden, sanki ilgili veri hiç kullanılmamış gibi davranan yeni bir model durumuna ulaşmaktır.

Machine unlearning, yalnızca “veri silme” işlemi değildir. Bir veri tabanından satır silmek, bir dosyayı kaldırmak veya bir kullanıcı hesabını kapatmak çoğu zaman yeterli değildir. Çünkü makine öğrenmesi modelleri, eğitim verilerini birebir dosya gibi saklamaz. Veriler, modelin parametrelerine, ağırlıklarına, istatistiksel örüntülerine, karar sınırlarına, temsil uzaylarına ve kimi zaman çıktılarındaki hafıza izlerine dağılmış olabilir. Bu yüzden bir veriyi eğitim setinden silmek, o verinin model üzerindeki etkisini otomatik olarak ortadan kaldırmaz.

Machine unlearning’in önemi, yapay zekâ sistemlerinin hayatın neredeyse her alanına yerleşmesiyle artmıştır. Sağlık, finans, eğitim, işe alım, reklamcılık, güvenlik, sosyal medya, hukuk teknolojileri, arama motorları ve üretken yapay zekâ sistemleri büyük veri setleriyle eğitilir. Bu veri setlerinde kişisel veriler, telifli içerikler, hatalı kayıtlar, zararlı bilgiler, önyargılı örnekler veya sonradan kaldırılması gereken veriler bulunabilir. Bu durumda şu soru ortaya çıkar: Bir model öğrendiği şeyi nasıl unutabilir?

Machine unlearning, bu soruya teknik bir cevap arar. Ancak cevap basit değildir. Çünkü makine öğrenmesi modelleri insan gibi hatırlamaz ve insan gibi unutmaz. Bir modelin “unutması”, belirli bir anıyı zihinden silmesi anlamına gelmez. Daha çok, modelin belirli bir veriden etkilenmiş davranışlarını azaltması, o veriye bağlı çıkarımları üretmemesi ve mümkünse o veri hiç kullanılmadan eğitilmiş bir modele istatistiksel olarak benzemesi anlamına gelir.

İÇİNDEKİLER TABLOSU

Machine Unlearning Nedir?

Machine unlearning, bir makine öğrenmesi modelinden belirli eğitim verilerinin etkisini kaldırma problemidir. Bu etki; tek bir kullanıcının verisi, belirli bir veri kümesi, belirli bir sınıf, belirli bir davranış, belirli bir telifli kaynak, belirli bir zararlı bilgi alanı veya belirli bir yanlış öğrenme biçimi olabilir.

İdeal durumda machine unlearning işlemi sonunda ortaya çıkan model, ilgili veri hiç eğitim sürecine dahil edilmemiş olsaydı oluşacak modele çok benzer. Bu nedenle literatürde sık kullanılan sezgisel tanım şudur: Machine unlearning, modeli “veri hiç görülmemiş gibi” bir duruma getirmeye çalışır.

Bu tanım basit görünür, fakat teknik olarak çok zordur. Çünkü modern yapay zekâ modelleri milyonlarca, milyarlarca hatta trilyonlarca parametreye sahip olabilir. Eğitim verisi modelin içine doğrudan satır satır yazılmaz; istatistiksel ağırlıklar şeklinde dağılır. Bir kişinin fotoğrafı, bir metin parçası, bir tıbbi kayıt veya bir telifli eser modelin tek bir noktasında durmaz. Modelin birçok parametresine küçük etkiler hâlinde yayılabilir.

Bu yüzden machine unlearning’in temel problemi şudur: Belirli bir verinin model üzerindeki etkisini, modeli tamamen yeniden eğitmeden nasıl kaldırabiliriz?

Modeli baştan eğitmek teorik olarak en temiz çözüme benzer. Eğer bir veri silinecekse, eğitim setinden çıkarılır ve model kalan verilerle yeniden eğitilir. Fakat bu işlem büyük modeller için son derece pahalıdır. Zaman, enerji, hesaplama gücü, mühendislik maliyeti ve karbon ayak izi bakımından her silme talebi için modeli yeniden eğitmek pratik değildir. Machine unlearning, bu maliyeti azaltmak için geliştirilir.

Machine Learning Neden Unutmak Zorundadır?

Makine öğrenmesi sistemleri uzun süre boyunca daha çok “nasıl daha iyi öğrenir?” sorusuyla geliştirildi. Daha büyük veri setleri, daha güçlü modeller, daha uzun eğitim süreçleri ve daha yüksek performans hedeflendi. Ancak yapay zekâ sistemleri yaygınlaştıkça yeni bir soru doğdu: Bir model yanlış, zararlı, özel, hukuka aykırı veya artık kullanılmaması gereken bilgiyi öğrendiyse ne olacak?

Machine unlearning’in ortaya çıkmasının birkaç temel nedeni vardır.

Kişisel Verilerin Silinmesi

Bir kişi, kişisel verilerinin sistemlerden silinmesini talep edebilir. Bu talep yalnızca veri tabanındaki ham kayıtları değil, o kayıtlarla eğitilmiş modelleri de ilgilendirebilir. Eğer bir model kişinin verisinden öğrenmişse, “silme” işleminin model düzeyinde ne anlama geldiği ciddi bir teknik ve hukuki sorudur.

Hatalı Verilerin Kaldırılması

Eğitim verisinde hatalı etiketler, yanlış kayıtlar, bozuk ölçümler veya kirli veri bulunabilir. Bu tür veriler model performansını bozabilir. Machine unlearning, hatalı verilerin etkisini kaldırarak modeli düzeltmenin bir yolu olabilir.

Zararlı Bilgilerin Azaltılması

Büyük dil modelleri veya üretken yapay zekâ sistemleri bazı zararlı bilgileri öğrenebilir. Siber saldırı teknikleri, biyogüvenlik riski taşıyan bilgiler, kişisel veri sızıntıları, yasa dışı talimatlar veya tehlikeli içerik üretim kalıpları bunlara örnek olabilir. Machine unlearning, bu tür bilgilerin model davranışındaki etkisini azaltmak için kullanılabilir.

Telif ve Lisans Sorunları

Bir modelin eğitim verisinde telifli eserler, lisans şartları ihlal edilmiş veri setleri veya sonradan kullanım izni geri çekilen içerikler bulunabilir. Bu durumda ilgili verinin model üzerindeki etkisinin kaldırılması gerekebilir. Ancak telifli içeriğin modeldeki etkisini tanımlamak ve ölçmek kolay değildir.

Güvenlik ve Mahremiyet

Modeller bazı eğitim verilerini ezberleyebilir. Özellikle büyük dil modelleri, özel isimleri, adresleri, kod parçalarını, e-posta metinlerini veya nadir görülen veri örneklerini bazı koşullarda çıktı olarak üretebilir. Machine unlearning, bu tür mahremiyet risklerini azaltmak için bir araç olabilir.

Model Güncelleme ve Veri Yönetişimi

Kurumsal sistemlerde veriler sürekli değişir. Eski veriler güncelliğini kaybeder, bazı kayıtlar geçersiz olur, bazı veri kaynakları kapatılır. Machine unlearning, modelleri yalnızca yeni bilgiyle güncellemek değil, eski veya istenmeyen bilgi etkilerini azaltmak için de önemlidir.

Veri Silme ile Machine Unlearning Arasındaki Fark

Machine unlearning’i anlamanın en önemli yolu, onu sıradan veri silmeden ayırmaktır. Bir veri tabanında bir satırı silmek nispeten anlaşılır bir işlemdir. Kullanıcı kaydı kaldırılır, dosya silinir, yedeklerden temizlenir veya erişim engellenir. Ancak makine öğrenmesi modelinde durum farklıdır.

Bir model, eğitim verilerini doğrudan saklamıyor olabilir. Fakat eğitim sırasında bu veriler modelin ağırlıklarını değiştirmiştir. Modelin kararları, olasılık tahminleri, sınıflandırmaları, önerileri veya metin üretimleri bu verilerin etkisini taşıyabilir. Bu yüzden ham veri silinse bile model hâlâ o veriden öğrenilmiş davranışları sürdürebilir.

Örneğin bir yüz tanıma modeli, bir kişinin fotoğraflarıyla eğitilmişse, fotoğrafları veri tabanından silmek o kişinin yüz özelliklerinin model parametrelerindeki etkisini otomatik olarak ortadan kaldırmaz. Bir dil modeli, özel bir belgeden belirli cümleleri ezberlediyse, belge dosyasını silmek modelin o cümleleri üretme ihtimalini sıfırlamayabilir. Bir kredi skorlama modeli, hatalı bir veri kaydından etkilenmişse, o kaydı veri tabanından çıkarmak model karar sınırını hemen değiştirmez.

Bu nedenle veri silme, ham kayıt düzeyinde bir işlemdir. Machine unlearning ise model davranışı ve model parametreleri düzeyinde bir işlemdir.

Bir Model Veriyi Nasıl Hatırlar?

Makine öğrenmesi modelleri insan zihni gibi hatırlamaz. Yine de “hatırlama” benzetmesi bazı riskleri anlamak için yararlıdır. Bir model, eğitim verisindeki örüntüleri parametrelerine aktarır. Bu örüntüler genel olabilir veya belirli veri örneklerine aşırı bağlı olabilir.

Genel öğrenme, modelin istenen işlevidir. Örneğin bir model, kedilerle köpekleri ayırt etmeyi öğrenirken tek tek fotoğrafları ezberlemek yerine genel görsel özellikleri yakalamalıdır. Dil modeli, tek tek cümleleri kopyalamak yerine dilin yapısını, anlam ilişkilerini ve kullanım kalıplarını öğrenmelidir.

Fakat modeller bazen verileri fazla öğrenir. Buna ezberleme veya memorization denir. Ezberleme özellikle büyük modellerde, nadir veri örneklerinde, tekrar eden metinlerde, kişisel verilerde, küçük veri setlerinde ve aşırı eğitim durumlarında görülebilir. Model, belirli bir girdiye karşı eğitim verisindeki özgül bir çıktıyı yeniden üretebilir.

Machine unlearning açısından önemli olan yalnızca açık ezberleme değildir. Bir veri örneği ezberlenmemiş olsa bile modelin karar sınırını, olasılık dağılımını veya temsil uzayını etkilemiş olabilir. Bu nedenle “model bu veriyi kelimesi kelimesine üretiyor mu?” sorusu yeterli değildir. Daha derin soru şudur: Bu veri modelin davranışını nasıl değiştirdi?

Machine Unlearning Nasıl Çalışır?

Machine unlearning için tek bir yöntem yoktur. Kullanılan yöntem; model türüne, veri türüne, silinecek verinin miktarına, performans gereksinimine, hukuki bağlama, güvenlik ihtiyacına ve doğrulama düzeyine göre değişir.

Basitleştirilmiş bir machine unlearning süreci şu adımlardan oluşabilir:

Silinecek Veri Belirlenir: Hangi veri örneklerinin, kullanıcı kayıtlarının, sınıfların veya bilgi alanlarının unutulacağı tanımlanır.
Model Üzerindeki Etki Analiz Edilir: Bu verilerin model parametreleri, çıktıları veya davranışları üzerindeki etkisi incelenir.
Unlearning Algoritması Uygulanır: Model ağırlıkları güncellenir, belirli bileşenler yeniden eğitilir, gradyan etkileri tersine çevrilir veya modelin belirli bilgiye erişimi azaltılır.
Unutma Kalitesi Ölçülür: Modelin silinmesi istenen veriyle ilişkili davranışları ne kadar azalttığı test edilir.
Koruma Kalitesi Ölçülür: Modelin genel performansının bozulup bozulmadığı değerlendirilir.
Güvenlik ve Mahremiyet Testleri Yapılır: Modelin hâlâ silinen veriyi sızdırıp sızdırmadığı, üyelik çıkarımı veya veri çıkarma saldırılarına karşı test edilir.
Denetim Kaydı Tutulur: Unlearning talebinin ne zaman alındığı, neyin unutulduğu, hangi yöntemin uygulandığı ve hangi testlerin yapıldığı belgelenir.

Bu akış, machine unlearning’in yalnızca algoritmik bir işlem değil, aynı zamanda veri yönetişimi süreci olduğunu gösterir. Başarılı bir unlearning sistemi, teknik yöntem kadar kayıt tutma, doğrulama, hukuki uyum, güvenlik ve kullanıcı iletişimi gerektirir.

Machine Unlearning Türleri

Tam Yeniden Eğitim

En basit ve teorik olarak en güvenilir yaklaşım, silinecek veriyi eğitim setinden çıkarıp modeli kalan veriyle baştan eğitmektir. Bu yöntem, ilgili veri hiç kullanılmamış gibi bir model elde etmeye en yakın çözümdür. Fakat büyük modellerde çok pahalıdır. Her silme talebi için tam yeniden eğitim yapmak pratik olmayabilir.

Exact Unlearning

Exact unlearning, unlearning işleminden sonra elde edilen modelin, ilgili veri hiç kullanılmadan eğitilmiş modelle aynı veya istatistiksel olarak eşdeğer olmasını hedefler. Bu güçlü bir garantidir. Ancak karmaşık derin öğrenme modellerinde ve büyük veri setlerinde exact unlearning sağlamak çoğu zaman zordur.

Approximate Unlearning

Approximate unlearning, silinmesi istenen verinin etkisini pratik olarak azaltmayı hedefler. Model, veri hiç görülmemiş gibi davranmaya yaklaştırılır; fakat tam eşdeğerlik garanti edilmeyebilir. Büyük modellerde çoğu unlearning yöntemi bu kategoriye girer.

Sertifikalı Unlearning

Sertifikalı unlearning, yapılan unlearning işleminin belirli matematiksel veya istatistiksel garantilerle desteklenmesini amaçlar. Burada hedef, dışarıdan bakan bir gözlemcinin unlearning sonrası modeli, silinen veri hiç kullanılmadan eğitilmiş modelden ayırt edememesi gibi güçlü bir güvence kurmaktır.

Veri Bölümleme Yaklaşımları

Model eğitimi baştan unlearning’e uygun tasarlanabilir. Eğitim verisi parçalara ayrılır, model bileşenleri ayrı ayrı eğitilir ve bir silme talebi geldiğinde yalnızca ilgili parça yeniden eğitilir. SISA yaklaşımı bu aileye örnektir.

Gradyan Tabanlı Yöntemler

Derin öğrenme modellerinde bazı yöntemler, silinmesi istenen verinin eğitim sırasında yarattığı gradyan etkisini tersine çevirmeye veya azaltmaya çalışır. Bu yöntemler tam yeniden eğitimden daha hızlı olabilir; fakat doğrulama ve yan etki sorunları yaratabilir.

İnce Ayar Tabanlı Unlearning

Özellikle büyük dil modellerinde, istenmeyen bilgiyi azaltmak için model belirli veri setleriyle yeniden ince ayardan geçirilebilir. Bu yaklaşım modelin bazı cevapları üretme olasılığını düşürebilir; fakat gerçekten unutma mı sağladığı, yoksa yalnızca çıktı davranışını mı bastırdığı dikkatle test edilmelidir.

Çıktı Engelleme ve Güvenlik Katmanı

Bazı sistemler, modelin iç bilgisini değiştirmek yerine çıktıları filtreler. Örneğin model belirli bir kişisel veriyi üretecek gibi olduğunda güvenlik katmanı bunu engeller. Bu yöntem yararlı olabilir; fakat gerçek machine unlearning değildir. Çünkü modelin içinde bilgi hâlâ duruyor olabilir.

Exact Unlearning ve Approximate Unlearning Nedir?

Machine unlearning literatüründe en önemli ayrımlardan biri exact unlearning ile approximate unlearning arasındadır.

Exact unlearning, en güçlü unutma biçimidir. Bir veri silindikten sonra modelin, o veri hiç eğitim setinde yokmuş gibi eğitilmiş modelle aynı dağılımdan gelmesi hedeflenir. Bu, hukuki ve etik açıdan çekici bir fikirdir; çünkü gerçekten “veri hiç kullanılmamış gibi” bir durum yaratmaya yaklaşır.

Fakat exact unlearning çoğu durumda pahalıdır. Özellikle derin sinir ağları, büyük dil modelleri ve karmaşık eğitim süreçleri için tam eşdeğerlik sağlamak zordur. Eğitim süreci rastlantısallık, optimizasyon yolu, veri sırası, donanım farkları ve hiperparametre seçimleri gibi birçok etkene bağlıdır.

Approximate unlearning ise daha pratik bir yaklaşımdır. Amaç, silinen verinin model üzerindeki etkisini kabul edilebilir düzeyde azaltmaktır. Model, silinen veriyle ilişkili çıktıları üretmemeli, üyelik çıkarımı saldırılarına karşı daha az bilgi vermeli ve genel performansını korumalıdır. Ancak bu yaklaşımda “ne kadar unutma yeterlidir?” sorusu ortaya çıkar.

Bu soru teknik olduğu kadar etik ve hukuki bir sorudur. Bir sağlık verisi için gereken unutma seviyesiyle, genel bir ürün yorumunun unutulması için gereken seviye aynı olmayabilir. Bir telifli roman pasajının modelden çıkarılmasıyla, tehlikeli biyogüvenlik bilgisinin azaltılması da aynı değerlendirme ölçütlerine sahip değildir.

Sertifikalı Veri Kaldırma Nedir?

Sertifikalı veri kaldırma, machine unlearning alanında daha güçlü güvence sağlamaya çalışan yaklaşımlardan biridir. Bu yaklaşımda amaç, modelden bir veri çıkarıldığında bunun yalnızca iddia edilmesi değil, belirli matematiksel garantilerle desteklenmesidir.

Sertifikalı kaldırma fikri şunu sorar: Bir modelden veri çıkarıldığını nasıl kanıtlarız? Eğer model yalnızca biraz ince ayar gördüyse, gerçekten unutmuş mudur? Eğer çıktı filtreleri eklendiyse, bilgi hâlâ model ağırlıklarında duruyor mudur? Eğer model belirli testlerde başarısız oluyorsa, başka testlerde veri sızdırabilir mi?

Sertifikalı yaklaşımlar bu belirsizliği azaltmaya çalışır. Ancak bunların da sınırları vardır. Güçlü sertifikalar genellikle daha basit modellerde veya belirli varsayımlar altında daha uygulanabilir olabilir. Büyük dil modelleri gibi çok karmaşık sistemlerde aynı düzeyde garanti vermek zordur.

Yine de sertifikalı unlearning fikri önemlidir. Çünkü gelecekte yapay zekâ sistemlerinin yalnızca “veriyi sildik” demesi yeterli olmayabilir. Kullanıcılar, denetçiler, mahkemeler ve düzenleyici kurumlar, silme işleminin nasıl yapıldığını ve hangi ölçütlerle doğrulandığını görmek isteyebilir.

SISA Yaklaşımı Nedir?

SISA, “Sharded, Isolated, Sliced, Aggregated” kelimelerinin kısaltmasıdır. Türkçeye yaklaşık olarak “parçalanmış, izole edilmiş, dilimlenmiş ve birleştirilmiş” eğitim yaklaşımı olarak çevrilebilir. SISA’nın temel fikri, modeli en baştan unlearning taleplerini kolaylaştıracak şekilde eğitmektir.

Geleneksel eğitimde tüm veri tek bir büyük modelin içine karışır. Bir veri silinmek istendiğinde, bu verinin etkisi modelin birçok noktasına yayılmış olabilir. SISA ise veri setini parçalara böler. Her parça ayrı şekilde eğitilir. Daha sonra bu parçalardan gelen modeller veya çıktılar birleştirilir. Eğer belirli bir veri silinecekse, yalnızca o verinin bulunduğu parça yeniden eğitilir.

Bu yaklaşımın avantajı, unlearning maliyetini azaltmasıdır. Modeli tamamen baştan eğitmek yerine, yalnızca ilgili shard veya slice üzerinde işlem yapılır. Dezavantajı ise eğitim mimarisinin baştan buna göre tasarlanmasını gerektirmesidir. Ayrıca model performansı, veri bölme stratejisi ve birleştirme yöntemi dikkatle yönetilmelidir.

SISA, machine unlearning alanında önemli bir fikri temsil eder: Unutma sonradan eklenen bir yamadan ibaret olmamalı; model mimarisi ve eğitim süreci baştan unutmaya uygun tasarlanmalıdır.

Büyük Dil Modellerinde Machine Unlearning

Büyük dil modelleri için machine unlearning daha karmaşık bir problemdir. Çünkü bu modeller çok büyük veri setleriyle eğitilir, geniş bilgi alanlarını kapsar ve bilgiyi tek bir noktada saklamaz. Bir metin parçası, modelin dil yapısına, kavram ilişkilerine, temsil uzayına ve yanıt üretim olasılıklarına dağılmış olabilir.

Büyük dil modellerinde unlearning birkaç farklı amaçla gündeme gelir:

Kişisel verilerin model çıktılarından çıkarılması
Telifli metinlerin etkisinin azaltılması
Zararlı veya tehlikeli bilgi alanlarının bastırılması
Yanlış veya eski bilgilerin etkisinin azaltılması
Belirli kişilere, kurumlara veya veri kümelerine ait ezberlenmiş içeriğin silinmesi
Modelin toksik, ayrımcı veya riskli davranış kalıplarını azaltması

Ancak büyük dil modellerinde unlearning’in en önemli sorunu ölçümdür. Model gerçekten unuttu mu, yoksa belirli sorulara cevap vermemeyi mi öğrendi? Bilgi başka bir biçimde hâlâ çıkarılabilir mi? Kullanıcı soruyu farklı sorarsa model aynı bilgiyi verebilir mi? Jailbreak veya prompt engineering teknikleriyle unutulduğu sanılan bilgi yeniden ortaya çıkarılabilir mi?

Bu sorular, büyük dil modeli unlearning’inin yalnızca teknik değil, güvenlik ve değerlendirme problemi olduğunu gösterir. Bir modelin belirli bir soruya cevap vermemesi, o bilgiyi gerçekten unuttuğu anlamına gelmeyebilir. Model yalnızca güvenlik politikası gereği cevap vermiyor olabilir. Daha karmaşık istemlerle, dolaylı sorularla veya çok adımlı çıkarımlarla bilgi hâlâ üretilebilir.

Büyük dil modellerinde unlearning ayrıca “koruma kalitesi” sorunuyla karşılaşır. Model istenmeyen bilgiyi unutmaya çalışırken genel dil yeteneğini, akıl yürütme kapasitesini, yararlı bilgileri veya komşu konulardaki performansını kaybedebilir. Buna overforgetting, yani aşırı unutma denebilir. İyi bir unlearning yöntemi, silinmesi gereken bilgiyi azaltırken modelin geri kalan becerilerini mümkün olduğunca korumalıdır.

Machine Unlearning Nasıl Değerlendirilir?

Machine unlearning’in en zor taraflarından biri, işlemin başarılı olup olmadığını ölçmektir. Çünkü “unutma” doğrudan gözlenebilen basit bir durum değildir. Modelin neyi ne kadar bildiğini, hangi veriden nasıl etkilendiğini ve unlearning sonrası bu etkinin ne kadar azaldığını ölçmek gerekir.

Forget Quality

Forget quality, modelin silinmesi istenen veriyle ilişkili davranışları ne kadar azalttığını gösterir. Model artık belirli kayıtları tanıyor mu? Belirli metinleri üretiyor mu? Silinen veriyle ilişkili örüntülere hâlâ aşırı güveniyor mu? Bu sorular forget quality değerlendirmesinin parçasıdır.

Retain Quality

Retain quality, modelin unutma işleminden sonra geri kalan bilgileri ne kadar koruduğunu gösterir. İyi bir unlearning yöntemi, yalnızca hedef veriyi unutmalı; modelin genel performansını gereksiz yere bozmamalıdır. Eğer model hedef veriyi unuturken geniş bir bilgi alanını da kaybediyorsa, yöntem başarılı sayılmaz.

Yeniden Eğitimle Karşılaştırma

Altın standart yaklaşım, unlearning sonrası modeli, hedef veri hiç kullanılmadan baştan eğitilmiş modelle karşılaştırmaktır. Eğer iki model benzer davranıyorsa, unlearning başarılı kabul edilebilir. Ancak büyük modellerde bu karşılaştırma pahalı olduğu için çoğu zaman uygulanamaz.

Üyelik Çıkarımı Testleri

Üyelik çıkarımı saldırıları, belirli bir verinin modelin eğitim setinde olup olmadığını anlamaya çalışır. Başarılı unlearning sonrası, silinen verinin modelde hâlâ üyelik izi bırakmaması beklenir. Bu testler mahremiyet açısından önemlidir.

Veri Çıkarma Testleri

Özellikle dil modellerinde, modelin silinmesi istenen metni veya kişisel veriyi çıktı olarak üretip üretmediği test edilebilir. Ancak bu testlerin kapsamlı olması gerekir; çünkü model doğrudan sorulduğunda üretmediği bilgiyi dolaylı sorularla üretebilir.

Davranışsal Testler

Modelin belirli bilgi alanlarında nasıl yanıt verdiği, hangi sorulara ne tür cevaplar ürettiği ve unlearning sonrası davranışının değişip değişmediği incelenir. Bu özellikle büyük dil modellerinde yaygın bir değerlendirme biçimidir.

Denetim ve Belgelendirme

Gerçek dünyada teknik testler kadar süreç kayıtları da önemlidir. Hangi veri unutuldu? Talep kimden geldi? Kimlik doğrulandı mı? Hangi model sürümünde işlem yapıldı? Hangi testler uygulandı? Sonuçlar nasıl belgelendi? Bunlar unlearning’in yönetim boyutudur.

Machine Unlearning’in Sınırları ve Riskleri

Tam Unutma Her Zaman Mümkün Olmayabilir

Büyük ve karmaşık modellerde belirli bir verinin etkisini tamamen kaldırmak çok zor olabilir. Veri, modelin birçok parametresine dağılmış olabilir. Ayrıca benzer bilgiler başka kaynaklardan da öğrenilmiş olabilir. Bu durumda belirli bir kaynağın etkisini ayırmak güçleşir.

Çıktı Engelleme Unlearning ile Karıştırılabilir

Bir modelin belirli cevapları vermemesi, o bilgiyi unuttuğu anlamına gelmez. Modelin üzerine güvenlik filtresi eklenmiş olabilir. Bu pratikte yararlı olabilir; fakat modelin içindeki bilgi hâlâ çıkarılabilir durumda olabilir.

Aşırı Unutma Performansı Bozabilir

Model hedef veriyi unutmaya çalışırken komşu bilgileri de kaybedebilir. Örneğin bir kişinin özel verisini unutturmak istenirken, o kişiyle ilgisi olmayan genel bilgiler de etkilenebilir. Büyük dil modellerinde bu sorun daha belirgindir.

Unlearning Saldırıya Açık Olabilir

Kötü niyetli aktörler, unlearning taleplerini sistemi zayıflatmak için kullanabilir. Örneğin çok sayıda silme talebiyle model performansı düşürülebilir. Veri zehirleme saldırılarıyla unlearning süreçleri manipüle edilebilir. Bu nedenle talep doğrulama, kötüye kullanım önleme ve denetim önemlidir.

Hukuki Uyum Teknik Garantiden Daha Geniştir

Bir modelden veri etkisini azaltmak, hukuki olarak tüm silme yükümlülüklerini yerine getirmek anlamına gelmeyebilir. Ham veriler, yedekler, log kayıtları, türetilmiş veri setleri, vektör veritabanları, önbellekler ve üçüncü taraf sistemler de dikkate alınmalıdır.

Doğrulama Zordur

Bir şirket “modelden verinizi sildik” dediğinde, dışarıdan bunun gerçekten yapılıp yapılmadığını doğrulamak zor olabilir. Machine unlearning’in güvenilir olması için bağımsız denetim, teknik sertifikalar ve şeffaf raporlama gereklidir.

Bilgi Kaynağı Ayrıştırılamayabilir

Büyük modeller aynı bilgiyi birçok kaynaktan öğrenebilir. Bir kullanıcının verisi silinse bile model benzer bilgiyi başka kaynaklardan üretmeye devam edebilir. Bu durumda unlearning talebinin kapsamı ve sonucu dikkatle tanımlanmalıdır.

Machine Unlearning ve Unutulma Hakkı

Machine unlearning, sıklıkla unutulma hakkı ile birlikte tartışılır. Unutulma hakkı, bireylerin belirli koşullarda kişisel verilerinin silinmesini talep edebilmesini ifade eder. Yapay zekâ çağında bu hak, yeni bir teknik sorunla karşılaşır: Kişisel veri yalnızca veri tabanında değil, modelin öğrenilmiş davranışında da iz bırakmış olabilir.

Bu nedenle machine unlearning, unutulma hakkının teknik altyapılarından biri olarak görülür. Ancak tek başına yeterli değildir. Bir kişinin verisi eğitim setinden çıkarılsa bile modelin o kişiye dair bilgi üretip üretmediği, bu bilginin başka kaynaklardan gelip gelmediği, modelin hangi sürümünde işlem yapıldığı ve silme işleminin nasıl kanıtlandığı ayrıca değerlendirilmelidir.

Unutulma hakkı hukuki bir haktır; machine unlearning ise bu hakkın bazı yönlerini destekleyebilecek teknik bir araçtır. İkisi aynı şey değildir. Hukuk, yalnızca model parametrelerine değil, veri işleme amacı, rıza, meşru menfaat, veri minimizasyonu, saklama süresi, erişim hakkı, yedekleme politikaları ve hesap verebilirlik gibi daha geniş bir çerçeveye bakar.

Bu yüzden en doğru yaklaşım şudur: Machine unlearning, veri koruma hukukunun yerine geçmez; fakat veri koruma hukukunun yapay zekâ sistemlerinde uygulanabilmesi için önemli bir teknik bileşen olabilir.

Machine Unlearning ve RAG Sistemleri

Machine unlearning tartışmalarında önemli bir ayrım da model ağırlıkları ile dış bilgi kaynakları arasındadır. Modern yapay zekâ sistemleri çoğu zaman yalnızca modelden ibaret değildir. Bir sistem, büyük dil modelini harici belge veritabanları, arama dizinleri, vektör veritabanları ve retrieval-augmented generation sistemleriyle birlikte kullanabilir.

RAG, yani retrieval-augmented generation, modelin cevap üretirken harici belgelerden bilgi çekmesini sağlar. Böyle bir sistemde bir belgenin silinmesi, klasik machine unlearning’den farklı olabilir. Eğer bilgi model ağırlıklarında değil de harici vektör veritabanında duruyorsa, belgeyi dizinden kaldırmak etkili olabilir. Fakat model aynı bilgiyi eğitim sırasında zaten öğrenmişse, yalnızca RAG kaynağını silmek yeterli olmayabilir.

Bu ayrım pratikte çok önemlidir. Bir şirket “veriyi sildik” dediğinde, hangi katmandan sildiğini belirtmelidir:

Ham veri setinden mi?
Eğitim verisi arşivinden mi?
Vektör veritabanından mı?
Önbellekten mi?
Log kayıtlarından mı?
Model ağırlıklarından mı?
İnce ayar veri setinden mi?
Güvenlik filtresi kurallarından mı?

Machine unlearning özellikle model ağırlıkları ve öğrenilmiş davranışla ilgilidir. Ancak gerçek dünyadaki yapay zekâ sistemlerinde unutma, tüm bu katmanların birlikte yönetilmesini gerektirir.

Machine Unlearning Hakkında Yanlış Anlaşılmalar

Yanlış Anlama 1: Veri Silinirse Model de Unutur

Hayır. Eğitim verisini silmek, modelin o veriden öğrendiği örüntüleri otomatik olarak ortadan kaldırmaz. Model parametreleri ayrıca ele alınmalıdır.

Yanlış Anlama 2: Unlearning Her Zaman Tam ve Kesindir

Hayır. Birçok unlearning yöntemi yaklaşık çalışır. Silinen verinin etkisini azaltabilir, fakat her durumda matematiksel olarak tam unutma garantisi vermez.

Yanlış Anlama 3: Model Cevap Vermiyorsa Unutmuştur

Hayır. Modelin belirli bir soruya cevap vermemesi, bilginin modelden çıktığı anlamına gelmez. Cevap güvenlik filtresiyle engellenmiş olabilir veya farklı istemlerle bilgi hâlâ üretilebilir.

Yanlış Anlama 4: Machine Unlearning Yalnızca Gizlilik İçindir

Gizlilik önemli bir kullanım alanıdır; fakat machine unlearning telif, model güvenliği, zararlı bilgi azaltma, hatalı veri düzeltme, önyargı azaltma ve veri yönetişimi için de kullanılır.

Yanlış Anlama 5: Büyük Dil Modellerinde Unlearning Kolaydır

Hayır. Büyük dil modellerinde bilgi dağıtık, örtük ve bağlamsaldır. Bir bilgiyi silerken komşu bilgileri korumak, unlearning’in en zor problemlerinden biridir.

Machine Unlearning’in Geleceği

Machine unlearning önümüzdeki yıllarda yapay zekâ yönetişiminin temel konularından biri olacaktır. Çünkü yapay zekâ sistemleri büyüdükçe, eğitim verilerinin tamamını kusursuz biçimde kontrol etmek zorlaşacaktır. Hatalı veri, hukuka aykırı veri, telifli içerik, zararlı bilgi ve kişisel veri sorunları daha görünür hâle gelecektir.

Gelecekte yapay zekâ modelleri yalnızca öğrenme kapasitesine göre değil, unutma kapasitesine göre de değerlendirilebilir. Bir model ne kadar iyi öğreniyor? Yeni bilgilere ne kadar hızlı uyum sağlıyor? Hatalı bilgiyi ne kadar güvenilir biçimde kaldırabiliyor? Kullanıcı taleplerine nasıl cevap veriyor? Unlearning sürecini nasıl belgeliyor? Bu sorular giderek daha önemli olacaktır.

Ayrıca model mimarileri baştan unlearning’e uygun tasarlanabilir. Veri izleme sistemleri, model sürümleme, eğitim veri soy ağacı, içerik kökeni kayıtları, sertifikalı silme mekanizmaları ve bağımsız denetim araçları machine unlearning ekosisteminin parçaları hâline gelebilir.

Ancak bu alanda aşırı iyimserlikten kaçınmak gerekir. Machine unlearning, yapay zekâ sistemlerini sihirli biçimde temizleyen bir düğme değildir. Daha çok maliyet, güvenlik, mahremiyet, performans ve doğrulama arasında denge kurmaya çalışan bir araştırma ve mühendislik alanıdır.

Sonuç

Machine unlearning, yapay zekâ çağının en önemli ama en zor problemlerinden biridir. Çünkü modern modeller yalnızca öğrenmekle kalmaz; bazen silinmesi, düzeltilmesi veya etkisizleştirilmesi gereken bilgileri de öğrenir. Kişisel veriler, telifli içerikler, hatalı kayıtlar, zararlı bilgi alanları ve önyargılı örüntüler model davranışının parçası hâline gelebilir.

Bu nedenle yapay zekâ sistemlerinin geleceği yalnızca daha iyi öğrenme kapasitesine değil, daha iyi unutma kapasitesine de bağlıdır. Bir modelin güvenilir olması, yalnızca yüksek doğruluk oranına sahip olması demek değildir. Hatalı veya istenmeyen bilgiyi nasıl yönettiği, silme taleplerine nasıl cevap verdiği, bu süreçleri nasıl belgelediği ve unutmayı nasıl doğruladığı da güvenilirliğin parçasıdır.

Machine unlearning, bu ihtiyaca verilen teknik cevaptır. Ancak basit bir çözüm değildir. Veri silmek modelin unutması anlamına gelmez. Çıktı filtrelemek gerçek unlearning olmayabilir. Yaklaşık unutma her durumda hukuki veya etik olarak yeterli sayılmayabilir. Büyük dil modellerinde bir bilginin gerçekten unutulup unutulmadığını ölçmek hâlâ açık bir araştırma problemidir.

Bu yüzden machine unlearning’i sihirli bir “sil” düğmesi olarak değil, yapay zekâ yönetişiminin temel bileşenlerinden biri olarak görmek gerekir. Veri minimizasyonu, eğitim verisi izlenebilirliği, açık denetim, güvenlik testleri, model sürümleme, sertifikalı kaldırma ve hukuki uyum süreçleriyle birlikte çalıştığında anlam kazanır.

Sonuç olarak machine unlearning, yapay zekâya şu soruyu yöneltir: Öğrenmek yeterli mi, yoksa gerektiğinde unutabilmek de zekânın ve sorumluluğun bir parçası mı? Yapay zekâ sistemleri toplumsal hayatta daha fazla karar verdikçe, bu soru yalnızca teknik bir araştırma konusu olmaktan çıkacak; mahremiyet, hukuk, etik, güvenlik ve demokrasi açısından temel bir mesele hâline gelecektir.

Kaynakça

Bourtoule, L., Chandrasekaran, V., Choquette-Choo, C. A., Jia, H., Travers, A., Zhang, B., Lie, D., & Papernot, N. (2021). Machine unlearning. Proceedings of the 2021 IEEE Symposium on Security and Privacy, 141-159.
Cao, Y., & Yang, J. (2015). Towards making systems forget with machine unlearning. Proceedings of the 2015 IEEE Symposium on Security and Privacy, 463-480.
European Data Protection Supervisor. (2025). Machine unlearning. European Data Protection Supervisor.
Ginart, A., Guan, M., Valiant, G., & Zou, J. Y. (2019). Making AI forget you: Data deletion in machine learning. Advances in Neural Information Processing Systems, 32.
Guo, C., Goldstein, T., Hannun, A., & van der Maaten, L. (2020). Certified data removal from machine learning models. Proceedings of the 37th International Conference on Machine Learning, 3832-3842.
Hine, E., Floridi, L., & Strait, A. (2024). Supporting trustworthy AI through machine unlearning. AI and Ethics.
Juliussen, B. A., & others. (2023). Algorithms that forget: Machine unlearning and the right to erasure. Computer Law & Security Review, 49, 105805.
Nguyen, T. T., Huynh, T. T., Nguyen, P. L., Liew, A. W. C., Yin, H., & Nguyen, Q. V. H. (2022). A survey of machine unlearning. arXiv.
NeurIPS Machine Unlearning Challenge Organizers. (2023). NeurIPS 2023 Machine Unlearning Challenge.
Thudi, A., Deza, G., Chandrasekaran, V., & Papernot, N. (2022). Unrolling SGD: Understanding factors influencing machine unlearning. Proceedings of the 2022 IEEE European Symposium on Security and Privacy.
Xu, H., Zhu, T., Zhang, L., Zhou, W., & Yu, P. S. (2023). Machine unlearning: A survey. ACM Computing Surveys.

İlave Okuma Önerileri

Bourtoule, L., Chandrasekaran, V., Choquette-Choo, C. A., Jia, H., Travers, A., Zhang, B., Lie, D., & Papernot, N. (2021). Machine unlearning. IEEE Symposium on Security and Privacy.
Carlini, N., Tramèr, F., Wallace, E., Jagielski, M., Herbert-Voss, A., Lee, K., Roberts, A., Brown, T., Song, D., Erlingsson, Ú., Oprea, A., & Raffel, C. (2021). Extracting training data from large language models. 30th USENIX Security Symposium.
European Data Protection Board. (2025). Effective implementation of data subjects’ rights in artificial intelligence systems. European Data Protection Board.
Golatkar, A., Achille, A., & Soatto, S. (2020). Eternal sunshine of the spotless net: Selective forgetting in deep networks. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.
Graves, L., Nagisetty, V., & Ganesh, V. (2021). Amnesiac machine learning. Proceedings of the AAAI Conference on Artificial Intelligence.
Kurmanji, M., Triantafillou, P., Hayes, J., & Triantafillou, E. (2023). Towards unbounded machine unlearning. Advances in Neural Information Processing Systems.
Liu, H., & others. (2025). A survey on machine unlearning: Techniques and new vulnerabilities. Machine Learning with Applications.
Nguyen, T. T., Huynh, T. T., Nguyen, P. L., Liew, A. W. C., Yin, H., & Nguyen, Q. V. H. (2022). A survey of machine unlearning. arXiv.
Thudi, A., Jia, H., Shumailov, I., & Papernot, N. (2022). On the necessity of auditable algorithmic definitions for machine unlearning. 31st USENIX Security Symposium.
Xu, Y. (2024). Machine unlearning for traditional models and large language models: A short survey. arXiv.

🗓️ Yayınlanma Tarihi: 22 Mayıs 2026
🔄 Son Güncelleme Tarihi: 22 Mayıs 2026
🎯 Kimler için: Bu yazı, machine unlearning, yapay zekâ güvenliği, veri mahremiyeti, unutulma hakkı, büyük dil modelleri, veri yönetişimi, model denetimi, telif sorunları ve yapay zekâ etiğiyle ilgilenen okurlar için hazırlanmıştır. Ayrıca yapay zekâ geliştiricileri, veri bilimciler, hukukçular, akademisyenler, gazeteciler, politika analistleri, ürün yöneticileri, bilgi güvenliği uzmanları ve yapay zekâ sistemlerinin nasıl denetlenebileceğini anlamak isteyen herkes için temel bir başvuru metni olarak tasarlanmıştır.

İçerik Bilgisi

Bu içerik yaklaşık 5779 kelimeden ve 36864 karakterden oluşmaktadır. Ortalama okuma süresi: 19 dakikadır. Invictus Wiki editoryal ilkelerine uygun olarak hazırlanmış; güvenilir ve doğrulanabilir kaynaklar temel alınarak yayımlanmıştır. Bilgi güncelliği düzenli olarak gözden geçirilir.

Invictus Wiki editoryal ekibini temsil eden kolektif bir yazarlık imzasıdır. IW imzasıyla yayımlanan içerikler; çok kaynaklı araştırma, editoryal inceleme ve tarafsızlık ilkeleri doğrultusunda hazırlanır.

Bu Yazıyı Paylaşmak İster Misin?