Back to Research
AI Security

KVKK ve GDPR Kapsamında RAG Modelleri: Yapay Zekada Veri Mahremiyeti Çıkmazı

Eresus Security TeamSecurity Researcher
April 14, 2026
3 min read

KVKK ve GDPR Çıkmazı: RAG Modellerinde Veri İhlali ve Mahremiyet

Global şirketler, operasyonel hızlarını katlamak için iç veritabanlarını ve arşivlerini (Müşteri kayıtları, e-postalar, fatura dokümanları) devasa Vektör Veritabanlarına aktararak RAG (Retrieval-Augmented Generation) altyapıları kurmaktadır. Bu sayede şirket içi bir yapay zeka asistanı, milyonlarca belgeyi okuyup çalışanlara anında yanıt verebilir.

Büyük veri ile beslenen bu "Kurumsal GPT" devrimi, veri mühendisleri için bir rüya olsa da Uyum (Compliance) ve Hukuk departmanları için tam bir kabustur. RAG süreçlerine dışarıdan bir siber saldırı yapılmasa bile, sistemin kendi mimarisi KVKK (Kişisel Verilerin Korunması Kanunu) ve GDPR (Genel Veri Koruma Yönetmeliği) yasalarını temelden ihlal etmeye çok yatkındır.


1. RAG Sistemleri KVKK'yı Neden "Yanlışlıkla" İhlal Eder?

Geleneksel veri koruma kuralları (örn. bir kullanıcının bilgilerini veri tabanından kalıcı olarak silmek) statik tablolar (SQL) için tasarlanmıştır. Ancak makine öğrenimi modelleri bu şekilde işlemez. RAG altyapıları verileri bir anlam uzayında "vektör" (sayılar) olarak tutar.

A. Rızasız Veri İfşası (Inference Exposure)

Bir çağrı merkezi çalışanının RAG destekli iç asistana "Geçen ay Kadıköy şubesinde kaza yapan VIP müşterimizin yasal durumu nedir?" diye sorduğunu düşünün. Asistan, "Kadıköy", "Kaza", "VIP" kelimelerinin vektörel karşılıklarını veritabanında arar. Birkaç saniye içinde kaza belgesini, kişisel sağlık kayıtlarını (Özel Nitelikli Kişisel Veri - ÖNKV) ve kişinin kimlik numarasını sentezleyip çalışanın ekranına basar.

Çalışan normal şartlarda CRM sisteminde bu kişinin şahsi kimlik verilerini görmeye yetkili değildir (RBAC kısıtlaması nedeniyle). Ancak RAG sistemi çalışanın niyetini salt veritabanı sorgusu olarak ele alır, veriyi harmanlar ve doğrudan okur. Bu durum yasal bir Yetkisiz Erişim ve İfşa vakasıdır.

B. "Unutulma Hakkı"nın Yapay Zekadaki İmkansızlığı

KVKK ve GDPR'ın en sarsılmaz prensibi Unutulma Hakkı (Right to be Forgotten) ilkesidir. Bir müşteri kurumunuza başvurup "Tüm verilerimi silin" dediğinde, bu verileri SQL tablosundan tek bir DELETE komutuyla yok edebilirsiniz. Ancak müşteri bilgileri Vektör Veritabanlarına (Chroma, Pinecone vb.) aktarılıp "İstatistiksel Ağırlıklara" (Embeddings) dönüştürüldüğünde işler değişir. Vektör db'den bir müşterinin ismini bulup tamamen ayıklamak teknik olarak olağanüstü zordur. Sistem "Tamamen unuttuk" sanıp onay verse de, modelin ağırlıklarında kalan tortular sayesinde, gelişmiş bir prompt mühendisliğiyle bu veriler tekrar yüzeye çıkarılabilir.


2. RAG Uyumsuzluğunun Kuruma Maliyeti Nedir?

Veri Mahremiyeti kurulları (KVKK, GDPR, CCPA) yapay zekaya karşı son derece acımasız davranmaya başlamıştır. İtalya'nın ve İspanya'nın geçici olarak OpenAI ürünlerine ülkede yasak getirmesinin temel sebebi, kişisel verilerin modelin hafızasından sökülüp atılamamasıydı.

Kurum içi RAG sisteminiz gizli şahıs verilerini, verinin işlenme amacına aykırı şekilde veya orantısızca bir asistan ekranına bastığında, doğrudan Global Ciro üzerinden %4'e varan astronomik GDPR cezalarına çarptırılabilirsiniz. Üstelik bir ihlal meydana geldiğinde, "Yapay zeka yaptı, kontrolümüz dışındaydı" (Blackbox) bahanesi hukuki süreçlerde bir affedilme sebebi değil, "Tasarımda Gizlilik İhlali" (Privacy by Design ihlali) olarak kasten ağırlaştırıcı sebep (Aggravated circumstances) sayılmaktadır.


3. Kurumsal Çözüm: Privacy by Design Mimarisi

Bir RAG altyapısının yasalara (Compliance) uygun olmasını istiyorsanız sistemi en başından "Tasarımda Mahremiyet" ilkesiyle inşa etmelisiniz:

  1. Katı Veri Maskeleme (Anonymization & Redaction Pİpeline): Müşteri verileri Vektör Veritabanına sokulmadan önce (Embedding aşamasında) araya güçlü bir PII (Kişisel Tanımlanabilir Bilgi) tarayıcısı konmalıdır. Telefon numaraları, TC kimlik numaraları, e-postalar veri tabanına yazılmadan önce [GİZLİ_TEL_NO] tarzı token'larla maskelenmelidir.
  2. Kişiselleştirilmiş İzin Filtreleri (Metadata Filtreleme): Vektör araması yapılırken, asistan sorguyu yapan çalışanın kurum içi yetki token'larını kontrol etmeli; ve sadece çalışanın yetki seviyesiyle (örn. clearance_level: 2) eşleşen vektör verilerini okumalarına izin verilmelidir.
  3. Kapsamlı Dış Denetim (AI Audit): Şirket RAG mimarisini canlıya (Production) almadan önce, yasal zafiyetleri tespit edebilen ve AI asistanların ağzından verileri zorla sızdırmayı deneyen (Data Exfiltration Red Teaming) bir yapı ile test edilmelidir.

Sonuç

Veri yeni çağın petrolüdür ancak yapay zeka tarafından işlenirken sızan veriler, şirketinizi yok edebilecek zehirli bir atıktır. RAG altyapılarınızda fonksiyonelliği hedeflerken, GDPR/KVKK uyum mimarisini Eresus Security gibi uzmanlarla şansa bırakmadan projelendirmelisiniz.