Prompt güvenliğini cevap filtresiyle değil, etki kanıtıyla test edin.
Eresus; kullanıcı mesajı, e-posta, doküman, web sayfası, RAG kaynağı ve MCP araç açıklaması gibi güvenilmeyen girdilerin LLM davranışını nasıl bozduğunu ölçer.
Bu program en çok aşağıdaki ekiplerde hızla değer üretir.
Yapay zeka ürün ve platform ekipleri
LLM, RAG, MCP, ajan veya model kabul akışlarını iç ya da müşteri yüzüne taşıyan ekipler.
Yapay zeka alanına genişleyen güvenlik ekipleri
Sızma testi programı çalıştırıp şimdi koruma kuralı, prompt ve araç suistimali doğrulamasına ihtiyaç duyan organizasyonlar.
Açıklanabilir sertleştirme isteyen ekipler
Politika, prompt, MCP ve çalışma zamanı bulgularını doğrudan yayın kararına çevirmek isteyen ekipler.
Kapsam
Risk sinyalleri
Teslimatlar
Girdi tehdidini iş etkisine çeviren pratik test akışı.
Problem
LLM’in hangi güvenilmeyen içerikleri okuduğunu ve hangi aksiyonlara bağlandığını çıkarırız.
Saldırı senaryosu
Görünür kullanıcı mesajı ve gizli doküman talimatlarını ayrı ayrı deneriz.
Kanıt
Başarılı atlatmayı yanıt, araç çağrısı, erişilen veri ve log izleriyle gösteririz.
Teslimat
Düzeltmeyi sistem talimatı, veri ayrımı, araç yetkisi ve onay kapısı seviyesinde tarif ederiz.
Alıcıların ilk konuşmada netleştirmek istediği başlıklar.
Hangi yapay zeka yüzeylerini test ediyorsunuz?+
Bu çalışma sadece prompt injection testi mi?+
Bulguları mühendislik aksiyonlarına çeviriyor musunuz?+
Riskleri iş etkisine bağlarız.
Bulgular sadece CVSS skoru olarak kalmaz. Hangi müşteri akışını, hangi veri sınıfını, hangi operasyonel hedefi etkilediği açıkça yazılır.
Teslimat geliştirici ve yönetici için ayrı okunur.
Teknik ekipler yeniden üretilebilir kanıt ve düzeltme yönü alır; liderlik tarafı ise risk hikayesini, önceliği ve kapanış durumunu net görür.
Bu hizmeti açıklayan araştırma ve güvenlik bültenleri.
Prompt Security Neden Yetmez?
Prompt filtreleri AI güvenliği için gereklidir ama agent, RAG ve tool kullanan sistemlerde veri, yetki ve aksiyon sınırlarını tek başına koruyamaz.
Yapay Zeka Jailbreak (LLM Sınır Aşımı) Sanatı: Kodlar Nasıl Kırılır?
Siber güvenlik uzmanları ve Red Team ekipleri Büyük Dil Modellerini (LLM) nasıl Jailbreak eder? GenAI sınırlarını aşmanın (DAN, Do Anything Now) teknik...
MCPHub skipAuth Konfigürasyonu ile Kimlik Doğrulama Atlatma
MCPHub üzerinde skipAuth etkinleştirildiğinde authentication ve admin authorization kontrolleri atlanır; kimliği doğrulanmamış kullanıcılar ayrıcalıklı API fonksiyonlarına erişebilir.
Bu kapsamı gerçek risk yüzeyinize göre birlikte netleştirelim.
Pilot, tek uygulama, kritik API, AI ajan akışı veya daha geniş program fark etmez; önce iş etkisi yüksek yüzeyden başlarız.