EresusSecurity
Prompt Injection

Prompt güvenliğini cevap filtresiyle değil, etki kanıtıyla test edin.

Eresus; kullanıcı mesajı, e-posta, doküman, web sayfası, RAG kaynağı ve MCP araç açıklaması gibi güvenilmeyen girdilerin LLM davranışını nasıl bozduğunu ölçer.

Kimin için uygun

Bu program en çok aşağıdaki ekiplerde hızla değer üretir.

Yapay zeka ürün ve platform ekipleri

LLM, RAG, MCP, ajan veya model kabul akışlarını iç ya da müşteri yüzüne taşıyan ekipler.

Yapay zeka alanına genişleyen güvenlik ekipleri

Sızma testi programı çalıştırıp şimdi koruma kuralı, prompt ve araç suistimali doğrulamasına ihtiyaç duyan organizasyonlar.

Açıklanabilir sertleştirme isteyen ekipler

Politika, prompt, MCP ve çalışma zamanı bulgularını doğrudan yayın kararına çevirmek isteyen ekipler.

Kapsam

Doğrudan prompt injection testleri
Doküman, e-posta ve web içeriği üzerinden dolaylı injection
RAG ve bağlam penceresi manipülasyonu
Araç çağrısı, veri sızıntısı ve onay atlatma kontrolleri

Risk sinyalleri

Modelin sistem talimatını yok sayması
Kullanıcının görmediği içerikten talimat çalıştırılması
Hassas verinin özet veya araç çıktısına karışması
Prompt filtresi geçse bile ajan aksiyonunun risk üretmesi

Teslimatlar

Prompt injection bulgu seti
Korumaların atlatıldığı yeniden üretim adımları
Prompt, RAG ve araç sınırı düzeltmeleri
CI/CD veya yayın kapısı için test önerileri
Test modeli

Girdi tehdidini iş etkisine çeviren pratik test akışı.

01

Problem

LLM’in hangi güvenilmeyen içerikleri okuduğunu ve hangi aksiyonlara bağlandığını çıkarırız.

02

Saldırı senaryosu

Görünür kullanıcı mesajı ve gizli doküman talimatlarını ayrı ayrı deneriz.

03

Kanıt

Başarılı atlatmayı yanıt, araç çağrısı, erişilen veri ve log izleriyle gösteririz.

04

Teslimat

Düzeltmeyi sistem talimatı, veri ayrımı, araç yetkisi ve onay kapısı seviyesinde tarif ederiz.

Sık sorulanlar

Alıcıların ilk konuşmada netleştirmek istediği başlıklar.

Hangi yapay zeka yüzeylerini test ediyorsunuz?+
Prompt, ajan, RAG akışı, MCP sunucuları, araç yürütme, model kabul süreci ve politika sınırlarını gerçek kullanıcı akışları üzerinde test ederiz.
Bu çalışma sadece prompt injection testi mi?+
Hayır. Prompt injection sadece bir katman. Kimlik, araç izinleri, veri sızıntısı, model dosyaları ve zincirlenen sistem suistimallerini de doğrularız.
Bulguları mühendislik aksiyonlarına çeviriyor musunuz?+
Evet. Her bulguyu koruma kuralı değişimi, prompt iyileştirmesi, kimlik sınırı, araç kapsamı veya yayına alma kararıyla eşleriz.

Riskleri iş etkisine bağlarız.

Bulgular sadece CVSS skoru olarak kalmaz. Hangi müşteri akışını, hangi veri sınıfını, hangi operasyonel hedefi etkilediği açıkça yazılır.

Teslimat geliştirici ve yönetici için ayrı okunur.

Teknik ekipler yeniden üretilebilir kanıt ve düzeltme yönü alır; liderlik tarafı ise risk hikayesini, önceliği ve kapanış durumunu net görür.

Sonraki adım

Bu kapsamı gerçek risk yüzeyinize göre birlikte netleştirelim.

Pilot, tek uygulama, kritik API, AI ajan akışı veya daha geniş program fark etmez; önce iş etkisi yüksek yüzeyden başlarız.