EresusSecurity
LLM Red Teaming

LLM ürünlerini gerçek saldırı senaryolarıyla zorlayın.

Eresus; chatbot, RAG, copilot, ajan ve üretim API’sine bağlı LLM akışlarında prompt injection, jailbreak, hassas veri sızıntısı, araç suistimali ve politika atlatma risklerini kanıtla doğrular.

Kimin için uygun

Bu program en çok aşağıdaki ekiplerde hızla değer üretir.

Yapay zeka ürün ve platform ekipleri

LLM, RAG, MCP, ajan veya model kabul akışlarını iç ya da müşteri yüzüne taşıyan ekipler.

Yapay zeka alanına genişleyen güvenlik ekipleri

Sızma testi programı çalıştırıp şimdi koruma kuralı, prompt ve araç suistimali doğrulamasına ihtiyaç duyan organizasyonlar.

Açıklanabilir sertleştirme isteyen ekipler

Politika, prompt, MCP ve çalışma zamanı bulgularını doğrudan yayın kararına çevirmek isteyen ekipler.

Kapsam

Doğrudan ve dolaylı prompt injection
Jailbreak ve politika atlatma denemeleri
RAG veri sızıntısı ve bağlam zehirlenmesi
Tool call, MCP ve ajan aksiyon sınırları

Risk sinyalleri

Hassas müşteri verisinin yanıt veya araç çıktısında açığa çıkması
Ajanın yetkisiz API aksiyonu alması
Sistem talimatlarının kullanıcı içeriğiyle ezilmesi
RAG kaynağı üzerinden kalıcı davranış bozulması

Teslimatlar

Saldırı senaryosu matrisi
Yeniden üretilebilir prompt ve yanıt kanıtları
OWASP LLM risk eşlemesi
Koruma kuralı ve yeniden test önerileri
Çalışma akışı

Problemden yayın kararına giden net red team akışı.

01

Problem

LLM’in hangi veri, araç, müşteri akışı ve karar sınırına dokunduğunu belirleriz.

02

Saldırı senaryosu

Prompt injection, RAG zehirlenmesi, jailbreak ve tool abuse denemelerini gerçek kullanım bağlamına göre tasarlarız.

03

Kanıt

Her başarılı senaryoyu istem, yanıt, araç çağrısı, log ve yeniden üretim adımıyla kanıtlarız.

04

Teslimat

Bulguları öncelik, OWASP LLM eşlemesi, düzeltme yönü ve yeniden test komutuyla teslim ederiz.

Sık sorulanlar

Alıcıların ilk konuşmada netleştirmek istediği başlıklar.

Hangi yapay zeka yüzeylerini test ediyorsunuz?+
Prompt, ajan, RAG akışı, MCP sunucuları, araç yürütme, model kabul süreci ve politika sınırlarını gerçek kullanıcı akışları üzerinde test ederiz.
Bu çalışma sadece prompt injection testi mi?+
Hayır. Prompt injection sadece bir katman. Kimlik, araç izinleri, veri sızıntısı, model dosyaları ve zincirlenen sistem suistimallerini de doğrularız.
Bulguları mühendislik aksiyonlarına çeviriyor musunuz?+
Evet. Her bulguyu koruma kuralı değişimi, prompt iyileştirmesi, kimlik sınırı, araç kapsamı veya yayına alma kararıyla eşleriz.

Riskleri iş etkisine bağlarız.

Bulgular sadece CVSS skoru olarak kalmaz. Hangi müşteri akışını, hangi veri sınıfını, hangi operasyonel hedefi etkilediği açıkça yazılır.

Teslimat geliştirici ve yönetici için ayrı okunur.

Teknik ekipler yeniden üretilebilir kanıt ve düzeltme yönü alır; liderlik tarafı ise risk hikayesini, önceliği ve kapanış durumunu net görür.

Sonraki adım

Bu kapsamı gerçek risk yüzeyinize göre birlikte netleştirelim.

Pilot, tek uygulama, kritik API, AI ajan akışı veya daha geniş program fark etmez; önce iş etkisi yüksek yüzeyden başlarız.