← Все новости
Агенты удаляют файлы, сливают данные и сами себя взламывают: как устроена безопасность ИИ‑систем в 2026 году

Агенты удаляют файлы, сливают данные и сами себя взламывают: как устроена безопасность ИИ‑систем в 2026 году

Привет, Хабр! Тема искусственного интеллекта за последние несколько лет набили, честно говоря, оскомину. Есть как защитники, так и противники технологий, которых принято называть ИИ. Везде начали приделывать ИИ‑помощников. Встраивать нейросети в разные приложения. И раз уж не избежать искусственного интеллекта в повседневной жизни. Я решил поговорить про атаки на языковые модели. Потому что такие кибератаки перестали быть экзотикой, а защита ИИ стала отдельная дисциплина с собственной таксономией, инструментарием и, к сожалению, реальными инцидентами.Я решил поговорил с автором Telegram‑канала PWN AI, посвящённого небезопасному применению ИИ, Артёмом Семёновым. С Артёмом уже был разговор тут на Хабре об ИБ и ИИ. Но я решил обновить данные. Артём рассказал, как расширилась поверхность атаки с появлением агентов и MCP‑протоколов, почему системный промпт — не граница безопасности, какие атаки модели до сих пор не умеют отбивать и чем принципиально отличается прямой prompt injection от косвенного. Приятного чтения! Читать далее