Могут ли AI-агенты улучшить безопасность Ethereum? OpenAI и Paradigm создали тестовую площадку
Key Takeaways
- EVMbench – новая площадка, разработанная OpenAI и Paradigm, оценивающая, насколько AI-агенты способны обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах на базе Ethereum.
- Три режима тестирования: выявление (detect), исправление (patch) и эксплуатация (exploit) уязвимостей смарт-контрактов.
- AI и безопасность: AI становится важным инструментом как для нападения, так и для защиты в системе смарт-контрактов.
- Тестирование в реальных экономических условиях: цель использования EVMbench – проверка эффективности моделей AI в условиях, приближенных к реальным сценариям, что делает его важным этапом для индустрии.
WEEX Crypto News, 2026-02-19 09:43:01
Введение в EVMbench – инновационная тестовая площадка
В динамичном мире криптовалют и технологий смарт-контрактов обеспечение безопасности занимает важнейшее место. В этом контексте появляется ключевой вопрос — могут ли агенты, работающие на основе искусственного интеллекта (AI), повысить безопасность сети Ethereum? На этот вопрос пытаются ответить OpenAI и инвестиционная компания Paradigm с помощью создания EVMbench. Это новое средство предоставляет возможность исследовать способность AI-агентов по обнаружению, исправлению и эксплуатации серьезных уязвимостей в системе смарт-контрактов Ethereum Virtual Machine (EVM).
Ethereum находится в самом сердце блокчейн-технологий, обеспечивая платформу для смарт-контрактов, которые управляют децентрализованными финансовыми протоколами и запуском токенов. С увеличением количества развертываемых контрактов (более 1.7 миллиона в неделю в ноябре 2025 года), обеспечивать их безопасность становится все более сложной задачей. В ответ на эту проблему появляется EVMbench — инструмент, призванный оценить эффективность AI в повышении уровня безопасности.
Как работает EVMbench?
Платформа EVMbench предусматривает оценку AI-агентов в трех ключевых направлениях: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти режимы позволяют AI проходить различные стадии проверки, тестируя его возможности в условиях, приближенных к реальному миру.
- Режим “Detect”: AI-агенты начинают с проверки репозиториев кода и определяют уязвимости, за что получают определенные баллы. Важно, чтобы AI как можно более полно и точно идентифицировал все проблемы, не оставляя пропущенных недостатков.
- Режим “Patch”: На этой стадии AI пробуют исправлять найденные ошибки, сохраняя при этом изначально задуманную функциональность контракта. Это критически важно, так как любое изменение может оказать значительное влияние на эффективность смарт-контракта.
- Режим “Exploit”: Здесь AI-агенты работают в среде, где симулируются атаки с целью дренажа средств. С помощью воспроизведения транзакций проверяется успешность действий AI в выявлении и использовании уязвимостей.
Представление и внедрение EVMbench
EVMbench интегрирует 120 специально отобранных уязвимостей из 40 аудитов, большая часть которых происходит из открытых конкурсов, таких как Code4rena. Эти уязвимости помогают AI моделям учиться через фиксированные сценарии и реальный опыт, собранный в блокчейн-индустрии. Кроме того, EVMbench учли разработки Stripe в создании банковского проекта по обработке платежей Tempo, что является еще одним шагом в развитии AI технологий.
Эффективность взаимодействия AI с платформой была подтверждена в рамках задачи “Exploit”, где GPT-5.3-Codex показал выдающийся результат с оценкой 72.2%, значительно превосходя предыдущую версию GPT-5, получившую 31.9%. Это демонстрирует, что с помощью инструментов, таких как EVMbench, возможно создание более безопасных и функциональных смарт-контрактов.
AI и безопасность: Новые вызовы и возможности
Поскольку AI становится все более влиятельным как инструмент в сфере безопасности, появляются и новые вызовы. Исследователи из OpenAI поднимают вопрос, что даже такие продвинутые инструмент, как EVMbench, не в полной мере отображают сложность реальных задач в области безопасности. Это подчёркивает важность продолжения разработки и тестирования AI-агентов в условиях, приближенных к реальности, для большей защиты против возможных угроз.
Конфликт вокруг скорости развития AI также находится в центре внимания. В январе 2025 года Сэм Альтман из OpenAI утверждал, что их компания уверена в возможности создания искусственного общего интеллекта (AGI), в то время как Виталик Бутерин, сооснователь Ethereum, подчеркивал необходимость внедрения возможностей “мягкой паузы”, чтобы приостановить индустриальные AI-операции при появлении предупреждающих сигналов.
Заключение
Таким образом, платформа EVMbench представляет собой многообещающий шаг к повышению безопасности смарт-контрактов Ethereum с помощью AI-агентов. Заслуживая внимания не только благодаря возможности обнаружения уязвимостей, но и через технологическую возможность их исправления и использования, EVMbench прокладывает путь к будущему безопасных и доверенных цифровых транзакций.
FAQ
Как EVMbench влияет на безопасность Ethereum?
EVMbench представляет собой тестовую площадку, которая оценивает способность AI-агентов обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Она способствует созданию более безопасной среды для децентрализованных финансовых транзакций.
Какие этапы проверки включает EVMbench?
EVMbench тестирует AI через три ключевых этапа: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти тесты помогают обеспечить полную функциональность и безопасность смарт-контрактов.
Как была протестирована эффективность EVMbench?
Эффективность EVMbench была проверена с использованием AI модел, таких как GPT-5.3-Codex, который достиг оценки 72.2% в режиме “Exploit”, что демонстрирует значительное улучшение по сравнению с предыдущими моделями.
Какие цели ставятся перед EVMbench?
Цель EVMbench заключается в проверке эффективности AI в условиях, максимально приближенных к реальным сценариям использования. Это помогает повышать уровень безопасности и надежности цифровых активов.
Какое участие принимает WEEX в развитии EVMbench?
WEEX поддерживает разработку и внедрение технологий, таких как EVMbench, предоставляя больше возможностей для безопасных и эффективных транзакций в цифровом мире.
Вам также может понравиться

Толкование STRC в десяти тысячах слов: Стратегия заработка денег для покупки монет New Magic

Какие конкурентные преимущества все еще можно защитить в эпоху ИИ?

По ком звонит колокол, по кому кормят лобстера? Руководство по выживанию в Темном Лесу для игрока-агента 2026 года

Последнее интервью генерального директора Circle: Стейблкоины - это не криптовалюта

Деконструкция публичной цепочки игры капитала Pharos: Поддерживается ли оценка в 950 миллионов долларов, обеспеченная активами, такими как фотоэлектрические установки, просто транзакцией-оболочкой под слоями ставок?

a16z: ИИ делает всех в 10 раз более продуктивными, но истинный победитель еще не появился

На самом деле масштабирование ETH является важным преимуществом для L2

Воспоминания: 10 ключевых вкладов основной команды TON, о которых мало кто знал в первые дни

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

2025 Южная Корея Постмортем листинга CEX: Инвестирование в новые монеты = 70% убытка?

Анализ BIP-360: Первый шаг Биткойна к квантовому иммунитету, но почему только "первый шаг"?

50 миллионов USDT обменены на 35 000 долларов США в AAVE: Как произошла эта катастрофа? Кого в этом винить?

Диалог Виталика в Чианг-Май: Взрыв искусственного интеллекта: за что должен бороться крипто-мир?

ZachXBT раскрывает скандал с инсайдерской информацией в Axiom: как внутренние сотрудники злоупотребляют своими привилегиями?

2026 год, как мы должны разумно оценить рыночную стоимость L1?

AWS финансового мира: Почему она становится крупнейшим победителем в эпоху ИИ + стейблкоинов

Учреждения принимают криптовалюту, но практикующие специалисты испытывают необычную фрустрацию. Кто в конечном итоге победит?
