Могут ли AI-агенты улучшить безопасность Ethereum? OpenAI и Paradigm создали тестовую площадку
Key Takeaways
- EVMbench – новая площадка, разработанная OpenAI и Paradigm, оценивающая, насколько AI-агенты способны обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах на базе Ethereum.
- Три режима тестирования: выявление (detect), исправление (patch) и эксплуатация (exploit) уязвимостей смарт-контрактов.
- AI и безопасность: AI становится важным инструментом как для нападения, так и для защиты в системе смарт-контрактов.
- Тестирование в реальных экономических условиях: цель использования EVMbench – проверка эффективности моделей AI в условиях, приближенных к реальным сценариям, что делает его важным этапом для индустрии.
WEEX Crypto News, 2026-02-19 09:43:01
Введение в EVMbench – инновационная тестовая площадка
В динамичном мире криптовалют и технологий смарт-контрактов обеспечение безопасности занимает важнейшее место. В этом контексте появляется ключевой вопрос — могут ли агенты, работающие на основе искусственного интеллекта (AI), повысить безопасность сети Ethereum? На этот вопрос пытаются ответить OpenAI и инвестиционная компания Paradigm с помощью создания EVMbench. Это новое средство предоставляет возможность исследовать способность AI-агентов по обнаружению, исправлению и эксплуатации серьезных уязвимостей в системе смарт-контрактов Ethereum Virtual Machine (EVM).
Ethereum находится в самом сердце блокчейн-технологий, обеспечивая платформу для смарт-контрактов, которые управляют децентрализованными финансовыми протоколами и запуском токенов. С увеличением количества развертываемых контрактов (более 1.7 миллиона в неделю в ноябре 2025 года), обеспечивать их безопасность становится все более сложной задачей. В ответ на эту проблему появляется EVMbench — инструмент, призванный оценить эффективность AI в повышении уровня безопасности.
Как работает EVMbench?
Платформа EVMbench предусматривает оценку AI-агентов в трех ключевых направлениях: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти режимы позволяют AI проходить различные стадии проверки, тестируя его возможности в условиях, приближенных к реальному миру.
- Режим “Detect”: AI-агенты начинают с проверки репозиториев кода и определяют уязвимости, за что получают определенные баллы. Важно, чтобы AI как можно более полно и точно идентифицировал все проблемы, не оставляя пропущенных недостатков.
- Режим “Patch”: На этой стадии AI пробуют исправлять найденные ошибки, сохраняя при этом изначально задуманную функциональность контракта. Это критически важно, так как любое изменение может оказать значительное влияние на эффективность смарт-контракта.
- Режим “Exploit”: Здесь AI-агенты работают в среде, где симулируются атаки с целью дренажа средств. С помощью воспроизведения транзакций проверяется успешность действий AI в выявлении и использовании уязвимостей.
Представление и внедрение EVMbench
EVMbench интегрирует 120 специально отобранных уязвимостей из 40 аудитов, большая часть которых происходит из открытых конкурсов, таких как Code4rena. Эти уязвимости помогают AI моделям учиться через фиксированные сценарии и реальный опыт, собранный в блокчейн-индустрии. Кроме того, EVMbench учли разработки Stripe в создании банковского проекта по обработке платежей Tempo, что является еще одним шагом в развитии AI технологий.
Эффективность взаимодействия AI с платформой была подтверждена в рамках задачи “Exploit”, где GPT-5.3-Codex показал выдающийся результат с оценкой 72.2%, значительно превосходя предыдущую версию GPT-5, получившую 31.9%. Это демонстрирует, что с помощью инструментов, таких как EVMbench, возможно создание более безопасных и функциональных смарт-контрактов.
AI и безопасность: Новые вызовы и возможности
Поскольку AI становится все более влиятельным как инструмент в сфере безопасности, появляются и новые вызовы. Исследователи из OpenAI поднимают вопрос, что даже такие продвинутые инструмент, как EVMbench, не в полной мере отображают сложность реальных задач в области безопасности. Это подчёркивает важность продолжения разработки и тестирования AI-агентов в условиях, приближенных к реальности, для большей защиты против возможных угроз.
Конфликт вокруг скорости развития AI также находится в центре внимания. В январе 2025 года Сэм Альтман из OpenAI утверждал, что их компания уверена в возможности создания искусственного общего интеллекта (AGI), в то время как Виталик Бутерин, сооснователь Ethereum, подчеркивал необходимость внедрения возможностей “мягкой паузы”, чтобы приостановить индустриальные AI-операции при появлении предупреждающих сигналов.
Заключение
Таким образом, платформа EVMbench представляет собой многообещающий шаг к повышению безопасности смарт-контрактов Ethereum с помощью AI-агентов. Заслуживая внимания не только благодаря возможности обнаружения уязвимостей, но и через технологическую возможность их исправления и использования, EVMbench прокладывает путь к будущему безопасных и доверенных цифровых транзакций.
FAQ
Как EVMbench влияет на безопасность Ethereum?
EVMbench представляет собой тестовую площадку, которая оценивает способность AI-агентов обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Она способствует созданию более безопасной среды для децентрализованных финансовых транзакций.
Какие этапы проверки включает EVMbench?
EVMbench тестирует AI через три ключевых этапа: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти тесты помогают обеспечить полную функциональность и безопасность смарт-контрактов.
Как была протестирована эффективность EVMbench?
Эффективность EVMbench была проверена с использованием AI модел, таких как GPT-5.3-Codex, который достиг оценки 72.2% в режиме “Exploit”, что демонстрирует значительное улучшение по сравнению с предыдущими моделями.
Какие цели ставятся перед EVMbench?
Цель EVMbench заключается в проверке эффективности AI в условиях, максимально приближенных к реальным сценариям использования. Это помогает повышать уровень безопасности и надежности цифровых активов.
Какое участие принимает WEEX в развитии EVMbench?
WEEX поддерживает разработку и внедрение технологий, таких как EVMbench, предоставляя больше возможностей для безопасных и эффективных транзакций в цифровом мире.
Вам также может понравиться

Обмен 200 000 на почти 100 миллионов: стейблкоины DeFi подверглись очередной атаке

Основное бизнес-соглашение триллионной экономики агентов: Понимание ERC-8183, это не только о платежах, но и о будущем

Когда ETH на Уолл-стрит начинает "приносить доход": Рассматривая свойства актива Ethereum от BlackRock's ETHB

Сила агентства: Кошелек Agent и следующее десятилетие кошельков

Понимание x402 и MPP в одной статье: Два способа оплаты агентов

Исследовательский отчет OKX Ventures: Исследовательский отчет об экономической инфраструктуре агента (часть 1)

Криптовалютный ETF за неделю | На прошлой неделе чистый приток для Bitcoin ETF в США составил 787 миллионов долларов; чистый приток для Ethereum ETF в США составил 80,2 миллиона долларов

WLFI снова вовлечена в инсайдерские сделки? Спор о банковской лицензии при инвестициях в размере 500 миллионов долларов

Перенос прав на заселение: B18 и институциональная отправная точка для банков, работающих в блокчейне

От Tencent и Circle: Рассматривая простые и сложные вопросы инвестиций

Вторая половина стейблкоинов больше не принадлежит крипто-кругу

Спор вокруг курсора «Shell» Kimi снят: От обвинений в нарушении авторских прав до санкционированного сотрудничества: китайская модель с открытым исходным кодом снова становится глобальной основой для ИИ

Настоящая причина, по которой токены не продаются: 90% криптопроектов упускают из виду отношения с инвесторами

Доход pump.fun реальный, зарабатывает ли он миллион долларов в день, несмотря на спад на рынке?

Настоящая причина, по которой токены не продаются: 90% криптопроектов пренебрегают связями с инвесторами

Гражданская война в Aave обостряется, Morpho тихо удваивает свои позиции: Престол кредитования скоро перейдет в другие руки?

Кто является истинным победителем в нарративе "Токенизация"?
