¿Pueden los agentes de IA mejorar la seguridad de Ethereum? OpenAI y Paradigm crean terreno de prueba
Puntos Clave
- OpenAI y Paradigm han lanzado EVMbench, una herramienta diseñada para evaluar la capacidad de los agentes de inteligencia artificial en la detección, corrección y explotación de vulnerabilidades graves en los contratos inteligentes de Ethereum.
- EVMbench se basa en 120 vulnerabilidades cuidadosamente seleccionadas de 40 auditorías, la mayoría obtenidas de competiciones de auditoría abiertas como Code4rena.
- El objetivo de esta herramienta es enraizar las pruebas en código real con significado económico, particularmente a medida que se expanden los pagos con stablecoins impulsados por la inteligencia artificial.
- A pesar de sus limitaciones, EVMbench representa un avance importante en la medición del rendimiento de la IA en entornos económicamente relevantes.
WEEX Crypto News, 2026-02-19 09:43:01
Introducción a EVMbench: Un punto de partida para la seguridad de Ethereum
En una colaboración innovadora, OpenAI y la firma de inversión centrada en criptomonedas, Paradigm, han lanzado EVMbench. Esta plataforma única está diseñada para evaluar qué tan capaces son los agentes de inteligencia artificial para identificar y remediar vulnerabilidades en los contratos inteligentes de la Ethereum Virtual Machine (EVM). Los contratos inteligentes son el núcleo del ecosistema Ethereum, ya que contienen el código que impulsa desde los protocolos de finanzas descentralizadas hasta el lanzamiento de tokens.
El auge de los contratos inteligentes en Ethereum
La importancia de proteger los contratos inteligentes se destaca por el dramático aumento en su implementación. Según Token Terminal, en noviembre de 2025 se alcanzó un récord histórico de 1.7 millones de contratos inteligentes implementados semanalmente en Ethereum, y solo la semana pasada se desplegaron 669,500. Este crecimiento no solo refleja la expansión de Ethereum, sino también la creciente necesidad de garantizar la seguridad del ecosistema.
¿Qué es EVMbench?
EVMbench examina tres modos de operación para los modelos de IA: detección, parcheo y explotación. En el modo de “detección”, los agentes auditan repositorios y son evaluados en base a su capacidad para recordar las vulnerabilidades reales. El modo “parcheo” desafía a los agentes a eliminar vulnerabilidades sin alterar la funcionalidad prevista del contrato. Finalmente, durante la fase de “explotación”, los agentes intentan realizar ataques que drenan fondos de extremo a extremo dentro de un entorno de blockchain aislado, con la evaluación realizada a través de la reproducción determinista de transacciones.
En condiciones de explotación, el modelo GPT-5.3-Codex de OpenAI, ejecutado a través del CLI de OpenAI Codex, alcanzó un puntaje del 72.2%, en comparación con el 31.9% de GPT-5, lanzado seis meses antes. Sin embargo, los resultados fueron menos impresionantes en las tareas de detección y parcheo, donde los agentes a veces no lograron realizar auditorías exhaustivas o tuvieron dificultades para preservar la funcionalidad completa del contrato.
Proceso de creación de EVMbench
EVMbench se fundamenta en 120 vulnerabilidades seleccionadas de 40 auditorías, principalmente extraídas de competiciones de auditoría abiertas como Code4rena. Además, incorpora escenarios del proceso de auditoría de seguridad de Tempo, una blockchain de capa 1 diseñada por Stripe para pagos de stablecoin de alto rendimiento y bajo costo. Stripe, el gigante de los pagos, lanzó la red de pruebas pública para Tempo en diciembre de 2025, señalando que se estaba desarrollando con la colaboración de Visa, Shopify y OpenAI, entre otros.
El objetivo declarado de EVMbench es arraigar las pruebas en código con relevancia económica en el mundo real. Esto es especialmente crítico a medida que los pagos de stablecoins impulsados por inteligencia artificial continúan expandiéndose y adquiriendo relevancia.
Desafíos y oportunidades
Si bien los desarrolladores de ChatGPT aconsejan que EVMbench no captura completamente la complejidad de la seguridad en el mundo real, reconocen su importancia en la medición del rendimiento de la IA en entornos económicamente relevantes. Este tipo de herramientas se vuelve cada vez más crucial a medida que los modelos de inteligencia artificial se convierten en herramientas poderosas tanto para atacantes como para defensores.
Un debate en torno al desarrollo de la IA
Cabe destacar que Sam Altman de OpenAI y Vitalik Buterin, cofundador de Ethereum, han tenido diferencias sobre la velocidad del desarrollo de la inteligencia artificial. En enero de 2025, Altman afirmó que su empresa estaba “segura de saber cómo construir inteligencia general artificial (AGI) como siempre la hemos entendido”. Sin embargo, Buterin abogó por que los sistemas de IA incluyan una capacidad de “pausa suave”, que podría restringir temporalmente las operaciones industriales de IA si surgen señales de advertencia.
EVMbench: Relevancia y perspectivas para el futuro
La introducción de EVMbench como nuevo punto de referencia para evaluar la aptitud de los agentes de IA en la detección, explotación y corrección de vulnerabilidades en los contratos inteligentes es un paso significativo hacia la mejora de la seguridad en Ethereum. Esencialmente, EVMbench no solo tiene como objetivo evaluar las capacidades de los agentes de IA, sino también cerrar la brecha entre las expectativas teóricas y el rendimiento práctico.
Toda la estructura de EVMbench está diseñada para asegurarse de que las pruebas no solo sean técnicamente sólidas, sino también económicamente significativas. El enfoque en el uso de código de relevancia real asegura que las evaluaciones realizadas sean más que ejercicios académicos, resonando directamente con los desafíos que enfrenta la seguridad en blockchain de Ethereum diariamente.
¿Por qué es importante asegurar los contratos inteligentes?
Los contratos inteligentes son inmutables, es decir, una vez desplegados, no se pueden modificar a menos que ya se haya previsto un mecanismo de actualización. Esto los hace poderosos y peligrosos. Un error en el código no solo es irreversible sino que puede resultar en pérdidas millonarias. Por ejemplo, se han dado casos de bugs explotados por hackers que han drenado miles de millones de dólares en pérdidas en diversas plataformas. De ahí que el desarrollo de herramientas como EVMbench sea crucial para la proactividad en la prevención de exploits.
Retos en el uso de la inteligencia artificial para la seguridad
A pesar de su potencial, las IA enfrentan varios retos cuando se emplean para la seguridad. Primero, las IA dependen de un conjunto de datos extenso y diverso para entrenarse adecuadamente, lo cual no siempre está disponible. Además, al igual que cualquier sistema, las IA pueden cometer errores. Un proceso de detección que no logre identificar defectos o un sistema de parche que altere la funcionalidad correcta del contrato, son riesgos inherentes que deben gestionarse cuidadosamente.
Sin embargo, el potencial de la inteligencia artificial para transformar el campo de la seguridad es inmenso. AI puede trabajar a velocidades, escalas y eficiencias que simplemente son inalcanzables para los auditores humanos.
Hacia un futuro más seguro en blockchain
La mejora continua de herramientas como EVMbench, junto con un paradigma creciente de colaboración entre entidades como OpenAI y líderes de la industria como Stripe, marca el camino hacia un futuro más seguro. Además, el diálogo sobre las implicaciones éticas y de seguridad del desarrollo de la inteligencia artificial, como el presenciado entre Altman y Buterin, asegura que los avances se realicen de manera responsable.
En última instancia, la garantía de seguridad que tiende la IA en el ámbito de Ethereum no solo dependerá de los algoritmos y complejos modelos de IA, sino también de una colaboración continua y una visión cohesionada para proteger la columna vertebral del sistema financiero descentralizado.
Preguntas Frecuentes
¿Qué es EVMbench?
EVMbench es una herramienta creada por OpenAI y Paradigm para evaluar la capacidad de los agentes de inteligencia artificial para detectar, explotar y corregir vulnerabilidades graves en los contratos inteligentes de la Ethereum Virtual Machine (EVM).
¿Por qué es importante la seguridad de los contratos inteligentes?
Los contratos inteligentes, una vez desplegados, son inmutables. Un error en el código puede llevar a pérdidas importantes, por lo que es crucial asegurar su correcto funcionamiento desde su creación.
¿Cuáles son las pruebas realizadas por EVMbench?
EVMbench evalúa a los agentes de IA en tres modos: detección de vulnerabilidades, parcheo (corrección) de vulnerabilidades sin romper la funcionalidad, y explotación de las mismas en un entorno seguro.
¿Cuál es la relevancia del uso de IA en la seguridad de blockchain?
El uso de IA para la seguridad en blockchain permite la identificación y corrección de vulnerabilidades a una velocidad y escala que supera las capacidades humanas, ayudando a proteger plataformas económicas críticas.
¿Qué papel juega Stripe en el desarrollo de EVMbench?
Stripe, junto con otros colaboradores como Visa, Shopify y OpenAI, ha jugado un papel en el desarrollo de Tempo, un blockchain que proporciona ejemplos de vulnerabilidades utilizados en EVMbench para pruebas significativas en el mundo real.
También te puede gustar

## Outline
H1: Predicción de Precios de Bitcoin: Posible Caída a $55,000 H2: Resumen de la Predicción del Mercado H3:…

MrBeast Adquiere Aplicación Fintech Step, Mientras Bitcoin Afronta Pruebas Críticas
Key Takeaways Bitcoin enfrenta un 47% de probabilidad de alcanzar los $75,000 este mes, con un volumen de…

# Outline
H1: Bitcoin Establece un Nuevo Rango Crítico en $55,000 H2: Contexto Histórico y Actualización del Precio de Bitcoin…

La Evolución de las Inversiones en Criptomonedas: Desde el Hype hasta la Realidad de los Ingresos
Key Takeaways Se produce un cambio en la lógica de inversión en criptomonedas hacia un enfoque en los…

¿Cómo equilibrar el riesgo y el rendimiento en los rendimientos de DeFi?

La tesis de Ethereum de Tom Lee: ¿Por qué el hombre que predijo el último ciclo está apostando fuerte por Bitmine?
Tom Lee se está convirtiendo en uno de los partidarios más influyentes de Ethereum. De Fundstrat a Bitmine, su tesis de Ethereum combina el rendimiento de la participación, la acumulación del tesoro y el valor de la red a largo plazo. Esta es la razón por la que “Tom Lee Ethereum” se ha convertido en una de las narrativas más seguidas del mundo de las criptomonedas.

Naval toma el escenario personalmente: La histórica colisión entre la gente común y el capital de riesgo

a16z Cripto: 9 gráficos para entender las tendencias de evolución de las Stablecoins

¿Puede un secador de pelo generar 34 000 dólares? Interpretación de la paradoja de la reflexividad en los mercados de predicción

Refutación del artículo «El fin de las criptomonedas», de Yang Haipo

Fundador de 6MV: En 2026, ha llegado el "punto de inflexión histórico" para la inversión en criptomonedas.

Abraxas Capital emite $2.89 mil millones en USDT: ¿Impulso de liquidez o solo más arbitraje de stablecoins?
Abraxas Capital acaba de recibir $2.89 mil millones en USDT recién emitidos de Tether. ¿Es esta una inyección de liquidez alcista para los mercados cripto, o es solo el negocio habitual de un gigante del arbitraje de stablecoins? Analizamos los datos y el probable impacto en Bitcoin, altcoins y DeFi.

Un inversor de capital riesgo del mundo de las criptomonedas dijo que la IA es demasiado descabellada y que son muy conservadores.

Expulsado por PayPal, Musk busca hacer un regreso en el mercado de criptomonedas

La Historia Evolutiva de los Algoritmos de Contratos: Una Década de Contratos Perpetuos, el Telón Aún No Ha Caído

Noticias del ETF de Bitcoin hoy: Ingresos de $2.1 mil millones indican una fuerte demanda institucional de BTC
Las noticias de los ETF de Bitcoin registraron ingresos de <g id='1'>$2.1 mil millones en 8 días consecutivos</g>, marcando una de las más fuertes rachas de acumulación recientes. Esto es lo que significan las últimas noticias del ETF de Bitcoin para el precio de BTC y si el nivel de ruptura de $80K es el siguiente.

Michael Saylor: ¿El invierno ha terminado – ¿Está en lo correcto? 5 puntos de datos clave (2026)
Michael Saylor tuiteó ayer "El invierno ha terminado." Es breve. Es audaz. Y tiene al mundo cripto hablando.
¿Pero está en lo correcto? ¿O es solo otro CEO inflando sus propias acciones?
Miremos los datos. Seamos neutrales. Veamos si el hielo realmente se ha derretido.

La aplicación WEEX Bubbles ya está disponible y permite visualizar el mercado de criptomonedas de un vistazo
WEEX Bubbles es una aplicación independiente diseñada para ayudar a los usuarios a comprender rápidamente los complejos movimientos del mercado de criptomonedas a través de una visualización intuitiva de burbujas.
## Outline
H1: Predicción de Precios de Bitcoin: Posible Caída a $55,000 H2: Resumen de la Predicción del Mercado H3:…
MrBeast Adquiere Aplicación Fintech Step, Mientras Bitcoin Afronta Pruebas Críticas
Key Takeaways Bitcoin enfrenta un 47% de probabilidad de alcanzar los $75,000 este mes, con un volumen de…
# Outline
H1: Bitcoin Establece un Nuevo Rango Crítico en $55,000 H2: Contexto Histórico y Actualización del Precio de Bitcoin…
La Evolución de las Inversiones en Criptomonedas: Desde el Hype hasta la Realidad de los Ingresos
Key Takeaways Se produce un cambio en la lógica de inversión en criptomonedas hacia un enfoque en los…
¿Cómo equilibrar el riesgo y el rendimiento en los rendimientos de DeFi?
La tesis de Ethereum de Tom Lee: ¿Por qué el hombre que predijo el último ciclo está apostando fuerte por Bitmine?
Tom Lee se está convirtiendo en uno de los partidarios más influyentes de Ethereum. De Fundstrat a Bitmine, su tesis de Ethereum combina el rendimiento de la participación, la acumulación del tesoro y el valor de la red a largo plazo. Esta es la razón por la que “Tom Lee Ethereum” se ha convertido en una de las narrativas más seguidas del mundo de las criptomonedas.



