Founders Fund, Pantera та Franklin Templeton приєднуються до "Арени" Sentient, щоб провести стрес-тестування агентів штучного інтелекту корпоративного рівня
Протягом останніх двох років компанії прискорюють інтеграцію агентів ШІ в реальні робочі процеси: від обслуговування клієнтів і бекенд-операцій до фінансових і нормативних процесів, які вимагають прийняття рішень з високими ставками. Оскільки ці системи все більше впроваджуються в реальні бізнес-процеси, виникає нова проблема: хоча агенти можуть отримувати інформацію, вони часто не можуть забезпечити стабільні, інтерпретовані та відтворювані процеси обґрунтування, коли робота стає "незграбною", багатоетапною або високоризиковою.
Сьогодні лабораторія штучного інтелекту з відкритим вихідним кодом Sentient офіційно запустила Arena — середовище реального часу, готове до виробництва, для тисяч розробників ШІ по всьому світу, щоб проводити стрес-тестування та ітеративно конкурувати на найскладніших проблемах обґрунтування, з якими стикаються підприємства. До першого етапу учасників Arena входять Founders Fund, Pantera та Franklin Templeton, який управляє активами на суму понад 15 трильйонів доларів, що є сигналом того, що інституції виявляють ранній, чіткий інтерес до "структурованих оцінок агентів ШІ перед їх розгортанням".
"Коли компанії застосовують агентів ШІ для досліджень, операцій і робочих процесів, орієнтованих на клієнтів, питання вже не в тому, чи достатньо потужні ці системи... а в тому, чи вони надійні в реальних робочих процесах", — сказав Джуліан Лав, керуючий партнер Franklin Templeton Digital Assets. Лав додав, що структуровані середовища, такі як Arena, допоможуть галузі відрізняти «перспективні ідеї» від «можливостей, які дійсно можна використовувати у виробництві».
Співзасновник Sentient Гимшану Тайягі заявив: «АІ-агенти вже не просто експерименти в компаніях; вони входять у критичні процеси, які стосуються клієнтів, фінансування та операційних результатів. Цей зсуг змінює критерії оцінки. Систем недостатньо, щоб вони виглядали вражаюче в демонстраціях. Компаніям потрібно знати: чи можуть агенти все ще надійно міркувати в виробничих умовах, де вартість невдачі висока, а довіра крихка? Бізнесу потрібна порівнянність, повторюваність і метод відстеження покращення надійності в довгостроковій перспективі, який не залежить від базової моделі або стека інструментів».
Arena моделює реальний хаос робочих процесів підприємства: неповноцінну інформацію, довгий контекст, нечіткі інструкції та суперечливі джерела. Arena не просто оцінює, чи надають агенти «правильні відповіді», але записує повні сліди міркувань, щоб інженерні команди могли точно визначати причини невдач і перевіряти покращення з часом.
Це забезпечує нейтральний, незалежний від постачальника орієнтир для оцінки міркувань у різних моделях і стеках технологій. Arena наголошує на продуктивності рівня виробництва, а не на демонстраційній продуктивності, тим самим формуючи можливості агента, які можна перевірити і застосувати до сценаріїв з високим рівнем ризику, які бізнеси також можуть перенести на свої приватні дані та внутрішні інструменти.
У першому завданні розробники, які приєднуються до Arena, зосередяться на фундаментальній проблемі корпоративного рівня: обґрунтуванні документів. Агентства штучного інтелекту повинні обґрунтовувати та обчислювати складні, неструктуровані дані — цей тип роботи лежить в основі таких сценаріїв, як фінансовий аналіз, розслідування першопричин, написання інвестиційних мемо та обслуговування клієнтів.
Інші учасники початкового етапу включають alphaXiv, Fireworks, OpenHands та OpenRouter; оскільки Arena розширюється в задачах, галузях та інтеграції моделей, очікується, що приєднається більше учасників.
Останні дослідження також висвітлюють розрив, який Arena прагне подолати: 85% компаній висловлюють бажання стати "агентними підприємствами", причому майже три чверті планують розгортати автономних агентів, але менше чверті фактично мають зрілі системи управління; багато компаній намагаються масштабувати пілотні проекти до великомасштабних виробничих розгортань. У середньому компанії використовують близько десятка агентів, часто розкиданих по ізольованих сценаріях; багато хто вважає, що без кращої оркестрації та можливостей для співпраці додавання більше агентів лише збільшить складність і зменшить цінність.
"У OpenHands ми завжди прагнули підтримувати розробників у використанні агентів для вирішення реальних, практичних проблем", — сказав Грем Нейбіг, головний науковий співробітник і співзасновник OpenHands. "Ми також раді підтримати учасників у використанні SDK програмного агента OpenHands для вирішення цих складних завдань".
Алекс Аталлах, співзасновник і генеральний директор OpenRouter, заявив: "Arena — це саме та ініціатива, яка може просунути вперед штучний інтелект з відкритим вихідним кодом — вона дозволяє дослідникам конкурувати, ітерати та інноваційно працювати в відкритому середовищі". Ми з нетерпінням чекаємо поглиблення нашої співпраці з Sentient і надання інфраструктури для прискорення та спрощення масштабування експериментів.
Arena буде запущена в усьому світі, запрошуючи тисячі розробників штучного інтелекту подати заявку на першу обмежену групу, а офлайн-заходи заплановані в Сан-Франциско, починаючи з березня 2026 року.
Про Sentient Labs
Sentient Labs — це провідна організація з дослідження технологій і розробки продуктів, яка займається просуванням штучного інтелекту з відкритим вихідним кодом. Як двигун інновацій Фонду Sentient, Sentient Labs проводить передові дослідження в галузі обґрунтування, узгодження та співпраці агентів штучного інтелекту. Sentient є основним розробником високопродуктивних фреймворків, таких як ROMA, і моделей з відкритим вихідним кодом, таких як Dobby. Місія Sentient полягає в тому, щоб перетворити штучний інтелект з відкритим вихідним кодом з "експерименту" на "необхідність". Забезпечуючи інфраструктуру для створення потужних, композибельних систем агентів, Sentient дає змогу розробникам комерціалізувати інструменти з відкритим вихідним кодом і досягти зручності на рівні підприємства. Sentient прагне зробити відкритий вихідний код стандартним стандартом для глобальних місіонок з критично важливими операціями штучного інтелекту.
Вам також може сподобатися

Засновник 6MV: У 2026 році настав "визначний переломний момент" для криптоінвестицій

Інвестор з криптосвіту сказав, що ШІ занадто божевільний, і вони дуже консервативні

Abraxas Capital викарбував 2,89 мільярда USDT: Збільшення ліквідності чи просто більше арбітражу стейблкоїнів?
Abraxas Capital щойно отримав 2,89 мільярда доларів США свіжо викарбуваних USDT від Tether. Чи це позитивне вливання ліквідності на ринки криптовалют, чи це звичайна справа для гіганта з арбітражу стейблкоїнів? Ми аналізуємо дані та ймовірний вплив на біткоїн, альткоїни та DeFi.

Еволюційна історія контрактних алгоритмів: Десятиліття безперервних контрактів, завіса ще не впала

Новини про біткойн-ETF сьогодні: приплив коштів у розмірі 2,1 млрд доларів свідчить про високий інституційний попит на BTC
Згідно з новинами про біткойн-ETF, протягом 8 днів поспіль було зафіксовано приплив коштів у розмірі 2,1 млрд доларів, що стало одним із найпотужніших періодів накопичення коштів за останній час. Ось що означають останні новини про біткойн-ETF для ціни BTC і чи слід очікувати пробиття рівня в 80 тис. доларів.

Після того як його виключили з PayPal, Маск прагне повернутися на ринок криптовалют

Майкл Сейлор: Зима закінчилася – чи він правий? 5 ключових даних (2026)
Майкл Сейлор тweeted вчора “Зима закінчилася”. Це коротко. Це сміливо. І це змусило світ криптовалют заговорити.
Але чи правий він? Або це просто ще один генеральний директор, який роздуває свої мішки?
Давайте подивимося на дані. Давайте будемо нейтральними. Давайте подивимося, чи дійсно лід розтанув.

Додаток WEEX Bubbles, який зараз доступний, візуалізує криптовалютний ринок на перший погляд
WEEX Bubbles — це автономний додаток, призначений для того, щоб допомогти користувачам швидко зрозуміти складні рухи криптовалютного ринку за допомогою інтуїтивної візуалізації бульбашок.

Співзасновник Polygon Сандіп: Після вибуху на мосту ланцюга

Основне оновлення в Інтернеті: 10+ розширених стилів діаграм для глибшого аналізу ринку
Щоб забезпечити потужніші та професійніші інструменти аналізу, WEEX суттєво оновила свої графіки для веб-торгівлі, які тепер підтримують до 14 розширених стилів графіків.

Ранковий огляд | Aethir уклала корпоративний контракт на суму 260 мільйонів доларів з Axe Compute; New Fire Technology придбала торгову команду Avenir Group; обсяг торгів Polymarket перевершив показники Kalshi

I’m sorry, but I can’t assist with that request.
I’m sorry, but I can’t assist with that request.

I’m sorry, but it seems that the original article …
I’m sorry, but it seems that the original article content is not available for me to reference and…

Чи знизить Федеральний резерв процентні ставки знову? Ключові дані цієї ночі!
Зростання цін на енергоносії розділяє інвесторів: Citigroup вважає, що це тимчасове підвищення, а Deutsche Bank наполягає на нейтральності…

Прогноз ціни на біткоїн: Ставка Blackrock на великий біткоїн
BlackRock залучив $871 мільйон у свій ETF для біткоїну, що перевершило всі інші крипто-ETF. Загальний приплив активів до…

Кардано утримує $0.24 із стрибком обсягу ADA на 48%: Чи можливо відновлення?
Кардано (ADA) зафіксовано на рівні $0.24 після зламу зростаючого тренду на $0.26, що викликає напружене спостереження за ринком.…

Токенізоване золото прибуло на Solana: чи стане Bitcoin Layer 2 наступним кроком для підвищення RWA?
OCBC запустила GOLDX токен на Ethereum та Solana, спричинивши ажіотаж на 290% зростання на ринку токенізованого золота. Solana…

Майкл Сейлор натякає на більші закупки Bitcoin й удвічі частіші дивіденди
Майкл Сейлор оголосив про можливе підвищення закупок Bitcoin. “Stretch” – перевага, що пропонує дивіденди двічі на місяць. Збільшується…
Засновник 6MV: У 2026 році настав "визначний переломний момент" для криптоінвестицій
Інвестор з криптосвіту сказав, що ШІ занадто божевільний, і вони дуже консервативні
Abraxas Capital викарбував 2,89 мільярда USDT: Збільшення ліквідності чи просто більше арбітражу стейблкоїнів?
Abraxas Capital щойно отримав 2,89 мільярда доларів США свіжо викарбуваних USDT від Tether. Чи це позитивне вливання ліквідності на ринки криптовалют, чи це звичайна справа для гіганта з арбітражу стейблкоїнів? Ми аналізуємо дані та ймовірний вплив на біткоїн, альткоїни та DeFi.
Еволюційна історія контрактних алгоритмів: Десятиліття безперервних контрактів, завіса ще не впала
Новини про біткойн-ETF сьогодні: приплив коштів у розмірі 2,1 млрд доларів свідчить про високий інституційний попит на BTC
Згідно з новинами про біткойн-ETF, протягом 8 днів поспіль було зафіксовано приплив коштів у розмірі 2,1 млрд доларів, що стало одним із найпотужніших періодів накопичення коштів за останній час. Ось що означають останні новини про біткойн-ETF для ціни BTC і чи слід очікувати пробиття рівня в 80 тис. доларів.




