Fable 5 – новая потенциально прорывная LLM от Anthropic
Fable 5 новая потенциально прорывная LLM от Anthropic
Давно не разбирал анонсы LLMs, но кажется этот случай особый и в конце материала будет понятная причина.
В апреле Anthropic анонсировала Mythos новый класс моделей, стоящий, по утверждению компании, ступенью выше прежнего флагмана Opus, но публике Mythos не достался. Запущенная как превью в апреле, модель изначально была ограничена очень ограниченным пулом доверенных компаний из-за опасений в области кибербезопасности в связи с аномальными способностями модифицировать код и находить сложные и скрытые уязвимости.
Fable 5 первая публично доступная модель класса Mythos.
В свою очередь Mythos 5 это та же базовая модель, что и Fable 5, но со снятыми в некоторых областях ограничениями. Различие исключительно в защитных контурах в области кибербезопасности, химии и биологии, где встроенная защита в Fable 5 блокирует запрос и откатывается к Claude Opus 4.8, а Mythos, как выше отмечено, доступна ограниченному кругу доверенных корпоративных клиентов (в основном технологические компании США и ведущие университеты в орбите Anthropic).
Судя по представленным бенчмаркам (хотя слепо доверять не стоит, компании специально адаптируют флагманские модели, чтобы успешно проходить конкретные бенчмарки), Fable 5 в клочья разрывает все, что было представлено ранее, даже собственную недавно анонсированную Opus 4.8.
Параметры: контекст 1 млн токенов, максимальный вывод 128 тыс токенов, адаптивный рассуждающий механизм, значительно улучшена способность удержания длинного контекста, что является критической функцией в условиях сложных проектов.
Fable 5 и Mythos 5 стоят вдвое дороже Claude Opus 4.8, нынешней флагманской модели. Цена: $10 за 1 млн входных токенов и $50 за 1 млн выходных токенов.
Однако, Fable 5 выполняет задачи с меньшим расходом токенов, поэтому стоимость завершённой задачи может снижаться, несмотря на более высокую цену за токен.
Реальная метрика стоимость успешного завершённого процесса: число попыток, число исправлений, число ручных проверок, глубина автоматизации, риск ошибки, время до конечного верифицированного результата.
Fable 5 адресован не столько потребительскому рынку, сколько компаниям, готовым платить за более высокий уровень интеллектуальной автоматизации в коде, аналитике, исследованиях и документообороте.
Принципиальный паттерн, заявленный Anthropic и подтверждённый бенчмарками: преимущество модели растёт нелинейно с длиной и сложностью задачи. Чем длиннее и сложнее задача, тем больше отрыв Fable 5 от прочих моделей.
Фундаментальный прорыв, по крайней мере, как его пытается представить Anthropic, но пересказанными моими словами, заключается в способности выполнять многошаговые вычислительные итерации, собирая итоговый результат из многомерной матрицы параметров и динамических условий в сложной междисциплинарной работе, иерархически интегрируя разрозненные параметры в целостный вектор принятия решений в рамках формулирования выходной задачи, сохраняя при этом контекст по всей глубине.
Заявка сильная по сути, анонс расщепляет все наиболее явные и критически для работы архитектурные ограничения LLMs, которые я описывал на протяжении трех лет в серии статей, посвященных ИИ.
Fable 5 и Mythos 5 способны работать автономно дольше, чем предыдущие Claude-модели. В бизнес-переводе это означает: модель лучше подходит для задач, где результат появляется не после одного ответа, а после серии действий: анализ репозитория, миграция кода, сбор доказательной базы, проверка таблиц, сопоставление документов, подготовка аналитического вывода.
Anthropic также утверждает, что Fable 5 удерживает фокус на задачах с миллионами токенов и улучшает результаты, используя собственные заметки. В эксперименте с длительной игровой задачей Fable 5 обеспечила примерно втрое больший прирост, чем Opus 4.8.
Другими словами, архитектура Fable 5 изначально заточена под бизнес адаптацию в рамках сложных корпоративных задач. Сегодня еще более подробно исследую технические параметры Fable 5.