ИИ прорыв от Anthropic?. Рано делать выводы, нужны не тесты, а опыт прикладного использования, причем серийного в различных сценариях, а пока лишь гипотезы и маркетинговые лозунги

ИИ прорыв от Anthropic?. Рано делать выводы, нужны не тесты, а опыт прикладного использования, причем серийного в различных сценариях, а пока лишь гипотезы и маркетинговые лозунги

ИИ прорыв от Anthropic?

Рано делать выводы, нужны не тесты, а опыт прикладного использования, причем серийного в различных сценариях, а пока лишь гипотезы и маркетинговые лозунги.

Рассуждая о новой модели Fable 5, нужно иметь в виду, что Anthropic готовится к IPO (это первая и одновременно последняя возможность разместиться сверх-дорого, пока в терминальном психозе, взвизгивающие от экстаза и припадков лудоманы, способны платить в разы больше истинной ценности).

Все это, чтобы успешно нахлобучить обезумевших лудоманов на триллион+, поэтому в медийном разгоне будут активно эксплуатировать тему AGI, технологической сингулярности и исключительности продуктов Anthropic в бизнес-задачах, чтобы подхватить рыночный хайп и корпоративный спрос на ИИ-решения Anthropic.

Например, Anthropic предупредила, что

системы развиваются настолько быстро, что вскоре могут достичь рекурсивного самоулучшения (RSI) – автономного совершенствования без вмешательства человека.

Это только начало, впереди много медийной требухи, но … одновременно и интересных решений в области LLMs.

Я так зацепился за новый анонс Anthropic, потому что в презентации были задекларированы закрытия многих архитектурных дыр и уязвимостей, которые я активно описывал в 2024-2025, т.е. это реально заявка на решительное превосходство и способность перехвата прикладных задач в бизнесе и науке.

Во-вторых, презентация Anthropic – это дорожная карта для всех других LLMs в ближайшие годы. Вероятно, не все из объявленного будет работать сразу, но это скорее проекция намерений.

Во всяком случае, полезно и интересно наблюдать за траекторией развития флагманов индустрии.

Да, сложно уместить 350-страничную системную карту в один или даже несколько постов, но все же попробую расставить акценты.

Способность к длительной автономной работе над сложной задачей. Именно здесь, судя по документу Anthropic, проходит основная линия разрыва между Fable 5 и прежними моделями.

Речь идет не о способности дать более «красивый» ответ на один запрос, а о способности удерживать цель, промежуточные зависимости, ограничения и рабочую логику на протяжении длинного процесса.

Это принципиально иной режим использования LLM: не справочник, не генератор текста, не ассистент для одного действия, а инструмент для выполнения сложной последовательности операций.

Преимущество Fable 5 растет именно там, где задача многослойна, плохо формализована и требует не одного ответа, а серии проверяемых решений.

В этом и заключается ключ перехода к цепочке трансмиссии в агентные возможности, куда и концентрируются основные ресурсы Anthropic и где наибольшее преимущество новых моделей.

Агентная работа LLMs предполагает полуавтоматическую или полностью автономную работу с возможностью консолидации инструментов под конкретную задачу с жесткими критериями верификации и следованию инструкциями

ИИ-агент – это автономная система на базе LLM, которая получает цель, самостоятельно декомпозирует её на шаги и итеративно идёт к результату в цикле «планирование действие инструментами оценка результата коррекция», вызывая внешние инструменты (код, поиск, API, файлы, суб-агенты) и удерживая контекст на протяжении всего процесса. Ключевое отличие от обычного чат-интерфейса – не один ответ на запрос, а серия проверяемых действий, доводящих задачу до верифицированного конечного результата при минимальном участии человека.

Это один из центральных акцентов Anthropic в рамках презентации Fable 5.

Длинный контекст и способность сохранять стабильность на значительной глубине извлекаемых данных.

Один миллион токенов сам по себе не является прорывом, если модель теряет причинно-следственные связи, путает факты, исходные данные и галлюцинирует.

Ранее я неоднократно описывал, что один из ключевых архитектурных багов современных LLMs – фундаментальная неспособность удерживать и эффективно воспроизводить длинный контекст без потери содержания.

В тестах Anthropic в значительно степени решает эти проблемы, но без длинного и стабильного контекста в принципе исключена полноценная ИИ-агентов

ИИ прорыв от Anthropic?. Рано делать выводы, нужны не тесты, а опыт прикладного использования, причем серийного в различных сценариях, а пока лишь гипотезы и маркетинговые лозунги

Источник: Telegram-канал "Spydell_finance"

Топ

Лента новостей