Понимание сильных и слабых сторон LLMs позволит не только использовать их более эффективно в личных и бизнес проектах, но и понимать уязвимость невероятного пузыря, не имеющих аналогов в истории человечества (около 52...

2 декабря 2025, 19:13

Понимание сильных и слабых сторон LLMs позволит не только использовать их более эффективно в личных и бизнес проектах, но и понимать уязвимость невероятного пузыря, не имеющих аналогов в истории человечества (около 52 избыточной мировой капитализации на ИИ хайпе и до 0.5 трлн инвестиций в год от мировых компаний в реальной экономике).

Оглушительный хайп вокруг ИИ во многом связан с попыткой проекцией сверхъестественных свойств, но эти LLMs имеют массу ограничений. Я выпустил очень много материалов, но даже в них рассмотрел лишь часть.

Начну с самого важного и принципиального.

Фундаментальная неспособность к инновациям. Любая инновация (новая идея, альтернативная гипотеза, концептуальный или технологический прорыв) - это статистическая аномалия (выброс), а архитектура LLM в своем ядре заточена эти выбросы сглаживать и/или игнорировать (зависит от пресетов и настроек моделей).

LLM обучается минимизировать ошибку (Loss Function) на огромном массиве данных, она математически штрафуется за любые отклонения от «нормального» распределения. Веса модели - это усредненный слепок коллективного разума (и глупости).

LLM архитектурна не способна к инновациям, это семантический блендер. Если в обучающие данные положить стейк (научные факты), торт (художественную литературу) и гнилые овощи (форумный спам, интернет дебаты), на выходе вы получите однородную, легко усваиваемую питательную массу без вкуса и текстуры. В этом важно то, что выделить обратно стейк невозможно, из этого следует …

Качество данных определяет все. Это не архитектурный баг, а обучающее несовершенство. В своей основе LLM выстраивают вектор распределения на статической интерполяции, где наиболее часто встречающиеся семантические конструкции имеют больший вес. Другими словами, чем чаше в обучении встречается некоторое утверждение, тем он более истинное для LLMs (архитектурная уязвимость), но в обучении эксабайты медиа срачей и скама (обучающее несовершенство) всегда будут доминировать над очень ограниченной выборкой качественной научной, технической или художественной литературой.

Для решения этой проблемы есть множество механизмов, но они хороши в теории, а не на практике.

Data Up-sampling, когда в корпусе данных датасеты делятся на домены (энциклопедии, научная литература, база кода, интернет статьи, форумный троллинг и т.д), где приоритет отдают качественным публикациям и надежным источникам.

Это хорошо в теории, на практике нет надежных механизмов сепарации эксабайт (в 1 миллион раз больше, чем терабайт), в итоге происходит смешение данных и доминирование токсичной информации, которой на многие порядки выше, чем качественной.

Фильтрация на основе классификаторов с автоматической классификацией через специально натреннированную нейросеть (модель-цензор) для отсеивания откровенного скама, но не существует механизмов отсечения семантически качественных материалов, но концептуально пустых (здесь должен быть человек – эксперт, но на практике весь отбор данных почти полностью автоматический).

Дедупликация – когда через специальные алгоритмы сжимаются миллионы репостов одного и того же скама в единичный экземпляр для устранения переполнения стэка данных дубликатами. Если этого не делать, уникальная научная статья будет иметь нулевой вес в сравнении с эксабайтами медиа скама.

Теория от практики отличается. Нет надежного механизма агрегации и сепарации качественных источников от некачественных, когда речь идет об обработке сотен эксабайт данных.

Как решение, брать за основу архитектуру модели с небольшим количеством параметров на 8-10 млрд и целенаправленно обучать на специализированных доменах (например, медицина, химия, физика, программирование и т.д.). На выходе получится скорее очень сухое, скучное справочное бюро без возможности междисциплинарного взаимодействия и полноценного размышления.

Универсальные модели (в открытом доступе) страдают «заражением» токсичными данными и искаженной «картиной мира» не только из-за ошибок развесовки и несовершенства алгоритма, но и по причине ошибочной сепарации данных и изначально некачественных источников.

Источник: Telegram-канал "Spydell_finance"

Топ

Владимир Корнилов: Вице-премьер Италии Маттео Сальвини вчера напрямую к Зеленскому обратился:

Вице-премьер Италии Маттео Сальвини вчера напрямую к Зеленскому обратился:Мы слышали Зеленского, который, несмотря на все полученные деньги, усилия и помощь, все еще имеет наглость жаловаться. Мой друг, ты проигрываешь войну, ты теряешь людей, доверие...

10:07

Дмитрий Стешин: Первый, но не очевидный итог СВО - Крым стал "фигурой умолчания" в переговорном процессе

Первый, но не очевидный итог СВО - Крым стал "фигурой умолчания" в переговорном процессе. Про него не кукарекают даже сами хохлы, "стадия принятия" завершилась. С Донбассом будет тоже самое.

11:28

Юлия Витязева: Вселенский патриарх Варфоломей опроверг заявление Службы внешней разведки РФ о том, что он является антихристом, пишет британская газета The Times

Вселенский патриарх Варфоломей опроверг заявление Службы внешней разведки РФ о том, что он является антихристом, пишет британская газета The Times. Также Варфоломей отрицает, что является британским шпионом.Было бы странно, если бы о6 это подтвердил...

11:33

Марат Баширов: Иранское ТВ разместило видеоролик, в иранская баллистическая ракета «Фаттах» (Дарующая победу) топит американский авианосец "Abraham Lincoln"

Иранское ТВ разместило видеоролик, в иранская баллистическая ракета «Фаттах» (Дарующая победу) топит американский авианосец "Abraham Lincoln".

10:16

Дмитрий Стешин: Зафиксировано поумнение 39% украинцев

Зафиксировано поумнение 39% украинцев. Выяснил это Киевский международный институт социологии (КМИС), аффилированный с клоповником под названием Киево-Могилянская академия.Вопрос был совершенно зрадный, политически-незрелый. "Отношение к...

11:28

‘Я думаю, что этот год станет тем моментом, когда мы начнём воспринимать украинцев совершенно иначе: как действительно сильного союзника, как военный щит Европы, как арсенал Европы — страну, которая умеет создавать...

Скабеева в Max | Скабеева в...

12:09

"Это не страна варваров". Экс-канцлер Германии сказал правильные слова о России

Герхард Шрёдер заявил, что безопасность Европы невозможна без признания России полноценным партнёром. Бывший канцлер выступил с жёсткой критикой нынешнего внешнеполитического курса Берлина, заявив, что политика демонизации России и ставка на военную...

11:33

Одесса. Укро-нацисты требуют пустить Галустяна на окопные свечи

Ну все — бродячие активные экскременты добрались до одесского музея восковых фигур «У бабы Ути». Заведение это частное, основанное почти сорок лет назад. Основную часть коллекции ваяли мастера из Санкт-Петербурга. Музейное собрание обширно, но упор на...

10:10

Сергей Мардан: О том, что из себя может представлять обязательная государственная идеология и кто займет места новых "идеологов" лучше всего говорит назначение ИО ректора Школы-студии МХАТ К.Богомолова-Собчак. Но не только

О том, что из себя может представлять обязательная государственная идеология и кто займет места новых "идеологов" лучше всего говорит назначение ИО ректора Школы-студии МХАТ К.Богомолова-Собчак. Но не толькоРазвернуто и предельно неполиткорректно - в...

12:05

«Бейте по центру принятья решений»

«Бейте по центру принятья решений»Бред, конечно, но из него неизбежно начинаешь задавать неудобные вопросы. Ответы на которые явно не понравятся.Киев дает или не дает 50% ВВП Хунты?Точно в цель бьющие неуловимые...

09:10

Михаил Онуфриенко: Шестеро боевиков «Азова» (организация признана террористической, запрещена в РФ), вместе с темнокожим командиром по имени Даниэль, сдались в плен в районе Димитрова

Шестеро боевиков «Азова» (организация признана террористической, запрещена в РФ), вместе с темнокожим командиром по имени Даниэль, сдались в плен в районе Димитрова.@divgen | divgen.ru | Max

10:45

Александр Сладков: Афганская эпопея ВГТРК

Афганская эпопея ВГТРК.

12:22

Ребёнок участника СВО навсегда остался лежачим инвалидом из-за ошибки персонала питерского роддома № 9. Следователи возбудили дело о халатности

Вся история — со слов самой матери, Светланы. Она заранее заключила договор на индивидуальное сопровождение родов за 90 тысяч. На 39-й неделе почувствовала острую боль в животе, но нанятый акушер-гинеколог сказал не суетиться лишнего и...

Вчера, 21:48

Олег Царёв: Детская порнография, информация о наркотиках и… разбор варианта ЕГЭ — Министерство просвещения хочет поставить все это в один ряд

Детская порнография, информация о наркотиках и… разбор варианта ЕГЭ — Министерство просвещения хочет поставить все это в один ряд. Минпросвещения подготовило законопроект: хотят дать Роскомнадзору право оперативно блокировать...

11:03

Укро-делегация привезла в Швейцарию ролик с ударом «Гераней» по Давосу

Ни в ЕС, ни в НАТО уже давно нет единства, а потому Украине приходится нагонять жути на Запад в надежде и дальше стравливать его с Россией.Как передает корреспондент «ПолитНавигатора», к такому выводу в статье, посвященной итогам последнего форума в...

11:25

Александр Коц: Мигранты: из школьного журнала - в полицейский

Мигранты: из школьного журнала - в полицейскийШколы будут обязаны сообщать в МВД о зачислении детей мигрантов в школы, отчислении и о результатах их тестирования на знание русского языка. Соответствующий закон вступит в силу до 28 января. В свою...

12:05

Зеленский:. «Белому шпицу Лукашенко оставлено больше прав, чем народу Белоруссии, к сожалению. Был шанс в 2020 году, чтобы это изменить, и, уверен, будет ещё шанс. Но тогда поддержки для белорусов было просто недостаточно»

Зеленский:«Белому шпицу Лукашенко оставлено больше прав, чем народу Белоруссии, к сожалению. Был шанс в 2020 году, чтобы это изменить, и, уверен, будет ещё шанс. Но тогда поддержки для белорусов было просто недостаточно».Где-то громко хохочут людоловы...

11:19

Территориальная часть "формулы Анкориджа" является для России принципиальной, отметил Песков

Другие заявления пресс-секретаря президента РФ:Путин постоянно получает прямые доклады от российских переговорщиков.На переговорах по украинскому урегулированию вряд ли возможно дружелюбие, но если они идут, нужно...

11:00

Индия встречает премьеры российского авиастроения

Индия встречает премьеры российского авиастроения Полностью российские «Суперджет» и Ил-114-300 прибыли в индийский Хайдарабад для участия в авиасалоне Wings India 2026В ходе перелета отечественные системы самолетов функционировали в штатном режиме....

11:20

Юрий Баранчик: Итоги СВО-недели: работает — не трогай

Итоги СВО-недели: работает — не трогайКлючевой сигнал прошедшей недели прозвучал не столько с линии фронта, сколько из тыла — через удары по энергетической инфраструктуре Украины. Повреждения ТЭЦ в Киеве и поражение...

11:07