Почему неустранимы галлюцинации LLMs?

1 декабря 2025, 17:32

Почему неустранимы галлюцинации LLMs?

Галлюцинации в LLM неустранимы (в рамках текущей авторегрессионной архитектуры трансформеров), потому что они являются не «багом» (ошибкой), а неотъемлемой «фичей» (свойством) работы вероятностного генератора.

Галлюцинации – это фундаментальная, архитектурная основа LLMs, их можно снизить, но нельзя устранить.

Галлюцинация возникает тогда, когда неверная последовательность токенов имеет высокую статистическую вероятность (например, из-за похожести на другие тексты). Модель не может «остановиться и проверить», потому что у неё нет модуля верификации и самокоррекции, есть только модуль генерации.

В фазе предварительного обучения (pre-training) для LLMs формируется машинная «картина мира» через компрессию, сжатие экзабайт данных различной модальности в гигабайты или терабайты весов (параметров).

Невозможно восстановить исходный сигнал без потерь, если коэффициент сжатия составляет 100:1 или 1000:1.

Когда вы спрашиваете точный факт, модель не достает его из базы данных (её нет). Она пытается реконструировать (аппроксимировать) информацию из размытых слепков весов.

Галлюцинация - это артефакт реконструкции

. Как JPEG добавляет «шум» на краях объектов, так и LLM добавляет вымышленные детали там, где информация в весах «размыта» или недостаточно представлена. Устранить это можно только отказавшись от сжатия, но тогда модель перестанет быть генеративной.

Механизм, позволяющий модели галлюцинировать, – это тот же самый механизм, который позволяет ей быть креативной и обобщать.

Если из LLMs изъять «механизм бредогенерации», LLMs превратится в справочное бюро без возможности контекстного развертывания.

Не существует лимита галлюцинаций, LLMs никогда не остановится в потоке бреда, т.к. нет механизма обратной связи. Человек проверяет или расщепляет свои галлюцинации и заблуждения об объективную реальность через обратную связь с окружающей действительностью, через органы чувств и физический опыт.

LLM не имеет выхода в реальность. Для неё «реальность» — это то, что статистически вероятно в тексте. У неё нет внешнего референса для заземления и верификатора, чтобы сверить свой прогноз.

Точность генерации LLMs тем выше, чем выше экспозиция данных в обучающей выборке. Другими словами, чем чаще представлен факт, процесс или событие в обучающих данных (популярные факты, которые повторяются миллиарды раз: «Небо чаще всего голубое, а не красное», «2+2=4» и т.д.)

Но как только запрос касается редких знаний (специфический научный факт, малоизвестные события, альтернативный взгляд на события, биографии малоизвестного человека и т.д.), плотность данных падает.

• В этой зоне модель начинает заполнять пробелы наиболее вероятными шаблонами.

• Поскольку архитектура требует выдать ответ (complete the sequence), она вынуждена выдумать правдоподобное завершение, вместо того чтобы сказать «я не знаю» (если её специально жестко не натренировали на отказ, что тоже не всегда работает).

В LLMs относительно достоверно то, что имеет наибольшее представление в обучающих данных, но по мере снижения плотности данных – растут галлюцинации.

Репликация мусора и конфликт распределения данных. Изначально LLMs обучались на человеческих данных, которые в своей основе далеки от концептуальной чистоты, нашпигованные заблуждениями, ложными утверждениями и идиотизмом, где сам человек часто не может определить реальность от вымысла.

Запрет на «отказ от ответа». Почти все модели в посткалибровке обучаются быть полезными, поэтому «отрицательный ответ или отказ от ответа» не вознаграждается, что приводит к генерации ответа даже там, где ответа быть не может (LLM не может эффективно отказывать, т.к «сама не знает, что она не знает»).

Снижение галлюцинаций происходит либо на этапе RLHF, где инженерами вручную и очень избирательно устанавливаются «правильные» веса и факты, либо в процессе обращения к внешним источникам (интернет, базы данных, внешние источники данных, внешние верификаторы).

Источник: Telegram-канал "Spydell_finance"

Топ

Владимир Корнилов: Вице-премьер Италии Маттео Сальвини вчера напрямую к Зеленскому обратился:

Вице-премьер Италии Маттео Сальвини вчера напрямую к Зеленскому обратился:Мы слышали Зеленского, который, несмотря на все полученные деньги, усилия и помощь, все еще имеет наглость жаловаться. Мой друг, ты проигрываешь войну, ты теряешь людей, доверие...

10:07

Дмитрий Стешин: Первый, но не очевидный итог СВО - Крым стал "фигурой умолчания" в переговорном процессе

Первый, но не очевидный итог СВО - Крым стал "фигурой умолчания" в переговорном процессе. Про него не кукарекают даже сами хохлы, "стадия принятия" завершилась. С Донбассом будет тоже самое.

11:28

Юлия Витязева: Вселенский патриарх Варфоломей опроверг заявление Службы внешней разведки РФ о том, что он является антихристом, пишет британская газета The Times

Вселенский патриарх Варфоломей опроверг заявление Службы внешней разведки РФ о том, что он является антихристом, пишет британская газета The Times. Также Варфоломей отрицает, что является британским шпионом.Было бы странно, если бы о6 это подтвердил...

11:33

Марат Баширов: Иранское ТВ разместило видеоролик, в иранская баллистическая ракета «Фаттах» (Дарующая победу) топит американский авианосец "Abraham Lincoln"

Иранское ТВ разместило видеоролик, в иранская баллистическая ракета «Фаттах» (Дарующая победу) топит американский авианосец "Abraham Lincoln".

10:16

Дмитрий Стешин: Зафиксировано поумнение 39% украинцев

Зафиксировано поумнение 39% украинцев. Выяснил это Киевский международный институт социологии (КМИС), аффилированный с клоповником под названием Киево-Могилянская академия.Вопрос был совершенно зрадный, политически-незрелый. "Отношение к...

11:28

‘Я думаю, что этот год станет тем моментом, когда мы начнём воспринимать украинцев совершенно иначе: как действительно сильного союзника, как военный щит Европы, как арсенал Европы — страну, которая умеет создавать...

Скабеева в Max | Скабеева в...

12:09

"Это не страна варваров". Экс-канцлер Германии сказал правильные слова о России

Герхард Шрёдер заявил, что безопасность Европы невозможна без признания России полноценным партнёром. Бывший канцлер выступил с жёсткой критикой нынешнего внешнеполитического курса Берлина, заявив, что политика демонизации России и ставка на военную...

11:33

Одесса. Укро-нацисты требуют пустить Галустяна на окопные свечи

Ну все — бродячие активные экскременты добрались до одесского музея восковых фигур «У бабы Ути». Заведение это частное, основанное почти сорок лет назад. Основную часть коллекции ваяли мастера из Санкт-Петербурга. Музейное собрание обширно, но упор на...

10:10

Сергей Мардан: О том, что из себя может представлять обязательная государственная идеология и кто займет места новых "идеологов" лучше всего говорит назначение ИО ректора Школы-студии МХАТ К.Богомолова-Собчак. Но не только

О том, что из себя может представлять обязательная государственная идеология и кто займет места новых "идеологов" лучше всего говорит назначение ИО ректора Школы-студии МХАТ К.Богомолова-Собчак. Но не толькоРазвернуто и предельно неполиткорректно - в...

12:05

«Бейте по центру принятья решений»

«Бейте по центру принятья решений»Бред, конечно, но из него неизбежно начинаешь задавать неудобные вопросы. Ответы на которые явно не понравятся.Киев дает или не дает 50% ВВП Хунты?Точно в цель бьющие неуловимые...

09:10

Михаил Онуфриенко: Шестеро боевиков «Азова» (организация признана террористической, запрещена в РФ), вместе с темнокожим командиром по имени Даниэль, сдались в плен в районе Димитрова

Шестеро боевиков «Азова» (организация признана террористической, запрещена в РФ), вместе с темнокожим командиром по имени Даниэль, сдались в плен в районе Димитрова.@divgen | divgen.ru | Max

10:45

Александр Сладков: Афганская эпопея ВГТРК

Афганская эпопея ВГТРК.

12:22

Ребёнок участника СВО навсегда остался лежачим инвалидом из-за ошибки персонала питерского роддома № 9. Следователи возбудили дело о халатности

Вся история — со слов самой матери, Светланы. Она заранее заключила договор на индивидуальное сопровождение родов за 90 тысяч. На 39-й неделе почувствовала острую боль в животе, но нанятый акушер-гинеколог сказал не суетиться лишнего и...

Вчера, 21:48

Олег Царёв: Детская порнография, информация о наркотиках и… разбор варианта ЕГЭ — Министерство просвещения хочет поставить все это в один ряд

Детская порнография, информация о наркотиках и… разбор варианта ЕГЭ — Министерство просвещения хочет поставить все это в один ряд. Минпросвещения подготовило законопроект: хотят дать Роскомнадзору право оперативно блокировать...

11:03

Укро-делегация привезла в Швейцарию ролик с ударом «Гераней» по Давосу

Ни в ЕС, ни в НАТО уже давно нет единства, а потому Украине приходится нагонять жути на Запад в надежде и дальше стравливать его с Россией.Как передает корреспондент «ПолитНавигатора», к такому выводу в статье, посвященной итогам последнего форума в...

11:25

Александр Коц: Мигранты: из школьного журнала - в полицейский

Мигранты: из школьного журнала - в полицейскийШколы будут обязаны сообщать в МВД о зачислении детей мигрантов в школы, отчислении и о результатах их тестирования на знание русского языка. Соответствующий закон вступит в силу до 28 января. В свою...

12:05

Зеленский:. «Белому шпицу Лукашенко оставлено больше прав, чем народу Белоруссии, к сожалению. Был шанс в 2020 году, чтобы это изменить, и, уверен, будет ещё шанс. Но тогда поддержки для белорусов было просто недостаточно»

Зеленский:«Белому шпицу Лукашенко оставлено больше прав, чем народу Белоруссии, к сожалению. Был шанс в 2020 году, чтобы это изменить, и, уверен, будет ещё шанс. Но тогда поддержки для белорусов было просто недостаточно».Где-то громко хохочут людоловы...

11:19

Территориальная часть "формулы Анкориджа" является для России принципиальной, отметил Песков

Другие заявления пресс-секретаря президента РФ:Путин постоянно получает прямые доклады от российских переговорщиков.На переговорах по украинскому урегулированию вряд ли возможно дружелюбие, но если они идут, нужно...

11:00

Индия встречает премьеры российского авиастроения

Индия встречает премьеры российского авиастроения Полностью российские «Суперджет» и Ил-114-300 прибыли в индийский Хайдарабад для участия в авиасалоне Wings India 2026В ходе перелета отечественные системы самолетов функционировали в штатном режиме....

11:20

Юрий Баранчик: Итоги СВО-недели: работает — не трогай

Итоги СВО-недели: работает — не трогайКлючевой сигнал прошедшей недели прозвучал не столько с линии фронта, сколько из тыла — через удары по энергетической инфраструктуре Украины. Повреждения ТЭЦ в Киеве и поражение...

11:07