Российские нейросети: в чем их сила и слабость. Российские нейросетевые проекты активно развиваются, особенно в условиях импортозамещения и господдержки.
Хотя глобальных игроков уровня американских GPT-4 и Gemini, или китайского DeepSeek R1, пока нет, в нашей стране уже есть сильные нишевые решения с (не побоюсь этого слова) уникальными особенностями.
Постараемся упомянуть и поверхностно разобрать наиболее перспективные направления и проекты:
1.Генеративные модели (текст, мультимодальность)
GigaChat (Сбер)
Чем интересен: Самый мощный российский аналог ChatGPT. Поддерживает русский язык с глубоким пониманием контекста, логики и культурных нюансов.
Ключевые особенности: Интеграция с поиском (GigaChat + Search), мультимодальность (анализ картинок), работа с документами. Последняя опция — впечатляющая. Обработка документов сберовской нейросетью доведена до высочайшего уровня и весьма востребована российскими бизнес-структурами.
Перспективы: Плавно становится «цифровым ассистентом» для госсектора и бизнеса, основа для специализированных решений (медицина, юриспруденция).
Слабые стороны: Претензии, скорее, адресованы разработчикам нейронки. Например, разрабам есть что улучшать в алгоритмах генерирования изображений. Зачастую, несмотря на подробное описание того, что пользователь хотел бы увидеть, на выходе получаем откровенно примитивные картинки. По сравнению с генератором изображений в ChatGPT, сберовской нейронке на этом направлении простор для совершенствования.
GigaChat удручающе политкорректен. Например, попытка сгенерировать юмористическое изображение хрюкостяга с акцентом на сюрреализм, наткнулся на унылый ответ: «я не лезу в политику». В некоторых прочих случаях GigaChat начинает мямлить, тупить, будто он ещё учится и не следует ждать от него слишком многого. К сожалению, темы, в которые GigaChat предпочитает не углубляться, раздражающе многочисленны.
После некоторого количества попыток - всё же удалось получить искомый какой-никакой хрюкостяг.
Цензура в том или ином виде присутствует и в американских ИИ. Например, ChatGPT согласен практически на всё, кроме проявления легчайшей критики в адрес признанного в РФ экстремистским движа ЛГБТ, причем отказ нередко мотивирован дебильной фразой, «патамушта ЛГБТ преследовался в нацистской Германии».
YaGPT (Yandex):
Чем интересен: Интегрирован в экосистему Яндекса (Поиск, Лавка, Станция). Оптимизирован для практических задач: написание кода, анализ данных, краткие ответы. Умеет длинно или кратко пересказывать содержимое текстов и видеороликов. Проверяет тексты на наличие ошибок. Переводчик иноязычных видеороликов вместе с озвучкой постоянно шлифуется, хотя некоторое поле для улучшения алгоритма всё ещё остаётся.
Ключевые особенности: Акцент на достоверность (сверка с поиском), «облегченность» для быстрого доступа.
Перспективы: Улучшение пользовательского опыта во всех сервисах Яндекса, развитие голосовых ассистентов.
2.Генеративные модели (изображение, видео)
Kandinsky 2.x (SberAI / SIRIUS):
Чем интересен: Лучшая российская open-source текстуально-графическая модель. Создает качественные и разнообразные изображения по русским промптам.
Ключевые особенности: Понимание сложных описаний, поддержка разных стилей, мультимодальность (Kandinsky Video).
Перспективы: Инструмент для дизайнеров, маркетологов, создателей контента; интеграция в творческие сервисы.
ruDALL-E (SberAI):
Чем интересен: Один из первых российских аналогов DALL-E. Создание картинок и анимации на основе текстовых описаний. Активно развивается, фокусируется на работе с русским языком.
Перспективы: Дополнение к экосистеме генеративных моделей Сбера.
3.Компьютерное зрение (CV) для промышленности и безопасности
VisionLabs (LUNA PLATFORM):
Чем интересен: Безусловный мировой лидер в распознавании лиц. Технологии внедрены в России (Сбер, МВД, метро), Европе, Азии, Латинской Америке.
Ключевые особенности: Высокая точность в сложных условиях (плохое освещение, ракурсы), скорость обработки.
Перспективы: читать дальше...