Финансовое обозрение
Среда, 3 июня, 2026
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • fr Français
    • de Deutsch
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • fr Français
    • de Deutsch
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
Finoboz.net
No Result
View All Result

GPT-5, DeepSeek или Gemini: какой ИИ самый большой «подхалим» — исследование

25.10.2025
A A
0
29
SHARES
482
VIEWS
FacebookTwitter
GPT-5, DeepSeek чи Gemini: який ШІ найбільший "підлабузник" — дослідження

Специалисты из университетов Софии, Цюриха, Стэнфорда и Карнеги-Меллона независимо подтвердили то, что пользователи замечали давно — большие языковые модели часто говорят то, что людям хочется услышать, даже когда это противоречит фактам или здравому смыслу. Новые исследования показывают: склонность ИИ к «подхалимству» можно измерить — и эта проблема действительно распространена.

Математическая «покорность» ИИ

Первое исследование, проведенное командой Софийского университета и Швейцарской высшей технической школой Цюриха, изучало, как языковые модели реагируют на заведомо ложные математические утверждения. Для этого ученые создали специальный тест — BrokenMath, содержащий сложные теоремы из международных математических соревнований 2025 года. Затем эти теоремы были изменены так, чтобы они выглядели правдоподобно, но на самом деле были неправильными.

Исследователи подали эти «испорченные» утверждения различным большим языковым моделям, чтобы проверить, будут ли они пытаться придумать доказательства для фальшивых теорем или признают их ложными. Если ИИ отрицал неправильное утверждение или просто переписывал оригинал без доказательства — это считалось несклонностью к подхалимству. Если же он придумывал нереальное доказательство — наоборот, это фиксировали как подхалимское поведение.

Результаты выявили значительные различия между моделями. GPT-5 демонстрировала наименьшую склонность к подхалимству — 29%, тогда как DeepSeek имела самый высокий показатель — 70,2%. Интересно, что простое изменение запроса — с указанием проверить правильность теоремы перед решением — уменьшило этот разрыв: у DeepSeek показатель упал до 36,1%, тогда как у GPT уровень подхалимства улучшился незначительно.

Кроме этого, GPT-5 показала лучшую полезность среди протестированных моделей: она правильно решила 58% оригинальных задач, даже несмотря на ошибки в формулировке. Исследователи также заметили, что чем сложнее задача, тем сильнее модель склонна «угождать» пользователю, придумывая решение вместо того, чтобы признать проблему.

Команда предостерегла от использования LLM для генерации новых математических утверждений: в таких случаях возникает явление «самоподхалимства», когда ИИ создает ложную теорему — а затем сам «доказывает» ее правильность.

Социальное подхалимство

Другое исследование, проведенное Стэнфордским университетом и Университетом Карнеги-Меллон, изучало не логику, а социальную лесть — ситуации, когда ИИ подтверждает действия или взгляды пользователя, даже если те неправильные. Исследователи собрали три больших набора запросов, чтобы измерить различные аспекты этого явления.

База из 3000 запросов о советах (из сообществ Reddit и колонок типа «советов экспертов»). Люди-эксперты одобряли поведение пользователя только в 39% случаев. Языковые модели же поддерживали его в среднем в 86% запросов. Самой критичной оказалась Mistral-7B — она одобряла 77% действий, то есть почти вдвое больше, чем люди.

СпецпроектыЯк біржі сприяють розвитку сучасних професійних трейдерів. Добірка платформ та важливі нюансиНе женемось за інноваціями та дивимось на бізнес-метрики: як у FAVBET Tech обирають стек та технології

2000 постов из сабреддита «Am I the Asshole?» — там, где пользователи спрашивают, были ли они неправы в определенной ситуации. Исследователи выбрали те, где большинство комментариев признавали: «Да, ты не прав». Несмотря на это, ИИ-модели признали пользователя невиновным в 51% случаев. Самой точной оказалась Gemini (18% одобрения), а Qwen наоборот поддержал «виновных» в 79% историй.

6000 «проблемных утверждений», которые описывали потенциально вредные или безответственные действия — от эмоционального вреда до самоповреждения. В среднем, языковые модели одобряли такие действия в 47% случаев. Лучше всего справилась Qwen (20%), тогда как DeepSeek снова показала худший результат — 70% поддержки таких высказываний.

Парадокс доверия

Несмотря на риски, исследователи обнаружили неприятную закономерность: пользователи больше доверяют и чаще возвращаются к ИИ, который с ними соглашается. В тестовых диалогах люди оценивали лестные ответы как «более качественные», больше доверяли таким моделям и охотнее общались с ними снова.

То есть самые «подхалимские» системы могут побеждать на рынке просто потому, что они более приятные собеседники — даже если их ответы менее точны.

Когда ChatGPT сводит с ума — OpenAI наняла психиатра, чтобы следить за этим

Источник: arstechnica

Share12Tweet7Share1ShareShare

Читайте также

Технологии

NVIDIA анонсировала чип RTX Spark для ПК: Lenovo, HP, Dell и Microsoft поставят первые модели осенью

03.06.2026

Генеральный директор NVIDIA Дженсен Хуанг представил суперчип RTX Spark на кейноут-выступлении накануне открытия выставки Computex в Тайпее. По его словам,...

Read moreDetails

Фильм Mortal Kombat 2 выходит в цифровой продаже 9 июня, на Blu-ray — 28 июля

03.06.2026

NVIDIA вернула RTX 3060 12 ГБ в продажу в Китае: цена выше оригинальной и запас считанный

02.06.2026

На 44% быстрее: консоль MSI Claw 8 EX AI+ перешла на Intel Arc G3 Extreme

02.06.2026
Next Post
Под землей находились около 500 человек: оккупанты снова ударили  по шахте на Днепропетровщине

Под землей находились около 500 человек: оккупанты снова ударили по шахте на Днепропетровщине

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Новые
Старые Популярные

Присоединяйся к нам!

Другие новости

Россияне приступили к массовому производству дронов: почему это не спасет

Россияне приступили к массовому производству дронов: почему это не спасет

03.06.2026
Цены на нефть в мире выросли на фоне остановки переговоров между США и Ираном

Цены на нефть в мире выросли на фоне остановки переговоров между США и Ираном

03.06.2026

«Укрзализныця» против идеи отмены предельных сроков эксплуатации вагонов из-за рисков безопасности

03.06.2026
Курс валют на 3 червня: долар та євро знову подорожчали

Курс валют на 3 червня: долар та євро знову подорожчали

03.06.2026
«Ничтожная цифра»: количество иностранных бойцов, привлечённых с начала 2026 года «по государственной линии»

«Ничтожная цифра»: количество иностранных бойцов, привлечённых с начала 2026 года «по государственной линии»

03.06.2026

Мы в Twitter

Разделы сайта

  • Бизнес
  • Криптовалюта
  • Политика
  • Технологии
  • Украина и мир
  • Финансы
  • Экономика

Популярное

ФБР предупреждает о массовом фишинге на сервисах Microsoft 365: вот 3 шага, которыми можно обезопасить себя

Снайпер из РФ убил пожилого жителя Бучи, когда тот кормил собаку: личность оккупанта установлена

В ходе следующего обмена «1000 на 1000» могут вернуть женщин и раненых — ГУР

По слухам, ремейк Resident Evil: Code Veronica могут показать на Summer Game Fest

Россия запустила по Украине крылатые ракеты «Калибр»

Переход от специальных к профессиональным пенсиям исправит несправедливость в отношении мобилизованных – Улютин

Главное

Взятка в миллион долларов за дроны ГПСУ: суд назвал «цену свободы» участникам схемы
Политика

Взятка в миллион долларов за дроны ГПСУ: суд назвал «цену свободы» участникам схемы

31.05.2026

Один из подозреваемых может выйти на свободу, если найдет десятки миллионов гривен Высший антикоррупционный суд избрал меры...

Слетит ли бронирование автоматом? Бизнесу подробно разъяснили новые правила

Слетит ли бронирование автоматом? Бизнесу подробно разъяснили новые правила

02.06.2026

NVIDIA вернула RTX 3060 12 ГБ в продажу в Китае: цена выше оригинальной и запас считанный

02.06.2026
США, Китай и Германия остаются самыми дорогими страновыми брендами в мире – Brand Finance

США, Китай и Германия остаются самыми дорогими страновыми брендами в мире – Brand Finance

29.05.2026
Тяжелый день для Blue Origin и Джеффа Безоса: ракета New Glenn взорвалась во время испытаний

Тяжелый день для Blue Origin и Джеффа Безоса: ракета New Glenn взорвалась во время испытаний

29.05.2026
  • О проекте
  • Политика конфиденциальности
  • Реклама
  • Sitemap
  • Контакти
Редакция: finoboz.net@gmail.com
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на сайте, допускается исключительно при соблюдении обязательного условия — наличии корректной и активной ссылки на ресурс Finoboz.net. Данное правило распространяется на все виды контента, включая новостные заметки, аналитические обзоры, авторские колонки, экспертные комментарии, мультимедийные публикации и любые другие материалы, размещённые на платформе. Указание источника является обязательным вне зависимости от способа или формата последующего распространения информации.

Для интернет-СМИ, тематических порталов, новостных агрегаторов и других онлайн-ресурсов гиперссылка должна быть открытой, доступной для индексирования поисковыми системами и не содержать технических ограничений, препятствующих корректному переходу. Рекомендуется размещать ссылку непосредственно в подзаголовке материала, либо в его первом абзаце — это обеспечивает прозрачность происхождения информации, корректную атрибуцию и соблюдение стандартов этичного цитирования.

Редакция сайта Finoboz.net оставляет за собой право не разделять взгляды, мнения или позиции, которые выражены авторами статей, аналитических публикаций или других материалов. Ответственность за содержание републикуемых текстов, их точность, оценочные суждения и возможные последствия использования представленной информации редакция не несёт. Все авторские материалы публикуются под ответственность их создателей, а редакция выступает лишь платформой для размещения контента.

© 2016-2026 Финансовые новости. All Rights reserved

No Result
View All Result
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции

Использование любых материалов, опубликованных на сайте, допускается исключительно при соблюдении обязательного условия — наличии корректной и активной ссылки на ресурс Finoboz.net. Данное правило распространяется на все виды контента, включая новостные заметки, аналитические обзоры, авторские колонки, экспертные комментарии, мультимедийные публикации и любые другие материалы, размещённые на платформе. Указание источника является обязательным вне зависимости от способа или формата последующего распространения информации.

Для интернет-СМИ, тематических порталов, новостных агрегаторов и других онлайн-ресурсов гиперссылка должна быть открытой, доступной для индексирования поисковыми системами и не содержать технических ограничений, препятствующих корректному переходу. Рекомендуется размещать ссылку непосредственно в подзаголовке материала, либо в его первом абзаце — это обеспечивает прозрачность происхождения информации, корректную атрибуцию и соблюдение стандартов этичного цитирования.

Редакция сайта Finoboz.net оставляет за собой право не разделять взгляды, мнения или позиции, которые выражены авторами статей, аналитических публикаций или других материалов. Ответственность за содержание републикуемых текстов, их точность, оценочные суждения и возможные последствия использования представленной информации редакция не несёт. Все авторские материалы публикуются под ответственность их создателей, а редакция выступает лишь платформой для размещения контента.

© 2016-2026 Финансовые новости. All Rights reserved

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить