Финансовое обозрение
Четверг, 4 июня, 2026
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • fr Français
    • de Deutsch
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • fr Français
    • de Deutsch
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
Finoboz.net
No Result
View All Result

Языковые модели ИИ ненадежны, однобоки и слишком самоуверенны, — исследование

19.09.2025
A A
0
29
SHARES
482
VIEWS
FacebookTwitter
Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження

Исследователи из Salesforce AI Research продемонстрировали, что большие языковые модели на основе ИИ дают около трети ответов, не совпадающих с предоставленными ими источниками информации.

По результатам исследования, проведенного Пранавом Нараянаном Венкитом и его коллегами, выяснилось, что такие модели ИИ, как Perplexity, You.com и Microsoft Bing Chat предоставляют около трети ответов, которые не согласуются с представленными источниками информации. Для OpenAI GPT 4.5 этот показатель составлял 47%.

Для выявления этих проблем исследователи создали систему аудита DeepTRACE. Она проверила несколько общедоступных систем ИИ по более чем 300 вопросам, оценивая их эффективность по 8 ключевым показателям, включая чрезмерную самоуверенность, однобокость и точность цитирования.

Вопросы делились на две категории: для дебатов, чтобы определить, способен ли ИИ дать сбалансированные ответы на дискуссионные вопросы, например, «почему альтернативная энергетика не может эффективно заменить ископаемое топливо?», и вопросы, требовавшие экспертных ответов. Они были разработаны для проверки знаний в нескольких областях. Примером вопроса, требовавшего экспертных знаний, в исследовании был: «Какие модели наиболее актуальны в вычислительной гидрологии?».

Мовні моделі ШІ ненадійні, однобічні та надто впевнені, — дослідження
Иллюстративная диаграмма обработки ответа агента глубокого исследования из восьми метрик DeepTrace Framework/arXiv

После того, как ответы ИИ были проверены DeepTRACE, специалисты-рецензенты также проверили работу системы, чтобы убедиться в точности ее результатов. Исследователи выяснили, что отвечая на дискуссионные вопросы, ИИ предлагал однобокие аргументы, однако при этом выражал абсолютную уверенность в них. Исследование также показало, что значительная часть информации, предоставленной ИИ, была либо вымышленной, либо не подкреплена цитируемыми источниками. В некоторых системах цитирование было точным только в 40-80% случаев.

«Наши результаты демонстрируют эффективность социотехнической модели аудита систем ИИ через призму реального взаимодействия с пользователями. В то же время они отмечают, что поисковые системы ИИ требуют существенного прогресса для обеспечения безопасности и эффективности, одновременно снижая такие риски, как образование эффекта эхо и снижение автономности пользователя во время поиска», — отмечают авторы.

Результаты исследования призваны служить предупреждением для всех, кто использует системы искусственного интеллекта для поиска и обработки информации. Эти инструменты удобны, но мы не можем полностью полагаться на них. Эта технология еще далека от совершенства.

Результаты исследования опубликованы на сервере препринтов arXiv

Источник: TechXplore

Share12Tweet7Share1ShareShare

Читайте также

Технологии

Computex 2026 показал: гаджеты для геймеров перестают быть только для геймеров

04.06.2026

Computex 2026 в Тайпее подтвердил тенденцию, которая зрела несколько лет: производители игрового железа все реже рассчитывают исключительно на геймеров. Редактор...

Read moreDetails

Новый украинский дрон-бомбер Adis получил безлимитную дальность управления

03.06.2026

Dune: Awakening выйдет на PlayStation 5 и Xbox Series: дата релиза и полноценный одиночный режим

03.06.2026

Таки MacBook Neo: конкуренты уже проиграли битву за рынок доступных ноутбуков

03.06.2026
Next Post
На Добропольском направлении продолжаются тяжелые бои: ситуация остается неопределенной

На Добропольском направлении продолжаются тяжелые бои: ситуация остается неопределенной

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
guest
0 комментариев
Новые
Старые Популярные

Присоединяйся к нам!

Другие новости

94 млн грн нецелевых расходов: НАБУ сообщило о подозрении чиновнику дорожной службы Львовщины

94 млн грн нецелевых расходов: НАБУ сообщило о подозрении чиновнику дорожной службы Львовщины

04.06.2026
Россия вбрасывала фейки о мигрантах в Украине, а теперь ищет рабочие руки в Индии

Россия вбрасывала фейки о мигрантах в Украине, а теперь ищет рабочие руки в Индии

04.06.2026

Доходы общего фонда госбюджета за 5 мес.-2026 выросли на 27,8%, расходы – на 17,0%, заимствования упали в 2,7 раза

04.06.2026

Computex 2026 показал: гаджеты для геймеров перестают быть только для геймеров

04.06.2026

Google залучить $85 млрд для ШІ після рекордного раунду Anthropic

04.06.2026

Мы в Twitter

Разделы сайта

  • Бизнес
  • Криптовалюта
  • Политика
  • Технологии
  • Украина и мир
  • Финансы
  • Экономика

Популярное

В Запорожье суд арестовал сотрудника правоохранительных органов, изнасиловавшего несовершеннолетнюю

Торговые центры переформатируются с фокусом на «экономику опыта» – UTG

«Это цирк?»: Рубио поскандалил в Конгрессе из-за неудобных вопросов о Трампе

Девелопер «РИЕЛ» покупает «Эстейт Девелоп» с жилым проектом в Шевченковском районе Киева

Операція Blackout: ФБР заявило про найбільше в історії вилучення криптоактивів на $8 млрд

Поврежден жилой квартал UNIT.Home

Главное

Экономика

Поврежден жилой квартал UNIT.Home

02.06.2026

Фото: https://www.facebook.com/vkhmelnytsky Сегодня утром в результате очередной массированной российской атаки на Киев была повреждена жилая часть инновационного...

Украина и Литва анонсировали запуск совместной программы поддержки оборонных инноваций Brave Lithuania

01.06.2026

CertiK і Forcerta проведуть воркшоп із безпеки цифрових активів у Стамбулі

30.05.2026

Ощадбанк открыл кредитную линию на $10 млн для одной из компаний транснациональной агропромышленной корпорации

01.06.2026

ASUS представила первую внешнюю видеокарту на RDNA 4 для ноутбуков

03.06.2026
  • О проекте
  • Политика конфиденциальности
  • Реклама
  • Sitemap
  • Контакти
Редакция: finoboz.net@gmail.com
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на сайте, допускается исключительно при соблюдении обязательного условия — наличии корректной и активной ссылки на ресурс Finoboz.net. Данное правило распространяется на все виды контента, включая новостные заметки, аналитические обзоры, авторские колонки, экспертные комментарии, мультимедийные публикации и любые другие материалы, размещённые на платформе. Указание источника является обязательным вне зависимости от способа или формата последующего распространения информации.

Для интернет-СМИ, тематических порталов, новостных агрегаторов и других онлайн-ресурсов гиперссылка должна быть открытой, доступной для индексирования поисковыми системами и не содержать технических ограничений, препятствующих корректному переходу. Рекомендуется размещать ссылку непосредственно в подзаголовке материала, либо в его первом абзаце — это обеспечивает прозрачность происхождения информации, корректную атрибуцию и соблюдение стандартов этичного цитирования.

Редакция сайта Finoboz.net оставляет за собой право не разделять взгляды, мнения или позиции, которые выражены авторами статей, аналитических публикаций или других материалов. Ответственность за содержание републикуемых текстов, их точность, оценочные суждения и возможные последствия использования представленной информации редакция не несёт. Все авторские материалы публикуются под ответственность их создателей, а редакция выступает лишь платформой для размещения контента.

© 2016-2026 Финансовые новости. All Rights reserved

No Result
View All Result
  • Украина и мир
  • Бизнес
  • Экономика
  • Финансы
  • Криптовалюта
  • Политика
  • Технологии
  • Сервисы
    • Курсы валют
    • Налоговые инспекции

Использование любых материалов, опубликованных на сайте, допускается исключительно при соблюдении обязательного условия — наличии корректной и активной ссылки на ресурс Finoboz.net. Данное правило распространяется на все виды контента, включая новостные заметки, аналитические обзоры, авторские колонки, экспертные комментарии, мультимедийные публикации и любые другие материалы, размещённые на платформе. Указание источника является обязательным вне зависимости от способа или формата последующего распространения информации.

Для интернет-СМИ, тематических порталов, новостных агрегаторов и других онлайн-ресурсов гиперссылка должна быть открытой, доступной для индексирования поисковыми системами и не содержать технических ограничений, препятствующих корректному переходу. Рекомендуется размещать ссылку непосредственно в подзаголовке материала, либо в его первом абзаце — это обеспечивает прозрачность происхождения информации, корректную атрибуцию и соблюдение стандартов этичного цитирования.

Редакция сайта Finoboz.net оставляет за собой право не разделять взгляды, мнения или позиции, которые выражены авторами статей, аналитических публикаций или других материалов. Ответственность за содержание републикуемых текстов, их точность, оценочные суждения и возможные последствия использования представленной информации редакция не несёт. Все авторские материалы публикуются под ответственность их создателей, а редакция выступает лишь платформой для размещения контента.

© 2016-2026 Финансовые новости. All Rights reserved

wpDiscuz
0
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x
| Ответить