Чат-боты GPT-3.5 и GPT-4 «тупеют» — точность вычислений упала на 95,2 % за несколько месяцев | Нейросети и AI | Новости | Клуб DNS

Чат-боты GPT-3.5 и GPT-4 «тупеют» — точность вычислений упала на 95,2 % за несколько месяцев

Международная группа ученых решила проверить, как сильно меняется точность работы популярных чат-ботов GPT-3.5 и GPT-4 с течением времени. Информация об этом появилась на сайте arxiv.org.

Работа ИИ-моделей проверялась за период с марта по июнь текущего года по четырем направлениям: решение математических задач, ответы на «опасные» вопросы, генерация кода и визуальное мышление. В итоге авторы эксперимента выяснили, что производительность и точность чат-ботов может сильно меняться в короткие промежутки времени. И иногда не в лучшую сторону.

Самый плохой результат показала модель GPT-4 в решении математических задач. Если в марте 2023 года точность решения составляла 96,7 %, то в июне она упала до рекордных 2,4 %. Правда, для GPT-3.5 ситуация иная — точность решения за вышеуказанный период выросла с 7,4 % до 86,8 %.

Есть проблемы и в генерации кода. В марте из 50 предложенных задач LeetCode ИИ-модель GPT-4 решила 50 %. В июне чат-бот справился только с 10 % работы.

По мнению ученых, разработчики должны постоянно контролировать качество работы чат-ботов.

Чат-боты GPT-3.5 и GPT-4 «тупеют» — точность вычислений упала на 95,2 % за несколько месяцев | Нейросети и AI | Новости | Клуб DNS

Чат-боты GPT-3.5 и GPT-4 «тупеют» — точность вычислений упала на 95,2 % за несколько месяцев

Скачать книгу «Чат-боты GPT-3.5 и GPT-4 «тупеют» — точность вычислений упала на 95,2 % за несколько месяцев | Нейросети и AI | Новости | Клуб DNS» fb2

Коментарии