Chat GPT-4: как пользоваться нейросетью через Bing AI и что она умеет

Как пользоваться GPT-4 и что может новое поколение нейросети

14 марта компания OpenAI представила ИИ-модель GPT-4 — и сразу объявила о ее внедрении в приложения и сервисы.

Языковая модель известна в первую очередь по ChatGPT — прорывному ИИ-боту , с которым можно общаться, просить написать тексты любой сложности и искать информацию. GPT-4 намного мощнее нейросети в основе ChatGPT, которая работала на предыдущей версии, GPT-3.5 . Новое поколение не только запоминает контекст и подстраивается под запросы пользователя, но и умеет обрабатывать изображения, а также «демонстрирует уровень человека» в ряде академических и профессиональных тестов.

Рассказываю, чем интересна GPT-4 , которую уже начали внедрять в привычные сервисы вроде поисковика Microsoft Bing и приложения Duolingo.

УЧЕБНИК Т—Ж Новинка: курс о дружбе с нейросетями Бесплатный курс поможет попробовать новые технологии и завести личного нейроассистента

Программа курса

Что может GPT-4

Обрабатывает не только текст, но и изображения. Это самое заметное отличие от привычного GPT-3.5 . Новая мультимодальная модель научилась считывать изображения, понимать их контекст и работать с запросами на основе картинок. Можно отправить нейросети фото, график, скриншот или мем, а потом уже строить от этого текстовый запрос. Например, сфотографировать содержимое холодильника и предложить составить блюдо из продуктов в наличии.

Отвечает GPT-4 все еще только в текстовом виде, нельзя попросить нарисовать что-то . Также возможность обработки картинок пока есть только для ограниченного числа бета-тестеров и компаний. OpenAI обещает более широкое внедрение функции позже.

Обложка статьи

Обработка изображений в GPT-4 — пример OpenAI

Пользователь: что забавного в этой картинке? Опиши кадр за кадром.

GPT-4 : на картинке — три панели с упаковкой адаптера Lightning.

Первая панель: смартфон с воткнутым VGA-адаптером (большой синий 15-контактный штекер, который обычно используют для компьютерных мониторов).

Вторая панель: упаковка от кабеля Lightning с изображением VGA-адаптера .

Третья панель: крупный план VGA-адаптера с небольшим штекером Lightning (используется для зарядки Айфонов и других устройств Apple) на конце.

Юмор — в абсурдности подключения большого и устаревшего VGA-адаптера к маленькому и современному порту для зарядки смартфона.

У работы с картинками есть и другие сценарии. Во время трансляции OpenAI выступил сооснователь компании Грег Брокман. Он сфотографировал лист своего блокнота с наброском макета сайта: название My Joke Website и страница с двумя «действительно смешными шутками», самая смешная часть которых должна показываться по нажатию кнопки.

Брокман загрузил фото в нейросеть и попросил: «Напиши код HTML/JS , чтобы превратить этот макет в красочный веб-сайт , где шутки заменены двумя настоящими шутками». Та написала код для простого сайта с учетом пожеланий.

Простой макет тестового сайта от руки. Источник: твиттер-аккаунт @gdb

Расширяет возможности работы с текстом. В OpenAI предупреждают: в бытовом общении и простых задачах разница между GPT-3.5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. GPT-4 на фоне предшественника более надежна, креативна и способна работать с «тонкими сценариями».

GPT-4 гораздо гибче подстраивается под пользователя, когда тот просит нейросеть отыгрывать определенную роль и придерживаться конкретной стилистики ответов. Также языковая модель лучше учитывает контекст, который ей дает человек. Для этого лимит на сообщение с текстовым запросом увеличили до 25 тысяч слов. Это значит, что GPT-4 можно отправлять целые документы и большие отрывки произведений.

Сдает сложные экзамены на уровне отличников. Это как раз результат того, что новая версия лучше справляется с нетривиальными задачами. Например, языковая модель могла бы поступить в Стэнфордский университет или победить на олимпиаде по биологии. За американский адвокатский экзамен Bar нейросеть получила оценку, сравнимую с результатами 10% лучших участников-людей.

Результаты различных экзаменов — сравнение GPT⁠-⁠4 и GPT⁠-⁠3.5. Источник: openai.com

Гораздо лучше работает с русским языком. Разработчики OpenAI отмечают, что GPT-3.5 хорошо работала преимущественно на английском языке. С ним она показывала результат 70,1% точности в бенчмарке MMLU — специальном тесте для языковых моделей, который состоит из 14 тысяч задач по 57 предметам.

Чтобы проверить GPT-4 , разработчики перевели бенчмарк на 26 языков. В 24 случаях четвертое поколение модели показало результат выше, чем результат предшественника на «родном» английском. Согласно отчету OpenAI, результат для русского языка — 82,7%, это восьмое место в общем рейтинге. Лучший результат у нейросети на английском — 85,5%.

Обложка статьи

Все ли проблемы ChatGPT решили в GPT-4

Нет, не все. Сооснователь OpenAI Сэм Альтман признается: модель все еще «несовершенна и лимитирована». Новая версия кажется гораздо более впечатляющей при первом использовании, чем после активной работы с ней. Вот две главные проблемы, которые пока не решили.

Нейросеть все еще галлюцинирует. Галлюцинациями называют ошибки языковых моделей, когда те уверенно пишут полную неправду и выдают ее за факт. Поэтому в OpenAI советуют проводить дополнительную проверку всех ответов.

Обложка статьи

В то же время разработчики заявляют, что четвертое поколение на 40% лучше предыдущей версии по внутренней шкале «оценки фактов». Наибольшего прогресса нейросеть достигла в темах истории и точных наук. Больше всего ошибок проявляется при просьбе сгенерировать код и в целом при работе с кодом.

Результаты GPT⁠-⁠4 при решении задач на платформе Leetcode. Источник: openai.com

Нейросеть все еще не оперирует актуальными данными. Набор данных, на которых обучали предыдущую версию, был ограничен осенью 2021 года. То есть о любых новостях и фактах, которые появлялись после этого, GPT-3.5 не знала. И не могла учитывать новую информацию при ответах. В новой версии ситуация не изменилась.

Как пользоваться GPT-4

Вместе с презентацией технологии в ChatAI объявили, что GPT-4 появится или уже появился в ряде сервисов. Разработчики отметили, что модель используют даже власти Исландии для сохранения своего языка.

Вот где заявлена поддержка обновленной версии.

ChatGPT — бесплатная версия продолжит работать на GPT-3.5 , а GPT-4 появился в платной подписке Plus. Пока использовать нейросеть можно с ограничениями — не более 100 запросов в течение четырех часов.

Bing — OpenAI и Microsoft тесно сотрудничают, последняя даже сделала для развития GPT суперкомпьютер. В поисковике Bing технологии OpenAI появились совсем недавно, и теперь компания подтвердила, что сервис работает на GPT-4 . Bing — пока единственный способ попробовать нейросеть, которая располагает актуальными данными о мире.

Chat GPT-4: как пользоваться нейросетью через Bing AI и что она умеет

Как пользоваться GPT-4 и что может новое поколение нейросети

Что может GPT-4

Обработка изображений в GPT-4 — пример OpenAI

Все ли проблемы ChatGPT решили в GPT-4

Как пользоваться GPT-4

Скачать книгу «Chat GPT-4: как пользоваться нейросетью через Bing AI и что она умеет» fb2

Коментарии