
изобпажение: iStock
След месеци на слухове и спекулации OpenAI обяви GPT-4 - най-новия сред езиковите модели на AI, които захранват приложения като ChatGPT и новия Bing.
По-креативен от всякога
Компанията твърди, че моделът е „по-креативен от всякога“ и „може да решава трудни задачи с по-голяма точност“. Той може да анализира както текст, така и въведени изображения, въпреки че може да отговаря само чрез текст. От OpenAI уточняват, че системите запазват много от същите проблеми като по-ранните езикови модели, включително тенденция за измисляне на информация (или „халюциниране“) и капацитет за генериране на насилствен и вреден текст.
OpenAI вече си партнира с редица компании за интегриране на GPT-4 в техните продукти. Сред тях са Duolingo, Stripe и Khan Academy. Новият модел е достъпен за широката публика чрез ChatGPT Plus, месечен абонамент за ChatGPT на OpenAI за $20 и захранва чатбота Bing на Microsoft . Той също така ще бъде достъпен като API за разработчици, върху който да надграждат.
Разликата между GPT-4 и неговия предшественик GPT-3.5 е „незабележима“ в непринуден разговор (GPT-3.5 е моделът, който захранва ChatGPT).
Главният изпълнителен директор на OpenAI Сам Алтман написа в Туитър, че GPT-4 „все още има недостатъци, все още е ограничен“, но също така „все още изглежда по-впечатляващ при първа употреба, отколкото след като прекарате повече време с него“.
Подобренията на GPT-4 са очевидни в представянето на системата при редица тестове и показатели, включително Uniform Bar Exam, LSAT, SAT Math и SAT Evidence-Based Reading & Writing изпити.
Ще оправдае ли високите очаквания?
Очакванията по отношение на GPT-4 и неговите възможности са огромни. Надеждата е, че това ще бъде огромен скок в сравнение с предишните системи. „Хората се молят да бъдат разочаровани и те ще бъдат“, парира Алтман още през януари.
Много изследователи на AI вярват, че мултимодалните системи, които интегрират текст, аудио и видео, предлагат най-добрия път към изграждането на по-способни AI системи. GPT-4 наистина е мултимодален, но в по-малко среди, отколкото някои прогнозираха. OpenAI казва, че системата може да приема както текстови, така и графични входящи материали и да ги преработва в текстови на изхода. Способността на модела да анализира текст и изображение едновременно му позволява да интерпретира по-сложни входни данни.
Суматохата
OpenAI първоначално забави пускането на своите GPT модели от страх, че ще бъдат използвани за злонамерени цели като генериране на спам и дезинформация. Но в края на 2022 г. компанията стартира ChatGPT — разговорен чатбот, базиран на GPT-3.5, до който всеки може да има достъп. Стартирането на ChatGPT предизвика невиждана лудост в технологичния свят. Microsoft скоро го последва със своя собствен AI чатбот Bing (част от търсачката Bing) и Google, които се опитват да наваксат.
Проблеми и грешки
Както се очакваше, разпространението на тези езикови модели на ИИ създаде проблеми и предизвикателства. Образователната система все още се адаптира към съществуването на софтуер, който пише достойни за колеж есета. Онлайн сайтове като Stack Overflow и научно-фантастичното списание Clarkesworld спряха да приемат текстове от потребителите си, заради наплива на съдържание, генерирано от AI. Първите експерименти с изкуствения интелект, на който е поръчано да напише журналистически текстове, се оказаха доста нестабилни и озадачаващи. Въпреки всичко това много експерти твърдят, че вредните ефекти все още са по-малко от очакваното.
Например Microsoft разкри, че неговият чатбот Bing е бил захранван от GPT-4 през цялото време и много потребители са успели да разбият предпазните огради на Bing по всякакви креативни начини, карайки бота да предлага опасни съвети, да заплашва потребителите и да измисля информация.