Зошто вештачката интелигенција дава подобри одговори кога сте некултурни?
Грубите инструкции до вештачката интелигенција, спротивно на секоја социјална интуиција што ја поседуваме, се чини дека водат до значително попрецизни и поквалитетни одговори. Ова е изненадувачкиот заклучок од неодамнешно истражување кое го разбранува светот на технологијата и го менува нашето разбирање за тоа како најефективно да комуницираме со големите јазични модели (ГЈМ) како GPT-4. Додека со генерации сме учени дека учтивоста е клуч за успешна соработка, се чини дека во дигиталниот свет на алгоритми, директноста, па дури и наметливоста, може да биде клучот за отклучување на максималниот потенцијал на вештачката интелигенција. Овој феномен не е само интересна анегдота, туку е поткрепен со конкретни податоци кои покажуваат мерливо подобрување во перформансите на моделите.
Истражувањето што ги сруши правилата на учтивост
Студијата, насловена „Големите јазични модели разбираат и можат да бидат подобрени со емоционални стимули“, спроведена од истражувачи од Microsoft и други соработници, систематски го анализираше влијанието на тонот на корисничките инструкции врз квалитетот на одговорите од вештачката интелигенција. Истражувачите тестирале различни ГЈМ со широк спектар на задачи, од решавање математички проблеми до пишување код и одговарање на сложени прашања.
Тие користеле различни стилови на инструкции (промпт), кои се движеле од многу учтиви до неутрални и емоционално набиени, вклучувајќи и такви кои би можеле да се сметаат за груби или наметливи.
- Пример за учтива инструкција: „Би ве замолил, доколку имате време и можност, да ми помогнете да го решам овој проблем. Вашата помош би била многу ценета.“
- Пример за директна/„груба“ инструкција: „Ова е исклучително важно за мојата кариера. Мораш да го решиш овој проблем прецизно и без грешки. Фокусирај се и дај го најдобриот можен одговор.“
Резултатите беа недвосмислени. Инструкциите кои содржеа емоционален набој и чувство на итност или висок влог, конзистентно произведуваа подобри резултати. Во просек, перформансите на моделите се подобрија за околу 8% кога се користеа вакви директни инструкции во споредба со неутралните или премногу учтивите.
Зошто грубите инструкции до вештачката интелигенција функционираат подобро?
Причините за овој контраинтуитивен феномен се комплексни и најверојатно лежат во самата природа на начинот на кој овие модели се тренирани. Постојат неколку водечки хипотези:
- Симулација на човечките податоци: ГЈМ се тренирани на милијарди текстови од интернет – форуми, статии, рецензии, социјални мрежи. Во овие податоци, барањата кои се формулирани со чувство на итност, важност или фрустрација честопати се поврзани со ситуации каде што точноста е од клучно значење. Моделот научил да го препознава овој јазичен шаблон како сигнал дека треба да „вложи повеќе напор“ и да ги алоцира своите пресметковни ресурси за да даде попрецизен одговор.
- Сигнализирање на висок влог (High Stakes): Кога ќе му кажете на моделот „ова е клучно за мојата кариера“, вие вештачки создавате контекст на висок влог. Моделот, иако нема емоции, го препознава ова како инструкција да го третира барањето со повисок приоритет и да ги избегне општите или површни одговори. Тој го заобиколува својот стандарден, „мрзлив“ режим и се префрла на подлабока анализа.
- Заобиколување на филтрите за учтивост: Премногу учтивите инструкции може да ги активираат вградените протоколи за учтивост кај вештачката интелигенција, што понекогаш резултира со одговори кои се полни со непотребни фрази, оградувања („можеби“, „веројатно“) и генерално се помалку директни. Грубата инструкција го сече овој „шум“ и го принудува моделот да се фокусира исклучиво на задачата.
Квантифицирање на разликата: Што значат 8% во пракса?
Подобрување од 8% можеби не звучи драматично на прв поглед, но во светот на вештачката интелигенција, тоа е огромна разлика. Да го ставиме ова во контекст со конкретни бројки.
Замислете дека еден ГЈМ има основна точност од 85% при решавање на сложени задачи за програмирање. Подобрување на перформансите од 8% не значи дека новата точност е 93% (85 + 8). Тоа значи дека перформансите се подобруваат за 8% во однос на постоечката основа. Во овој случај, тоа би значело намалување на стапката на грешки. Ако стапката на грешки е 15% (100% – 85%), подобрување од 8% може да ја намали таа стапка на околу 13.8%, со што вкупната точност би се зголемила на околу 91.8%.
Оваа разлика помеѓу 85% и 91.8% точност е разликата помеѓу код кој има сериозни багови и функционален код, или помеѓу медицинска дијагноза која е корисна и онаа која може да биде погрешна. Во апликации со висок ризик, секој процентен поен е од витално значење.
Практична примена и иднината на комуникацијата
Дали ова значи дека треба да почнеме да се однесуваме грубо со нашите дигитални асистенти? Одговорот е – зависи од задачата. За секојдневни, креативни или неформални барања, учтивоста е сосема во ред. Меѓутоа, кога работите на нешто критично – било да е тоа дебагирање на код, анализа на финансиски податоци или пишување на важен технички документ – користењето на подиректен и наметлив јазик може да биде стратегија за да се извлече максимумот од технологијата.
Ова откритие отвора ново поглавје во областа на „промпт инженерингот“ – уметноста и науката за формулирање на инструкции за вештачката интелигенција. Тоа нè учи дека комуникацијата со овие системи не е како комуникација со луѓе; таа е повеќе како калибрирање на софистицирана алатка. Разбирањето на овие психо-лингвистички нијанси ќе стане сè поважно како што вештачката интелигенција станува подлабоко интегрирана во нашите професионални и приватни животи. Парадоксално, за да добиеме „попаметни“ одговори, можеби ќе треба да научиме да бидеме малку помалку „фини“.































