AI technologijos teikia vis didesnę įtaką įvairiose srityse. Viena iš naujausių ir įdomiausių šių technologijų evoliucijų yra promptų technikos – konkrečiau, minties grandinės (CoT) promptavimas. Ši technika leidžia didiesiems kalbos modeliams efektyviau spręsti sudėtingas užduotis, imituojant žmogaus mąstymo procesą.

Promptų technika ir jos evoliucija

Promptų technika – tai būdas, kaip mes kalbame su AI, nurodydami jam, ką norime gauti kaip atsakymą. Tradiciškai, promptai buvo gana tiesioginiai, pavyzdžiui, prašant išversti sakinį iš vienos kalbos į kitą ar apibūdinti tam tikrą sąvoką. Tačiau su minties grandinės (CoT) promptavimo atsiradimu situacija pasikeitė dramatiškai.

Kas yra Minties Grandinės Promptavimas?

Minties grandinės promptavimas – tai technika, leidžianti AI išskleisti problemą į seriją žingsnių, kurie turi būti įvykdyti, norint rasti sprendimą. Panašiai kaip žmogus sprendžiant problemą suskirsto ją į mažesnes dalis ir žingsnis po žingsnio ieško sprendimo, taip pat elgiasi ir AI su CoT promptavimu.

Kaip veikia minties grandinės promptavimas?

Paimkime paprastą pavyzdį: jeigu užduotis yra apskaičiuoti, kiek obuolių liko po to, kai kai kurie iš jų buvo suvalgyti ir kiti pridėti. Vietoje tiesioginio atsakymo, CoT promptas priverčia AI išanalizuoti situaciją žingsnis po žingsnio – kiek obuolių buvo iš pradžių, kiek buvo suvalgyta, kiek pridėta – ir tik tada pateikti galutinį skaičių. Tai suteikia daug aiškesnį supratimą apie tai, kaip buvo rastas atsakymas.

Kodėl promptavimas yra svarbus?

Ši technika yra ypač naudinga sudėtingoms ar matematikos užduotims, kur reikia logiškai mąstyti ir atlikti kelis tarpinius žingsnius. Tai taip pat suteikia galimybę didiesiems kalbos modeliams geriau suprasti ir aiškinti savo mąstymo procesą, taip pagerinant jų naudojimo patirtį.

Promptų technika: tekstas į vaizdą

Be minties grandinės, svarbu paminėti dar vieną promptų technikos aspektą – tekstą į vaizdą transformaciją. Naujausi modeliai, tokie kaip DALL-E 2, Stable Diffusion ir Midjourney, priima tekstines užklausas ir pavercia jas į vizualius vaizdus. Tai atveria naujas kūrybos galimybes, leidžiančias sukurti unikalius meninius kūrinius iš paprasto teksto aprašymo.

Promptų technikos, ypač minties grandinės promptavimo, atsiradimas yra žingsnis į priekį dirbtinio intelekto plėtroje. Tai leidžia AI sistemoms ne tik efektyviau spręsti užduotis, bet ir suteikia mums gilesnį įžvalgą į jų mąstymo procesus. Nors ši technologija vis dar yra savo pradžioje, ji jau dabar žada revoliucinius pokyčius įvairiose srityse, nuo mokslo iki meno.

Promptų technikos: minties grandinės (CoT) promptavimas

Minties grandinės (CoT) promptavimas – technika, leidžianti didiesiems kalbos modeliams (LLM) išspręsti problemą, kaip seriją vienas po kito sekančių žingsnių prieš pateikiant galutinį atsakymą.

Promptų technikos: minties grandinės (CoT) promptavimas

Promptų technika Tekstas į tekstą

Minties grandinė

Minties grandinės (CoT) promptavimas – technika, leidžianti didiesiems kalbos modeliams (LLM) išspręsti problemą, kaip seriją vienas po kito sekančių žingsnių prieš pateikiant galutinį atsakymą.

Minties grandinės promptavimas pagerina modelio gebėjimą mąstyti, priverčiant jį atsakyti į kelių etapų problemą su pagrįstais sprendimo žingsniais, kurie imituoja minties seką. Tai leidžia didiesiems kalbos modeliams įveikti sunkumus su kai kuriomis loginio mąstymo ir kelių žingsnių problemų sprendimo užduotimis, tokiomis, kaip, pavyzdžiui, susijusiomis su aritmetika.

Pavyzdžiui, sudarius klausimą: „Q: Kavinėje buvo 23 obuoliai. Jeigu 20 jų buvo panaudota pietums, tačiau buvo nupirkti dar 6 obuoliai, kiek obuolių iš viso liko?”, CoT promptas gali priversti LLM atsakyti „A: Kavinėje iš pradžių buvo 23 obuoliai. 20 buvo suvalgyta per pietus. Taigi, iš viso obuolių liko 23 – 20 = 3. Kadangi buvo nupirkti dar 6 obuoliai, iš viso jų liko 3 + 6 = 9. Atsakymas yra 9.”

Kaip ir pradinėje versijoje, kiekvienas CoT promptas įtraukė keletą K&A pavyzdžių. Tai padarė mažojo mokymo promptavimo technika. Taip pat veiksminga yra paprasčiausiai pridėti žodžius „Pagalvokime žingsnis po žingsnio“. Tai leidžia geriau pritaikyti mastelį, nes vartotojui nebereikia suformuluoti daugybės konkrečių CoT klausimų ir atsakymų pavyzdžių.

Kai yra taikoma PaLM, 540B parametrų kalbos modeliui, CoT promptavimas reikšmingai padėjo modeliui, leidžiant jam pasirodyti panašiai kaip užduočių specifiniams smulkiai derintiems modeliams keliuose uždaviniuose, net nustatant naują būseną tuo metu ant GSM8K matematinio mąstymo standarto. Galima smulkiai derinti modelius su CoT mąstymo duomenų rinkiniais, kad būtų dar labiau pagerinta ši galimybė ir skatinamas geresnis interpretavimas.

Promptų technika Tekstas į vaizdą

2022 m. buvo viešai prieinami teksto į vaizdą modeliai, tokie kaip DALL-E 2, Stable Diffusion ir Midjourney.

Šie modeliai priima tekstinio prompto įvestį ir naudoja ją generuojant AI meno vaizdus. Teksto į vaizdą modeliai paprastai nesupranta gramatikos ir sakinių struktūros taip, kaip didieji kalbos modeliai, ir reikalauja skirtingo rinkinio promptavimo technikų.

Prompto formatai

Teksto į vaizdą promptas dažniausiai susideda iš meno objekto aprašymo (pavyzdžiui, ryškiai oranžinės aguonos), pageidaujamos medijos (pavyzdžiui, skaitmeninės tapybos ar fotografijos), stiliaus (pavyzdžiui, hiperrealistinio), apšvietimo (pavyzdžiui, šoninio apšvietimo ar saulės spindulių), spalvos ir tekstūros.

Midjourney dokumentacija skatina trumpus, aprašomuosius promptus: vietoje „Sukurk man nuotrauką, kurioje vaizduojama daugybė žydinčių aguonų. Aguonos turi būti ryškiai oranžinės ir piešk jas iliustruotu stiliumi su spalvotais pieštukais„, efektyvus promptas gali būti toks: „Pavaizduok ryškiai oranžines aguonas, nupieštas spalvotais pieštukais„.

Žodžių tvarka turi įtakos teksto į vaizdą prompto išvesčiai. Artimesni pradžioje esantys žodžiai gali būti labiau pabrėžiami.

Menininkų stiliai

Kai kurie teksto į vaizdą modeliai gali imituoti konkretaus menininko stilių pagal vardą.

Pavyzdžiui, frazė „Greg Rutkowski stilius” buvo naudojama Stable Diffusion ir Midjourney promptuose, generuojant vaizdus, būdingus iš lenkijos kilusiam menininkui Gregui Rutkowski.

Neigiami promptai

Teksto į vaizdą modeliai nesupranta neigimo. Promptas „šventė be torto” tikriausiai sugeneruos vaizdą, kuriame yra tortas.

Kaip alternatyva, neigiami promptai leidžia vartotojui nurodyti, kurios sąlygos neturėtų atsirasti galutiniame vaizde, naudojant atskirą promptą.

Bendras požiūris yra įtraukti bendrus nepageidaujamus terminus, tokie kaip „bjauru”, „nuobodu”, „bloga anatomija”, į neigiamą promptą vaizdui.

Dirbtinio intelekto sprendimai ir konsultacijos verslui

Norite išmokti kurti efektyvius promptus?

Peržiūrėkite, kokie promptų inžinerijos kursai ir individualios pamokos šiuo metu yra prieinami.

Parašykite: info@promptas.lt