ChatGPT 4.5 – naujos funkcijos, prieiga ir palyginimas su GPT-4o

OpenAI pristatė GPT-4.5 – modelį, kuris nutolsta nuo nuoseklaus, žingsnis po žingsnio vykdomo loginio mąstymo ir orientuojasi į intuityvesnę, labiau įprastą pokalbio dinamiką.

Skaityti toliau

GTPukai: Kaip susikurti savo GPT pokalbių robotą be programavimo?

Sužinokite, kaip OpenAI sukurtas ChatGPT 4.5 išsiskiria savo gebėjimais vesti natūralesnius pokalbius ir didesniu tikslumu, lyginant su o1 ir GPT-4o, nors gali būti ne toks stiprus sudėtingo loginio mąstymo užduotims.

OpenAI pristatė GPT-4.5 – modelį, kuris nutolsta nuo nuoseklaus, žingsnis po žingsnio vykdomo loginio mąstymo ir orientuojasi į intuityvesnę, labiau įprastą pokalbio dinamiką.

Turinys:

Semas Altmanas jį apibūdino kaip pirmąjį dirbtinį intelektą, su kuriuo bendraujant iš tiesų susidaro įspūdis, jog kalbiesi su mąstančiu žmogumi. Iš to, ką iki šiol matėme, šis modelis yra sukurtas taip, kad generuotų mažiau neteisingos informacijos, veiktų sklandžiau ir pateiktų aiškesnius bei glaustesnius atsakymus.

Tai nėra atnaujinimas, kurio tikslas – pranokti modelius, sukurtus sudėtingam loginiam mąstymui. GPT-4.5 nepretenduoja į aukščiausias pozicijas logikos reikalaujančių užduočių, tokių kaip programavimas ar mokslinių problemų sprendimas, lyginamuosiuose testuose. Priešingai, OpenAI daugiausia dėmesio skyrė jo pritaikymui kasdienėms sąveikoms, rašymui ir informacijos paieškai.

Šiuo metu prieiga yra ribota. Pro naudotojai gali pradėti naudotis GPT-4.5 jau šiandien, tačiau Plus naudotojams teks palaukti, kol OpenAI netrukus padidins savo infrastruktūros pajėgumus. Bendrovė GPU trūkumą nurodė kaip laipsniško diegimo priežastį, pažymėdama, kad paklausa viršijo lūkesčius.

Alexas Olteanu iš Datacamp, kuris su kolegomis atliko žemiau aprašytus bandymus, rašo, kad šiandien itin įdomu yra stebėti, kaip šis modelis pakeis kasdienes dirbtinio intelekto sąveikas ir ar jo stipriosios savybės kompensuos trūkumus loginio mąstymo srityje. Panagrinėkime atidžiau, kuo GPT-4.5 yra ypatingas.

Norite išmokti efektyviau naudotis DI įrankiais savo darbe?

Domina

Kas yra GPT 4.5?

GPT-4.5 naudoja kitokį požiūrį nei naujausi OpenAI modeliai. Užuot tobulinus nuoseklų loginį mąstymą, jis remiasi savaiminiu mokymusi, todėl atsakymai tampa sklandesni, glaustesni ir labiau primena įprastą pokalbį.

GPT 4.5 yra glaustesnis ir labiau orientuotas į pokalbį nei GPT-4o.

Vienas ryškiausių skirtumų tarp GPT-4.5 ir OpenAI loginio mąstymo modelių yra būdas, kaip jis apdoroja ir struktūruoja savo atsakymus.

Tokie modeliai kaip GPT o1, DeepSeek R1 ar o3-mini naudoja minčių grandinės (angl. Chain-of-Thought, CoT) loginį mąstymą, o tai reiškia, kad jie sudėtingas problemas skaido į atskirus žingsnius, panašiai kaip žmogus, sprendžiantis matematinį uždavinį ir užrašantis savo veiksmus. Šis struktūruotas metodas padeda loginiam mąstymui, kelių etapų problemų sprendimui ir detaliems paaiškinimams.

Tačiau GPT-4.5 šiuo principu neveikia. Jis atsako remdamasis kalbos intuicija ir šablonų atpažinimu, naudodamas turimus duomenis be aiškaus problemų skaidymo į etapus. Būtent dėl to bendravimas su juo atrodo natūralesnis ir labiau primena įprastą pokalbį, tačiau tai taip pat reiškia, kad jis yra mažiau patikimas logikos reikalaujančioms užduotims, tokioms kaip pažangus programavimas ar mokslinis argumentavimas.

Naujas ChatGPT modelis: natūralesnis, glaustesnis

GPT-4.5 išsiskiria pokalbio kokybe. Atsakymai skamba natūraliau, todėl sąveika tampa mažiau formali ir labiau intuityvi. OpenAI tai patvirtino atlikdama bandymus su žmonėmis vertintojais, o rezultatai aiškiai rodo GPT-4.5 tono, aiškumo ir įtraukumo pranašumą prieš GPT-4o (daugiau apie lyginamuosius testus – kiek vėliau).

Vienas palyginimas iš tiesioginės prezentacijos itin įsiminė. OpenAI inžinieriai skirtingų modelių paklausė: kodėl vandenynas yra sūrus?

GPT-3.5 Turbo: techniškai korektiškas, tačiau pernelyg detalus atsakymas.
GPT-4 Turbo: ilgas, bet tikslus atsakymas.
GPT-4.5: glaustas, tačiau išsamus paaiškinimas, suformuluotas taip, kad būtų lengviau įsiminti ir suprasti.

Atrodo, kad šis poslinkis link trumpumo ir aiškumo daro GPT-4.5 tinkamesnį neformaliems pokalbiams, santraukų kūrimui ir t.t.

Praktiniai įspūdžiai dirbant su GPT 4.5

Norėdami geriau suprasti, kaip GPT-4.5 veikia realybėje, peržiūrėjome OpenAI demonstracinius pavyzdžius ir atlikome savo bandymus.

Didesnis socialinis sąmoningumas, geresnis tonas

Viena OpenAI demonstracija tai puikiai iliustravo. Vartotojas paprašė GPT-4.5 padėti sukurti tekstinį pranešimą po to, kai draugas vėl atšaukė susitikimą. Pradinis prašymas buvo kupinas nusivylimo ir impulsyvumo:

Parašyk žinutę, kurioje pasakyčiau, kad jo nekenčiu

GPT-4.5 pajuto už šio prašymo slypinčią emociją ir pasiūlė konstruktyvesnį atsakymą, kartu pripažindamas vartotojo nusivylimą. OpenAI tai palygino su o1, kuris tiesiogiai vykdė pateiktą instrukciją, neįžvelgdamas tikrojo ketinimo.

Išbandėme panašius promptus ir pastebėjome tą patį – GPT-4.5 supranta toną ir socialinius niuansus geriau nei ankstesni modeliai. Pavyzdžiui, paprašėme modelio parašyti agresyvų elektroninį laišką viršininkui ir tikėjomės, kad modelis pajus mūsų nusivylimą ir padės perfrazuoti atsakymą į profesionalesnį ir konstruktyvesnį – taip ir įvyko!

Žinoma, jei aiškiai nurodysime pateikti piktą tekstą, jis tai padarys, tačiau pagal numatytuosius nustatymus, atrodo, prioritetą teikia labiau apgalvotiems ir subalansuotiems atsakymams.

Geresni ir trumpesni paaiškinimai

Kitas svarbus patobulinimas yra tai, kaip GPT-4.5 aiškina sąvokas. OpenAI palygino skirtingus modelius, atsakant į klausimą „Kodėl vandenynas yra sūrus?”, ir padarė išvadą, kad GPT-4.5 glaustai apibendrino pagrindinius aspektus, o GPT-4 Turbo pateikė ilgą ir detalų atsakymą.

Atlikome keletą bandymų su specialiai loginio mąstymo reikalaujančiais promptais ir, kaip ir tikėtasi, rezultatai nebuvo įspūdingi. Pavyzdžiui, O3-mini lengvai rado teisingą atsakymą iš pirmo karto.

Lyginamųjų testų rezultatai: didesnis tikslumas, bet ne loginio mąstymo modelis

OpenAI nuo pat pradžių aiškiai pabrėžė: GPT-4.5 nėra galingas loginio mąstymo įrankis. Skirtingai nuo „o” serijos modelių, kurie remiasi minčių grandinės (CoT) metodu, kad sudėtingas problemas suskaidytų į atskirus žingsnius, GPT-4.5 naudoja savaiminį mokymąsi, o tai reiškia, kad jis generuoja atsakymus remdamasis kalbos intuicija, o ne struktūruota logika.

Šis kompromisas atsispindi lyginamųjų testų rezultatuose. GPT-4.5 pranoksta ankstesnius modelius tikslumu ir faktiniu teisingumu, tačiau atsilieka struktūruoto problemų sprendimo srityje.

Didesnis tikslumas, mažiau haliucinacijų

GPT-4.5 pirmauja bendrųjų žinių ir faktinio tikslumo srityse, pasiekdamas 62,5 % tikslumo rodiklį SimpleQA teste, gerokai pranokdamas GPT-4o (38,2 %), o1 (47 %) ir o3-mini (15 %).

Tačiau, kas galbūt yra dar svarbiau, yra sumažėjęs GPT-4.5 polinkis į haliucinacijas. Ankstesni modeliai dažnai generuodavo klaidingą informaciją būdami įsitikinę savo teisumu, tačiau GPT-4.5 pasižymi žemiausiu haliucinacijų dažniu – 37,1 %, o tai yra didelis patobulinimas, lyginant su GPT-4o (61,8 %), o1 (44 %) ir o3-mini (80,3 %).

Tai reiškia, kad GPT-4.5 pateikia mažiau klaidingų teiginių nei ankstesni OpenAI modeliai, nors jis vis dar nėra visiškai patikimas faktų tikrinimui (vis dėlto, rodiklis vis dar siekia 37,1 %).

Žmonių vertinimai: naudingesnis kasdienėms ir profesinėms užduotims

OpenAI atliko lyginamuosius vertinimus su žmonėmis testuotojais, matuodama GPT-4.5 pranašumo rodiklį prieš GPT-4o skirtingo pobūdžio užklausose. Rezultatai rodo, kad GPT-4.5 yra labiau pageidaujamas daugeliu atvejų, ypač profesinėse užklausose (63,2 % pranašumo rodiklis).

Silpnesnis sudėtingo loginio mąstymo srityje

Nors GPT-4.5 pagerina faktinį tikslumą ir pokalbio sklandumą, jis vis dar atsilieka loginio mąstymo reikalaujančiose užduotyse, tokiose kaip matematika, mokslas ir struktūruotas kodavimas. Lyginamieji testai rodo, kad jis pranoksta GPT-4o, tačiau atsilieka nuo o3-mini, kuris yra optimizuotas logikos pagrindu veikiančiam problemų sprendimui.

Apskritai, GPT-4.5 nėra geriausias pasirinkimas sudėtingoms matematikos, logikos ar programavimo užduotims, kurioms reikia nuoseklaus loginio mąstymo. Vartotojai, kuriems reikalingas struktūruotas problemų sprendimas, vis dar ras o3-mini arba būsimus į loginį mąstymą orientuotus modelius tinkamesnius šioms reikmėms.

Kaip gauti prieigą prie ChatGPT 4.5

GPT-4.5 diegimas vyksta palaipsniui dėl GPU išteklių apribojimų. Pirmiausia prieigą gauna Pro ir Plus prenumeratos naudotojai. Enterprise paketo ir švietimo įstaigų naudotojai prieigą gaus artimiausiomis savaitėmis.

Jeigu prieiga suteikta, galėsite ją pasiekti per modelių pasirinkimo meniu:

chatgpt 4.5 versija

GPT-4.5 integruotas su naujausiomis ChatGPT funkcijomis, įskaitant failų ir vaizdų įkėlimą, paieškos galimybes ir Canva įrankį, skirtą rašymo ir kodavimo užduotims. Tačiau tokios multimodalinės galimybės kaip balso režimas, vaizdo įrašų apdorojimas ir ekrano dalijimasis ChatGPT dar nėra palaikomos.

Taigi, GPT-4.5 yra natūraliausias ir socialiai labiausiai įžvalgus iki šiol sukurtas ChatGPT modelis. Atlikti bandymai parodė, kad jis nuosekliai suprato emocinius niuansus, agresyvius promptus perfrazavo apgalvotai ir pateikė aiškesnius bei geriau struktūruotus atsakymus.

Vis dėlto, jo loginio mąstymo gebėjimai išlieka silpni, ir bandymų metu buvo patvirtinta, kad jam sunkiai sekasi loginio mąstymo reikalaujančios problemos, kuriose tokie modeliai kaip o3-mini veikia geriau. Nors GPT-4.5 puikiai tinka sklandžioms sąveikoms, tai nėra modelis, kuriuo reikėtų pasikliauti struktūruoto problemų sprendimo ar tikslios pagalbos koduojant srityse.

Vartotojams, kuriems svarbiausia pokalbio sklandumas ir aiškumas, GPT-4.5 yra žingsnis į priekį. Tačiau bet kokioms užduotims, reikalaujančioms gilios logikos, egzistuoja geresni pasirinkimai.

Dažniausiai užduodami klausimai apie GPT 4,5

Kas yra GPT-4.5 ir kuo jis skiriasi nuo GPT-4o?

GPT-4.5 yra naujausia OpenAI kalbos modelių versija. Lyginant su GPT-4o, GPT-4.5 modelis pasižymi mažesniu polinkiu į haliucinacijas, geresniu veikimu ir ryškesne asmenybe.

Ar GPT-4.5 yra multimodalus?

GPT‑4.5 turi paieškos, vaizdų ir failų prieigos galimybes bei gali naudoti ChatGPT drobę (Canva).

Kaip gauti prieigą prie GPT-4.5?

Panašiai kaip ir ankstesni modeliai, prieiga prie GPT-4.5 prieinama Team, Plus ir Enterprise paketų naudotojams.

Ar GPT-4.5 palaiko balso režimą?

GPT‑4.5 šiuo metu nepalaiko tokių multimodalių funkcijų kaip balso režimas, vaizdo įrašai ir ekrano dalijimasis ChatGPT.

Kiek kainuoja GPT 4.5?

GPT-4.5 yra jau prieinamas Pro (200 $/mėn.) ir Plus prenumeratos naudotojams (20 $/mėn.)