ChatGPT, Gemini 96% žmogaus: kada dirbtinis intelektas pralenks mus ir pakeis ekonomiką? Jau 2025–2026 m. matysime visuotinę transformaciją, kuri iš esmės pakeis darbo rinką, ekonomiką ir kasdienį gyvenimą. 2024-08-27 Pasidalinti Skaityti toliau Google Gemini promptų vadovas Autorius: Tomas Staniulis, DI konsultantas Pasak 2024 m. birželį publikuotos Dirbtinio intelekto (DI) ataskaitos „AI Index Report“, mašinos jau šiandien sėkmingai sprendžia 96% užduočių, kurias gali atlikti vidutinis žmogus. Kitaip tariant, jau pasiekėme lūžio tašką, kai DI ima lenkti žmogų vykdydamas visas pagrindines užduotis. Šis technologinis sprogimas žymi naujos kartos ekonomikos pradžią ir turės milžinišką įtaką žmonijai. Žmogus ir dirbtinis intelektas: kas laimi? Viena iš įspūdingiausių ataskaitos išvadų yra eksponentiškai auganti DI įrankių viršenybė prieš žmogų visose svarbiose srityse. 2015 m. DI sistemos pradėjo lenkti žmogų tikslumu ir greičiu klasifikuojant vaizdus, o 2021 m. jos tapo pranašesnės interpretuodamos natūralią kalbą. 2023 m. duomenys rodo, kad DI jau lenkia žmones bazinio skaitymo, suvokimo ir vizualinio mąstymo srityse. Pavyzdžiui, DI rezultatai „SuperGLUE“ teste, kuris griežtai tikrina kalbos supratimą, per pastaruosius trejus metus nuolat gerėjo, pasiekdami 110% lygį – rodiklį, kurį viršija retas planetos gyventojas. Dar daugiau, naujausi testai, tokie kaip „SWE-bench“ ar HEIM, rodo, kad DI toliau tobulėja sudėtingo mąstymo, vaizdų generavimo ir kodavimo uždavinių srityse. Pernai atliktas „HumanEval“ testas parodė, kad DI sugeba išspręsti 96,3% kodavimo užduočių, kurias sprendžia žmogus, o tai yra dviem trečdaliais daugiau nei 2021 m., kai šis rodiklis siekė tik 32,2%. Nors DI puikiai veikia atlikdamas specifines užduotis, jis vis dar atsilieka vykdydamas sudėtingas kognityvines funkcijas ar spręsdamas aukšto lygio matematinius uždavinius. Šios dvi sritys išlieka atsparios DI pažangai, atspindėdamos sunkumus, su kuriais susiduria DI, bandydamas imituoti subtilų ir abstraktų žmogaus mąstymą. Pavyzdžiui, DI sugeba išspręsti žodinį matematinį uždavinį su 84% tikslumu, palyginti su 90% žmogaus lygiu. Tai išryškina dabartines DI ribas, bet taip pat pabrėžia didžiulį progresą kitose srityse. Dirbtinio intelekto mokymai verslui Domina Dirbtinis intelektas įgyja multimodalumą Ilgą laiką DI modeliai buvo specializuoti – jie puikiai veikė tekstų, duomenų ar vaizdų apdorojimo srityse, tačiau retai sugebėdavo dirbti su dvejais ar trimis iš karto. 2023 m. tapo svarbiu etapu, kai atsirado galingi multimodaliniai DI modeliai, tokie kaip Google Gemini ir OpenAI GPT-4. Šie modeliai žymi reikšmingą šuolį DI gebėjimui apdoroti įvairių tipų duomenis, įskaitant tekstą, vaizdus ir net garsus. Technologijos tampa vis universalesnės, atverdamos kelią integruotiems DI įrankiams įvairiose pramonės šakose. Pavyzdžiui, „Google Gemini Ultra“ pasiekė įspūdingą 90,04% rezultatą „Massive Multitask Language Understanding“ (MMLU) teste, lenkiantį žmogaus pasiekimų lygį (89,8%). Tai rodo augantį DI sistemų gebėjimą spręsti sudėtingas tarpdisciplinines užduotis, kurioms reikalingas lingvistinio ir vizualinio mąstymo derinys. Tai svarbus pranašumas tokiose srityse kaip autonominės transporto priemonės ir skaitmeninio turinio kūrimas. Uždarieji ir atvirieji DI modeliai: kas pirmaus? DI bendruomenėje vis dar aktuali diskusija apie skirtumus tarp uždarųjų ir atvirųjų DI modelių. Ataskaita rodo, kad uždarieji modeliai, dažniausiai patentuoti ir turintys prieigą prie didesnių ir specializuotų duomenų rinkinių, lenkia atviruosius modelius vidutiniškai 24,2%. Šis našumo skirtumas turi reikšmingų pasekmių technologijų plėtrai ir DI politikai, nes prieiga prie duomenų ir patentuotų technologijų gali nulemti, kurios verslo įmonės ir šalys pirmaus DI revoliucijoje. Šie skirtumai kelia klausimų apie DI ateitį ir galimą galios koncentraciją tarp kelių technologijų gigantų. Kadangi uždarieji modeliai toliau lenkia savo atviruosius konkurentus, gali atsirasti kliūčių mažesniems DI ekosistemos dalyviams. Jie gali susidurti su didesne konkurencija, perdėtu reguliavimu, kas gali sulėtinti inovacijas. Faktų tikslumas ir haliucinacijų problema Nors DI modeliai padarė didelę pažangą kuriant rišlų, kontekstinį turinį, jie vis dar susiduria su faktinio tikslumo problema, vadinamąja haliucinacija. „TruthfulQA“ testas, pristatytas 2022 m., matuoja DI atsakymų tikslumą. Naujausi duomenys rodo, kad nors GPT-4 gavo aukščiausią balą – 0,6, tai vis dar toli gražu nėra tobula, o haliucinacijos išlieka problema, ypač tokiose svarbiose srityse kaip teisė ir medicina. Ataskaitoje taip pat pažymima, kad ChatGPT, vienas iš plačiausiai naudojamų DI modelių, daro vertimo klaidų maždaug 19,5% atsakymų. Tai gali sukelti netikslumų informacijos apdorojimo grandinėje. Todėl, jei DI modeliai taps vis labiau integruoti į sprendimų priėmimo procesus, faktų tikslumo problemą būtina spręsti kuo greičiau. Dirbtinio intelekto ateitis: už „hype“ ribų Remiantis ataskaita, aiškėja, kad didysis „hype“, sukeltas DI technologijų, toli gražu nesibaigia. Technologijų aukso amžiuje DI modelių mokymui pradedami naudoti ne tik jau sukaupti duomenys, bet ir pačių modelių kuriami nauji duomenų rinkiniai, skirti kitų DI sistemų mokymui. Pavyzdžiui, Meta sukurtas „Segment Anything Model“ (SAM) buvo naudojamas kuriant SA-1B duomenų rinkinį, kuriame yra daugiau nei 1 milijardas segmentavimo kaukių. Šis rinkinys jau pasiruošęs paspartinti ateities vaizdų segmentavimo modelių kūrimą. Panašiai ir „Skoltech3D“ duomenų rinkinys, kuriame yra 1,4 mln. vaizdų ir scenų įvairovė, reikšmingai prisidės prie 3D objektų generavimo srities pažangos. Atsižvelgiant į proveržį, kurį DI technologijos pasiekė per pastaruosius trejus metus, galima daryti išvadą, kad 2025–2026 m. matysime visuotinę transformaciją, kuri iš esmės pakeis darbo rinką, ekonomiką ir kasdienį gyvenimą. Šiandien svarbiausia politikams, verslininkams ir technologijų kūrėjams užtikrinti, kad DI teikiama nauda žmonijai nuolat didėtų, o keliamas rizikas būtų suvaldyta kuo efektyviau. Autorius: Tomas Staniulis, DI konsultantas © Bet koks šio straipsnio kopijavimas, platinimas ar republikavimas be rašytinio autoriaus sutikimo yra draudžiamas. Norite išmokti efektyviau dirbti su DI įrankiais? Domina Kas dar įdomesnio? ChatGPT, Gemini 5 mitai apie dirbtinį intelektą ir kodėl juo nereikia pasitikėti aklai DI yra skirtas tam, kad padėtų mums automatizuoti rutiną ir susitelkti į didesnę vertę… 5 min. skaitymui AI renginiaiChatGPT, Gemini ChatGPT mokymai ir studijos: programos aprašymas Programos tikslas: supažindinti dalyvius su dirbtinio intelekto modeliu ChatGPT, papasakoti jo sukūrimo istoriją, aptarti… 2 min. skaitymui ChatGPT, GeminiPrompt Engineering Promptų inžinerijos vadovėlis, pateiktas OpenAI Šis promptų inžinerijos vadovėlis, pateiktas OpenAI komandos, aptaria strategijas ir taktikas, kaip gauti geresnius… 4 min. skaitymui Load More