Šta je Gemini: Sve o novom AI modelu iz Googlea

Google je upravo objavio svoj najmoćniji AI model ikad nazvan Blizanci. Šta je ona i šta može? O svemu u našem članku.

Google godinama razvija vlastite AI alate. Sa javnim objavljivanjem ChatGPT-3 iz OpenAI-a, kompanija koja vodi najpopularniji svjetski pretraživač također je kreirala sličan alat, Bard. Ali ovaj alat je ipak izgubio od konkurencije, što Google nije mogao dozvoliti. Stoga ne čudi što je svijet nedavno ugledao Gemini, novi jezički model iz Gugla, za koji smo saznali tokom prezentacije.

Dizajniran je ne samo da poboljša prethodni LLM (Large Language Model) ovog giganta, već i da ponudi potpuno nove mogućnosti u oblasti obrade teksta, grafike i zvuka.

Pa hajde da pobliže pogledamo novi jezički model Google Gemini.

Također zanimljivo: OpenAI projekat P*: šta je to i zašto je projekat zabrinut

SADRŽAJ

1. Šta je Google Gemini?

2. Ko je kreirao model?

3. Mogućnosti

4. Postoje li različite verzije?

5. Kako pristupiti Blizancima?

6. Blizanci u Google Bardu: Šta će se promijeniti?

7. Blizanci u Google Pixel pametnim telefonima

8. Po čemu se Gemini razlikuje od drugih AI modela, kao što je GPT-4?

9. Zabrinutost za tačnost i nepristrasnost

10. Budućnost je sa Blizancima

Šta je Google Gemini?

Ovo je novi i moćni model umjetne inteligencije iz Googlea, koji može razumjeti ne samo tekst, već i slike, video i audio. Ovaj multimodalni model je opisan kao sposoban za obavljanje složenih zadataka iz matematike, fizike i drugih domena, kao i za razumijevanje i generiranje visokokvalitetnog koda na različitim programskim jezicima.

Gemini je trenutno dostupan kroz integraciju sa Google Bardom i Google Pixel 8 i postepeno će biti uključen u druge Google usluge.

"Blizanci su rezultat ogromnog zajedničkog napora svih Google timova, uključujući naše kolege u Google Research-u," — rekao je Dennis Hassabis, izvršni direktor i suosnivač Google DeepMind-a. „Izgrađen je od temelja da bude multimodalan, što znači da može generalizirati i neprimjetno razumjeti, operirati i kombinirati različite vrste informacija, uključujući tekst, kod, audio, slike i video."

- Advertisement -

Također zanimljivo: Nije sve što nazivamo AI zapravo umjetna inteligencija. Evo šta treba da znate

Ko je kreirao model?

Kao što ste verovatno već pretpostavili, Gemini su kreirali Google i Alphabet, Google-ova matična kompanija, i predstavlja najnapredniji AI model kompanije do sada. Googleov odjel DeepMind također je dao značajan doprinos njegovom razvoju. Još nije poznato koliko je zaposlenih učestvovalo u razvoju i koja su sredstva izdvojena za to, ali znajući Googleove mogućnosti, možemo biti sigurni da je riječ o vrlo velikom iznosu.

Također zanimljivo: Windows 12: Šta će biti novi OS

Mogućnosti

Kao što sam gore napomenuo, to je multimodalni model, što znači da može razumjeti, raditi i kombinirati različite vrste podataka, uključujući tekst, kod, audio, slike i video. Pruža bolje razumijevanje, razmišljanje i vještine kodiranja u poređenju sa prethodnim AI sistemima.

Glavne mogućnosti modela su:

Obrada prirodnog jezika za zadatke kao što su prevođenje, sažimanje i dijalog
Matematičko razmišljanje i rješavanje problema
Sposobnost generiranja koda i dokumentacije
Razumijevanje slika, audio i video zapisa
Multitasking u različitim domenima

Kao što vidite, mogućnosti su superiornije u odnosu na druge modele.

U testovima razumijevanja jezika, matematičkog razmišljanja i kodiranja, Gemini Ultra je nadmašio modele kao što je GPT-4. Konkretno, to je prvi model koji je nadmašio performanse na nivou čovjeka na testu razumijevanja jezika velikog broja zadataka (MMLU), postigavši preko 90% tačnosti.

U 32 akademska testa velike studije jezika, Blizanci su nadmašili GPT-4. U 30 slučajeva, novi jezički model iz Google-a bio je bolji od konkurenta. Ovo pokazuje sposobnost modela da u potpunosti razumije jezik.

Pročitajte također: Projekat ljudskog mozga: Pokušaj imitacije ljudskog mozga

Postoje li različite verzije?

Google opisuje ovu umjetnu inteligenciju kao fleksibilan model koji može raditi na bilo kojem uređaju: od Google data centara do mobilnih uređaja. Da bi se postigla ova skalabilnost, Gemini dolazi u tri verzije: Nano, Pro i Ultra.

Razgovarajmo o različitim verzijama Blizanaca detaljnije.

Gemini Nano: dizajniran za rad na pametnim telefonima, posebno na Google Pixel 8. Dizajniran je za obavljanje zadataka koji zahtijevaju efikasnu obradu od strane umjetne inteligencije bez povezivanja na eksterne servere, kao što je predlaganje odgovora u programima za ćaskanje ili sumiranje teksta. Ovaj kompaktni model uređaja ima oko 6 milijardi parametara.
GeminiPro: radi u Google data centrima. Pro je dizajniran za rad s najnovijom verzijom Bard AI chat bota. U stanju je pružiti brzo vrijeme odgovora i razumjeti složene upite. Model srednje veličine ima približno 100 milijardi parametara i jezgro je Bardove konverzacijske AI. Pro će biti dostupan putem Google Cloud-a.
Gemini Ultra: iako Ultra verzija još nije široko dostupna, Google je opisuje kao svoj model s najboljim performansama, koji premašuje "trenutno stanje tehnike za 30 od 32 široko korištena akademska testa koji se koriste u istraživanju velikih jezičkih modela (LLM). " Kao najveća i najmoćnija verzija, Ultra će dobiti više od 1 bilion parametara. Nalazit će se u podatkovnim centrima. Ultra je prilagođen za korporativnu upotrebu. Verzija je dizajnirana za obavljanje vrlo složenih zadataka. Google ga planira objaviti nakon završetka trenutne faze testiranja. Odnosno, najmoćnija verzija još nije dostupna korisnicima.

Također zanimljivo: Google Bard AI: Sve što trebate znati

- Advertisement -

Kako pristupiti Blizancima?

AI u Nano i Pro verzijama sada je dostupan u Google proizvodima kao što su Google Pixel 8 pametni telefoni i Bard chatbot, respektivno. Google planira da ga na kraju integriše u svoj pretraživač, oglašavanje, Gmail servis e-pošte, Chrome pretraživač i druge usluge.

Programeri i poslovni korisnici moći će pristupiti Pro kroz Gemini API u Google AI Studiju i Google Cloud Vertex AI od 13. decembra 2023. Developers Android će imati pristup modelu Nano verzije putem AICore-a, koji će biti dostupan u ranoj verziji.

Pročitajte također: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Bitka dva Yokozuna

Blizanci u Google Bardu: Šta će se promijeniti?

Prema informacijama datim tokom prezentacije, model će omogućiti Google Bardu da bolje rješava složenije probleme, kako je navedeno:

„Dizajnirali smo Gemini tako da model bude prirodno multimodalan i prethodno obučen za više modaliteta od samog početka. Zatim smo ga poboljšali dodavanjem više multimodalnih podataka kako bismo poboljšali performanse. Kao rezultat toga, Gemini lako razumije i zaključuje mnogo bolje od prethodnih multimodalnih modela, i može se pohvaliti vrhunskim mogućnostima u gotovo svim područjima.

Geminijeve izvanredne multimodalne sposobnosti pomažu vam da razumete složene tekstualne i vizuelne informacije. Posebno su korisni kada je u pitanju izdvajanje specifičnih informacija iz ogromnih skupova podataka. Izuzetna sposobnost ovog modela da izvuče suštinu informacija iz stotina hiljada dokumenata čitajući, filtrirajući i analizirajući nesumnjivo će doprinijeti novim, munjevitim otkrićima u različitim oblastima od nauke do finansija."

Tokom prezentacije prikazan je primjer složene studije koja sadrži više od 200 hiljada zapisa, od kojih su neki morali biti ažurirani prema novim podacima. Kao što ste mogli pretpostaviti, ručni rad bi oduzeo mnogo vremena, pa su autori studije koristili Gemini za pripremu koda koji je uzeo ulaz i napravio potrebna ažuriranja. Drugi, više stvarni primjer je korištenje Google-ovog jezičkog modela za objašnjenje matematičkih ili fizičkih problema.

Ulazni podaci ovdje bili su fotografija/sken zadatka sa školskog časa. Sistem je bio u mogućnosti da obradi grafiku i tekst koji su tamo pohranjeni, a zatim naznači koji su dijelovi domaće zadaće urađeni ispravno, a kojima je potrebno više pažnje. Prezentacija je pokazala da korisnik može više puta tražiti od Blizanaca da objasni zadatak, a svaki naredni pokušaj mora biti objašnjen jednostavnijim jezikom. Koliko će Blizanci biti tačni i korektni, naravno, provjerit će zainteresovani, ali impresivna je mogućnost čitanja i obrade teksta direktno sa fotografija. Kako je dodato tokom prezentacije:

"Blizanci su naučeni da prepoznaju i razumiju tekst, slike, zvukove i još mnogo toga u isto vrijeme. Zahvaljujući tome, on bolje razumije nijanse informacija i može odgovoriti na složena pitanja. Posebno je efikasan u objašnjavanju tema vezanih za matematiku i fiziku, pa može poslužiti i kao lični pomoćnik u domaćim zadacima".

Blizanci u Google Pixel pametnim telefonima

Google se također pohvalio da je Gemini "naučio" na novim TPUv5 čipsetima, te planira da početkom 2024. godine predstavi Gemini Ultra, koji će koristiti Bard Advanced, novu verziju potrošačke verzije govornog modela giganta. Gemini Ultra je trenutno u fazi testiranja i već je dostupan odabranim stručnjacima za sigurnost.

Posljednja važna informacija je uvođenje Geminija u pametne telefone Google Pixel 8. Ovo će omogućiti, između ostalog, kreiranje brzih odgovora putem Gboard aplikacije u messengerima. Prvi je WhatsApp, ali sljedeće godine će se takva rješenja pojaviti i u drugim aplikacijama koje se odnose na komunikaciju. Međutim, ovo je tek početak, jer je Google najavio mnoge nove AI alate za Pixel 8 pametne telefone, a u budućnosti će biti dostupni i na nekim drugim uređajima. Android. Međutim, ovo su dalji planovi i za sada nisu dati detalji.

Po čemu se Gemini razlikuje od drugih AI modela, kao što je GPT-4?

Googleov novi Gemini model izgleda kao jedan od najvećih i najnaprednijih AI modela do sada, iako će izlazak Ultra modela to sigurno odrediti. U poređenju sa drugim popularnim modelima koji trenutno koriste AI chat botove, Gemini se ističe svojom multimodalnom karakteristikom, dok se drugi modeli poput GPT-4 oslanjaju na dodatke i integraciju kako bi bili zaista multimodalni.

Zabrinutost za tačnost i nepristrasnost

Iako je Gemini veliki korak naprijed u razvoju sposobnosti umjetne inteligencije, ima iste nedostatke kao i drugi glavni jezički modeli. Prije svega, to je mogućnost stvaranja lažnih informacija. Predrasude se takođe zasnivaju na podacima o obuci dostupnim novom jezičkom modelu. Također je vrijedno spomenuti ograničeno razumijevanje stvarnog svijeta. Google priznaje da novi model Gemini može pogriješiti, pružiti činjenice koje nisu zasnovane na dokazima i protivreče zdravom razumu.

Potrebno je više testova, posebno za Gemini Ultra, koji ima nove mogućnosti koje još nisu u potpunosti istražene. Google se zalaže da pažljivo procjenjuje Gemini kako bi smanjio potencijalnu štetu.

Također zanimljivo: Sve o tome Microsoft Kopilot: budućnost ili pogrešan put?

Budućnost je sa Blizancima

Google lansiranje Gemini-a otvorilo je novu eru razvoja AI. Sa svojim najboljim performansama u poređenju sa prethodnim modelima i ljudskim osnovnim linijama, Gemini ukazuje na buduće mogućnosti veštačke inteligencije, ali i dalje treba više istraživanja kako bi se rešili određeni nedostaci.

U budućnosti možete očekivati da će Gemini pružiti korisnije i inteligentnije funkcije u Google proizvodima. U budućnosti, kompanija planira da nastavi da širi Gemini izvan engleskog jezika i da gradi na svojoj metodologiji osnovnog modela.

Možemo samo da gledamo i nadamo se da Google zna šta radi.

Pročitajte također:

Više od autora

Prijaviti se

0 Komentari

Embedded Reviews

Pogledaj sve komentare

Ostali članci

Šta je Gemini: Sve o Googleovom novom AI modelu