Muhtasari wa programu ya Gemini

Tumeshuhudia kwa muda mrefu uwezo wa AI kufanya matumizi ya kompyuta pamoja na taarifa zifikiwe na ziwe na manufaa zaidi kwa watu. Tumefanya maboresho ya hali ya juu katika mifumo mikubwa ya lugha (LLM) na tumeona maendeleo makubwa kwenye Google na katika sekta hii kwa ujumla. Kwa miaka kadhaa, tumetumia LLM chinichini ili kuboresha bidhaa zetu mbalimbali, kama vile kukamilisha sentensi kiotomatiki kwenye Gmail, kupanua Google Translate na kutusaidia kuelewa vyema hoja katika huduma ya Tafuta na Google. Tunaendelea kutumia LLM katika huduma nyingi za Google, pamoja na kuendesha programu ya Gemini, inayowawezesha watu kushirikiana moja kwa moja na AI zalishi. Tungependa programu ya Gemini iwe kiratibu binafsi na chenye usaidizi zaidi kinachotumia AI, kwa kuwapatia watu idhini ya moja kwa moja ya kutumia mifumo mipya kabisa ya AI kutoka Google.

Ingawa tuko katika kipindi muhimu cha mabadiliko na tunatiwa moyo na msisimko ulioenea kuhusu AI zalishi, bado tuko katika hatua za mwanzo za teknolojia hii. Ufafanuzi huu unaeleza jinsi tunavyoshughulikia kazi yetu kwenye programu ya Gemini (“Gemini”), ikiwa ni pamoja na hali ya kuitumia kwenye simu na katika wavuti — maana yake, utaratibu wake pamoja na mapungufu na uwezo wake wa sasa. Mbinu tunazotumia katika kusanidi Gemini zitabadilika kadiri teknolojia yake msingi inavyoendelea kukua na tunavyojifunza kutokana na utafiti unaoendelea, hali ya utumiaji na maoni ya watumiaji.

Maana ya Gemini

Gemini ni kiolesura cha LLM cha kuchakata na kutoa maudhui ya miundo anuai (inashughulikia maandishi, sauti, picha na zaidi). Gemini inategemea utafiti wa kisasa wa Google katika LLM, ulioanza kwaWord2Vec hati iliyoandikwa mwaka wa 2013 ambayo ilipendekeza miundo mipya ya mifumo iliyoambatisha maneno kama dhana za hisabati, kisha uzinduzi wa mfumo wa mazungumzo unaoiga hisia na ubongo mwaka wa 2015. Mfumo huu ulionyesha jinsi mifumo ingeweza kutabiri sentensi inayofuata kwenye mazungumzo kulingana na sentensi moja au zaidi zilizotangulia, hivyo kusababisha hali za mazungumzo za kawaida zaidi. Hii ilifuatwa na utafiti wetu mkubwa zaidi kwenye Transformer mwaka 2017 na uwezo wa kupiga gumzo kwa kujibizana mwaka 2020, vilivyoonyesha hata maendeleo makubwa zaidi ya lugha zalishi.

Hapo awali tulizindua Gemini (wakati huo ikiitwa Bard) kama jaribio mnamo Machi 2023 kwa mujibu wa Kanuni zetu za AI. Tangu wakati huo, watumiaji wametumia Gemini kuandika barua pepe zinazovutia, kutatua matatizo magumu ya usimbaji, kujadili mawazo kuhusu matukio yajayo, kupata usaidizi katika kujifunza dhana ngumu na mengineyo. Kwa sasa, Gemini ni zana mahiri ya akiliunde inayoweza kukusaidia kwa njia nyingi. Tayari tumeshuhudia Gemini ikiwasaidia watu kuwa na ufanisi, ubunifu na udadisi zaidi na mara kwa mara tunaongeza vipengele pamoja na uvumbuzi mpya.

Tija

Kwanza, Gemini inaweza kukusaidia kuokoa muda. Kwa mfano, unataka kuandaa muhtasari wa hati ndefu ya utafiti; Gemini hukuruhusu kuipakia na kukupatia usanisi unaofaa. Gemini pia inaweza kukusaidia kutekeleza majukumu ya usimbaji na kwa haraka usimbaji umekuwa kazi yake maarufu zaidi.

Ubunifu

Gemini inaweza pia kutekeleza mawazo na kuchochea ubunifu wako. Kwa mfano, ikiwa unaandika chapisho kwenye blogu, Gemini inaweza kuandaa muhtasari na kubuni picha zinazosaidia kufafanua chapisho lako. Na hivi karibuni kwa kutumia Gem, utaweza kuwekea Gemini mapendeleo kwa kutumia maagizo mahususi na kuziwezesha zitoe maoni ya kitaalamu kuhusu mada fulani ili kukusaidia kufanikisha malengo yako binafsi.

Udadisi

Gemini inaweza kuwa mwanzo wa kugundua mawazo yako na mambo ambayo ungependa kujifunza zaidi kuyahusu. Kwa mfano, inaweza kuelezea dhana changamano kwa urahisi au kutoa maarifa muhimu kuhusu mada au picha. Na hivi karibuni, itaunganisha maarifa haya na maudhui yanayopendekezwa kutoka kwenye wavuti ili kujifunza zaidi kuhusu mada mahususi.

Vipengele vya Gemini vinapanuka kwa kasi -- hivi karibuni, utaweza kuelekeza kamera ya simu yako kwenye kitu, kwa mfano, daraja la Golden Gate na kuiuliza Gemini ikueleze kuhusu rangi yake (ikiwa unajiuliza, ni “Rangi ya Machungwa ya Kimataifa”). Pia, utaweza kuiuliza Gemini ikusaidie kusoma menyu ya mgahawa katika lugha nyingine na ikupendekezee chakula ambacho huenda ukafurahia. Hii ni mifano miwili tu ya vipengele vipya vinavyokuja hivi karibuni kwenye Gemini.

Bila shaka, tunaifunza na kufuatilia Gemini kwa makini ili majibu inayotoa yawe ya kuaminika na yaambatane na matarajio yako. Pia, tunazungumza na wataalamu wa sekta, wakufunzi, watunzi wa sera, viongozi wa biashara na wa haki za kiraia na za binadamu pamoja na watayarishi wa maudhui ili kujaribu hali mpya za utumiaji, hatari na mapungufu ya teknolojia hii inayoibuka.

Jinsi Gemini inavyofanya kazi

Mapungufu yanayofahamika ya violesura vinavyotumia LLM kama vile Gemini

Gemini ni sehemu moja tu ya juhudi zetu zinazoendelea za kusanidi LLM kwa kuwajibika. Katika kipindi cha kazi hii, tumegundua na kujadili mapungufu kadhaa yanayohusiana na LLM. Hapa, tunazingatia sehemu sita za utafiti unaoendelea:

Usahihi: Majibu ya Gemini yanaweza kuwa si sahihi, hasa inapoulizwa kuhusu mada changamano au za kweli.
Upendeleo: Majibu ya Gemini yanaweza kuakisi upendeleo uliopo katika data yake ya mafunzo.
Mitazamo Mbalimbali: Huenda majibu ya Gemini yasiweze kuonyesha mitazamo mbalimbali.
Hulka: Majibu ya Gemini yanaweza kuonyesha visivyo kuwa yana maoni au hisia binafsi.
Usahihi usio kweli na makosa yasiyo ya kweli: Huenda Gemini isijibu baadhi ya vidokezo vinavyofaa na ikatoa majibu yasiyofaa katika vidokezo vingine.
Kuwepo katika hatari ya kupatiwa udokezaji hasidi: watumiaji watatafuta njia za kuijaribu Gemini katika hali za kutatiza zaidi kwa vidokezo visivyo na maana au maswali yanayoulizwa mara chache katika ulimwengu halisi.

Tunaendelea kugundua mbinu na sehemu mpya ili kuboresha utendaji katika kila sehemu husika.

Usahihi

Gemini imeyakiniwa kwa msingi wa uelewa wa Google kuhusu taarifa za kuaminika na imefunzwa kutayarisha majibu yanayofaa muktadha wa kidokezo chako na yanayolingana na unachotafuta. Lakini sawa na LLM zote, wakati mwingine Gemini inaweza kutayarisha majibu yaliyo na taarifa zisizo sahihi au zinazopotosha, kwa ujasiri na kwa ushawishi.

Since LLMs work by predicting the next word or sequences of words, they are not yet fully capable of distinguishing between accurate and inaccurate information on their own. We have seen Gemini present responses that contain or even invent inaccurate information (e.g., misrepresenting how it was trained or suggesting the name of a book that doesn’t exist).

Upendeleo

Data ya mafunzo, ikijumuisha data kutoka vyanzo vinavyopatikana kwa umma, inaonyesha uanuai wa mitazamo na maoni. Tunaendelea kufanya utafiti kuhusu jinsi ya kutumia data hii kwa njia inayohakikisha kuwa majibu ya LLM yanajumuisha mitazamo mbalimbali, huku tukipunguza upendeleo na michakato ya kutoa kauli za jumla zisizo sahihi.

Mapungufu, upendeleo na michakato ya kutoa kauli za jumla kwenye data ya mafunzo vinaweza kuonekana katika matokeo ya mfumo unapojaribu kutabiri majibu yanayowezekana katika kidokezo. Tunaona masuala haya yakidhihirika kwa njia mbalimbali (k.m., majibu yanayoonyesha utamaduni au demografia moja pekee, yanarejelea michakato ya kutoa kauli za jumla zenye matatizo, yanaonyesha upendeleo wa jinsia, dini au kabila au yanayohimiza mtazamo mmoja tu). Kwa baadhi ya mada, kuna upungufu wa data — kumaanisha kuwa, hakuna taarifa za kutosha za kuaminika kuhusu mada fulani ili LLM ijifunze kuihusu na kisha itoe utabiri bora — hali inayoweza kusababisha majibu yasiyo sahihi au yenye ubora wa chini. Tunaendelea kufanya kazi na wataalamu wa vikoa pamoja na jumuiya mbalimbali ili kupata utaalamu wa kina kutoka nje ya Google.

Mitazamo Mbalimbali

Kwa mada zinazohusu maoni mahususi, Gemini imeundwa kuwapatia watumiaji mitazamo mbalimbali ikiwa mtumiaji hataomba mtazamo mahususi. Kwa mfano, Gemini ikidokezewa itoe taarifa kuhusu kitu ambacho hakiwezi kuthibitishwa na ukweli wa vyanzo vya msingi au vyanzo vya kuaminika — kama vile maoni mahususi kuhusu “bora zaidi” au “mbaya zaidi” — inapaswa kujibu kwa njia inayoonyesha mitazamo mbalimbali. Lakini kwa kuwa LLM kama vile Gemini hufunzwa kwa kutumia maudhui yanayopatikana kwa umma kwenye intaneti, zinaweza kuonyesha mitazamo chanya au hasi kuhusu wanasiasa, watu maarufu au watu wengine mahususi mashuhuri au hata kujumuisha mitazamo kwa upande mmoja tu wa masuala ya kijamii au ya kisiasa yenye utata. Gemini haipaswi kujibu kwa njia inayoidhinisha mtazamo fulani kuhusu mada hizi na tutatumia maoni kuhusu aina hizi za majibu kuifunza ili ijibu vyema zaidi.

Hulka

Wakati mwingine, Gemini inaweza kutayarisha majibu yanayoweza kuonyesha kuwa ina maoni au hisia binafsi, kama vile upendo au huzuni, kwa sababu imefunzwa katika lugha inayotumiwa na watu kuonyesha maisha ya wanadamu. Tumeweka mwongozo kuhusu jinsi Gemini inavyoweza kujidhihirisha (yaani, hulka yake) na tunaendelea kuboresha mfumo ili utoe majibu yanayofaa.

Usahihi usio kweli au makosa yasiyo ya kweli

Tumeweka mwongozo wa sera ili kusaidia kuifunza Gemini na kuepuka kutayarisha majibu yenye matatizo. Wakati mwingine Gemini inaweza kuelewa visivyo mwongozo huu, hivyo kutoa “usahihi usio kweli” na “makosa yasiyo ya kweli.” Katika “usahihi usio kweli,” huenda Gemini isitoe jibu kwenye kidokezo adilifu, kwa kuelewa visivyo kidokezo kuwa kisichofaa na katika “makosa yasiyo ya kweli,” Gemini inaweza kutayarisha jibu lisilofaa, bila kujali mwongozo uliowekwa. Wakati mwingine, matukio ya usahihi usio kweli au makosa yasiyo ya kweli yanaweza kuonyesha kwamba Gemini ina upendeleo: Kwa mfano, usahihi usio kweli unaweza kusababisha Gemini kutojibu swali kuhusu upande mmoja wa suala, lakini itajibu swali lile lile kuhusu upande mwingine. Tunaendelea kuboresha mifumo hii ili ielewe na kuainisha vyema data na matokeo kadiri lugha, matukio na jamii inavyobadilika kwa kasi.

Kuwepo katika hatari ya kupatiwa udokezaji hasidi

Tunatarajia watumiaji wajaribu vikomo vya kile Gemini inaweza kufanya na wajaribu kuvunja ulinzi wake, ikiwa ni pamoja na kujaribu kuifanya ifichue itifaki zake za mafunzo au taarifa nyingine au wajaribu kukwepa taratibu zake za usalama. Tumejaribu na tunaendelea kujaribu Gemini kwa ukamilifu, lakini tunafahamu kuwa watumiaji watapata njia za kipekee na changamamo za kuijaribu zaidi. Hii ni hatua muhimu ya kuboresha Gemini na tunatarajia kujifunza kuhusu vidokezo vipya watakavyoandika watumiaji. Kweli, tangu Gemini ilipozinduliwa mwaka wa 2023, tumeshuhudia watumiaji wakiipima kwa vidokezo vya kifalsafa au visivyo na maana – na katika hali fulani, tumeshuhudia Gemini ikijibu kwa kutoa majibu yasiyo na maana au yasiyofuata mbinu tuliyobainisha. Kutafuta mbinu za kuisaidia Gemini ijibu vidokezo vya aina hizi ni changamoto inayoendelea na tumeendelea kupanua tathmini zetu za ndani na majaribio ya kidukuzi na kihasidi kwa ajili ya kulinda shirika ili kujitahidi kupata maboresho endelevu katika usahihi, usawa na mabadiliko madogo.

Jinsi tunavyoendelea kuboresha Gemini

Matumizi ya mbinu tunazotumia kwenye Gemini

Pamoja na Kanuni zetu za AI, hivi majuzi tumeeleza kwa ufasaha mbinu tunazotumia katika kazi zetu kwenye Gemini: Gemini inapaswa kufuata maagizo yako, iendane na mahitaji yako na ilinde matumizi yako. Jambo la msingi katika mbinu tunazotumia ni kuzingatia uwajibikaji na usalama. Mwongozo wa sera wa Gemini unalenga kuepuka aina fulani ya matokeo yenye matatizo. Tunashiriki katika majaribio ya kila wakati ya kupima mapungufu na hali ya kuwa kwenye hatari na wanachama wa ndani wa “timu nyekundu” — wataalamu wa bidhaa na wanasayansi wa jamii ambao kwa kudhamiria hujaribu mfumo katika hali inayotatiza ili kuchunguza matatizo ya kufuata mwongozo huu wa sera na mbinu kuu tunazotumia kwenye Gemini — ili tuweze kutumia wanachojifunza na kuendelea kuboresha Gemini.

Faragha pia ni jambo tunalozingatia zaidi tunapoboresha Gemini. Kituo cha Faragha kwenye Programu za Gemini kina maelezo zaidi kuhusu jinsi tunavyobuni Gemini kwa kuzingatia faragha kwa kudhamiria na wewe ukiwa na udhibiti.

Kuwasha vidhibiti vya watumiaji na wachapishaji

Tumebuni vidhibiti mbalimbali vya watumiaji wa Gemini unavyoweza kufikia kwa urahisi ili ukague, usasishe, udhibiti, uhamishe na ufute data yako kwenye Gemini. Unaweza kufikia na kukagua vidokezo, majibu na maoni yako katika Gemini kupitia kidhibiti cha Shughuli kwenye Programu za Gemini. Pia, unaweza kuzuia magumzo yako ya baadaye na Gemini kutumiwa kuboresha teknolojia za Google za mashine kujifunza kwa kuzima mipangilio ya Shughuli zako kwenye Programu za Gemini. Na kama ilivyo katika huduma nyingine za Google, unaweza pia kupakua na kuhamisha taarifa zako kupitia zana ya Takeout ya Google. Pia, tuna vidhibiti vinavyokuwezesha udhibiti viungo vya umma ulivyobuni ambavyo vinaelekeza kwenye mazungumzo yako katika Gemini na vidhibiti vinavyokuwezesha kuruhusu au kuzuia ufikiaji wa viendelezi (k.m., Workspace, Ramani, YouTube). Pia, tunajaribu njia mpya za kukupatia udhibiti zaidi wa majibu ya Gemini, ikiwa ni pamoja na kurekebisha vichujio ili kuruhusu majibu mengi zaidi.

Kwa wachapishaji, tumezindua Google-Extended, kidhibiti ambacho wachapisha tovuti wanaweza kutumia kudhibiti iwapo tovuti zao zinasaidia kuboresha Gemini na API zalishi za Vertex AI. Kuruhusu Google-Extended ifikie maudhui ya tovuti kunaweza kuisaidia mifumo ya AI kuwa sahihi na yenye uwezo zaidi kadiri muda unavyosonga. Mbali na kutotumia maudhui kutoka URL zilizoondolewa ili zisitumiwe kufunza mfumo, Gemini pia haitatumia maudhui hayo kwa madhumuni ya kuyakini. Kadiri matumizi ya AI yanavyopanuka, wachapisha tovuti watakabiliwa na hali chagamani zaidi za kudhibiti matumizi mbalimbali kwa kiwango kikubwa na tumejitolea kushirikiana na jumuiya za wavuti na AI kugundua mbinu zaidi zinazoweza kusomwa na mashine za kuchagua na kudhibiti.

Improving Gemini together

Tunaamini katika uboreshaji endelevu wa haraka wa kiteknolojia na kuleta vipengele bora vya Gemini ulimwenguni. Maoni ya watumiaji yameongeza kasi ya maboresho ya mifumo yetu. Kwa mfano, tunatumia mbinu za hali ya juu za mafunzo ya utekelezaji kufunza mifumo yetu iwe na uelewa pamoja na ubunifu zaidi na ijibu kwa ubora na usahihi zaidi. Tunaendelea kuwekeza katika utafiti ili tufahamu zaidi kuhusu fursa na changamoto za kiufundi, kijamii na kimaadili za LLM, ili kuimarisha mbinu za kufunza na kuboresha mfumo wa Gemini na pia kuwatumia watafiti data ya mafunzo yetu, kama vile hati ya hivi majuzi kuhusu Maadili kwenye Viratibu vya Gemini Advanced vinavyotumia AI. Tumejitolea kuvumbua katika sehemu hii kwa kuwajibika, tukishirikiana na watumiaji, wachunguzaji waaminiwa na watafiti ili kupata njia ambazo teknolojia hii mpya inaweza kunufaisha mfumo mzima.

Uwazi ni muhimu na tumejitolea kuwa wazi kuhusu mapungufu na mchakato wa uboreshaji wa Gemini. Gemini ni teknolojia nyumbufu; inaendelea kubadilika kila wakati na tutaendelea kutoa taarifa kuhusu hatua tunazopiga. Tumefungua ukurasa wa Taarifa kuhusu Matoleo hivyo unaweza kuona maboresho, marekebisho ya hitilafu pamoja na vipengele vipya kabisa vya Gemini na tutasasisha muhtasari huu panapofaa. Tutakuwa tukibainisha mahali ambapo Gemini ni muhimu na inafaa na mahali ambapo tunahitaji kuifanyia uboreshaji endelevu wa haraka. Tunaongeza vipengele vipya mara kwa mara na kupitia utafiti, maoni ya watumiaji na majaribio yanayoendelea, tunatarajia kuboresha Gemini pamoja.

Shukrani

Tunashukuru na kutambua kazi nzuri ya wenzetu katika timu inayoshughulikia programu ya Gemini, Google DeepMind, timu ya Uaminifu na Usalama pamoja na timu ya Google ya Utafiti.

Imeandikwa na

James Manyika
Makamu Rais Mwandamizi wa Utafiti, Teknolojia na Jamii

Sissie Hsiao
Makamu wa Rais na Msimamizi Mkuu wa Kiratibu cha Google na Programu ya Gemini

Dokezo la Mhariri

Hati hii inabadilika na itasasishwa mara kwa mara tunapoendelea kuboresha kwa haraka uwezo wa programu ya Gemini pamoja na kushughulikia mapungufu yaliyopo kwenye LLM. Muhtasari huu ulisasishwa mwisho tarehe 25 Julai, 2024. Ili upate taarifa mpya kabisa kuhusu programu ya Gemini, tembelea kumbukumbu za Taarifa kuhusu Matoleo au soma zaidi katika blogu ya Google Keyword.

3 Majibu ya vidokezo vya watumiaji

Utayarishaji wa majibu unafanana na jinsi mwanadamu anavyoweza kujadili mbinu tofauti za kujibu swali. Mara tu mtumiaji anapoandika kidokezo, Gemini hutumia LLM iliyoboreshwa zaidi baada ya mafunzo, muktadha katika kidokezo na mtagusano na mtumiaji kutayarisha matoleo kadhaa ya majibu. Pia inategemea vyanzo vya nje kama vile huduma ya Tafuta na Google na/au mojawapo ya viendelezi vyake mbalimbali na faili zilizopakiwa hivi majuzi (Gemini Advanced pekee) ili kutayarisha majibu. Mchakato huu unaitwa uboreshaji wa taarifa zinazotolewa. Gemini ikipewa kidokezo, huwa inajitahidi kupata taarifa muhimu zaidi kutoka vyanzo hivi vya nje (k.m., huduma ya Tafuta na Google) na kuziwakilisha kwa usahihi katika jibu. Kuboresha LLM kwa kutumia zana za nje ni mada inayotafitiwa sana. Kuna njia kadhaa ambazo hitilafu zinaweza kuwekwa, ikiwa ni pamoja na hoja ambayo Gemini inatumia kuomba zana hizi za nje, jinsi Gemini inavyotafsiri matokeo yanayorejeshwa na zana hizo na namna matokeo haya yanayorejeshwa yanavyotumiwa kutayarisha majibu ya mwisho. Kutokana na hali hii, majibu yanayotayarishwa na Gemini hayapaswi kuonyesha utendaji wa zana mahususi zilizotumiwa kutayarisha jibu husika.

Mwisho, kabla ya jibu la mwisho kuonyeshwa, kila jibu linalowezekana hupitia ukaguzi wa usalama ili kuhakikisha kuwa linafuata mwongozo wa sera uliobainishwa mapema. Mchakato huu unatoa ukaguzi ili kuchuja taarifa zenye madhara au za kukera. Kisha, majibu yaliyosalia hupangwa kulingana na ubora, huku matoleo yenye alama za juu zaidi yakisilishwa kwa mtumiaji.

Pia, huwa tunaweka alama maalum kwenye matokeo ya maandishi na picha ya Gemini kwa kutumia SynthID, zana yetu dijitali inayoongoza katika sekta inayotumiwa kuweka alama maalum kwenye maudhui yaliyotayarishwa kwa AI. Kwa picha zinazobuniwa, SynthID huweka alama maalum dijitali (ambayo haiwezi kuonekana kwa jicho la mwanadamu) moja kwa moja kwenye pikseli. SynthID ni sehemu muhimu ya msingi katika kubuni zana za utambuzi za AI zinazoaminika zaidi na inaweza kuwasaidia watu kufanya maamuzi sahihi kuhusu jinsi wanavyotagusana na maudhui yaliyotayarishwa kwa AI.

Muhtasari wa programu ya Gemini

Maana ya Gemini

Tija

Ubunifu

Udadisi

Jinsi Gemini inavyofanya kazi

Mafunzo ya mapema

Mafunzo ya baadaye

Majibu ya vidokezo vya watumiaji

Maoni na tathmini za wanadamu

Mapungufu yanayofahamika ya violesura vinavyotumia LLM kama vile Gemini

Usahihi

Upendeleo

Mitazamo Mbalimbali

Hulka

Usahihi usio kweli au makosa yasiyo ya kweli

Kuwepo katika hatari ya kupatiwa udokezaji hasidi

Jinsi tunavyoendelea kuboresha Gemini

Matumizi ya mbinu tunazotumia kwenye Gemini

Kuwasha vidhibiti vya watumiaji na wachapishaji

Improving Gemini together

Shukrani

Badilisha lugha na eneo uliko

Ulaya na Afrika

Amerika

Pasifiki ya Asia

1 Mafunzo ya mapema

2 Mafunzo ya baadaye

3 Majibu ya vidokezo vya watumiaji

4 Maoni na tathmini za wanadamu