Skip to main content

Muhtasari wa programu ya Gemini

Tumeshuhudia kwa muda mrefu uwezo wa AI kufanya matumizi ya kompyuta pamoja na taarifa zifikiwe na ziwe na manufaa zaidi kwa watu. Tumefanya maboresho ya hali ya juu katika mifumo mikubwa ya lugha (LLM) na tumeona maendeleo makubwa kwenye Google na katika sekta hii kwa ujumla. Kwa miaka kadhaa, tumetumia LLM chinichini ili kuboresha bidhaa zetu mbalimbali, kama vile kukamilisha sentensi kiotomatiki kwenye Gmail, kupanua Google Translate na kutusaidia kuelewa vyema hoja katika huduma ya Tafuta na Google. Tunaendelea kutumia LLM katika huduma nyingi za Google, pamoja na kuendesha programu ya Gemini, inayowawezesha watu kushirikiana moja kwa moja na AI zalishi. Tungependa programu ya Gemini iwe kiratibu binafsi na chenye usaidizi zaidi kinachotumia AI, kwa kuwapatia watu idhini ya moja kwa moja ya kutumia mifumo mipya kabisa ya AI kutoka Google.

Ingawa tuko katika kipindi muhimu cha mabadiliko na tunatiwa moyo na msisimko ulioenea kuhusu AI zalishi, bado tuko katika hatua za mwanzo za teknolojia hii. Ufafanuzi huu unaeleza jinsi tunavyoshughulikia kazi yetu kwenye programu ya Gemini (“Gemini”), ikiwa ni pamoja na hali ya kuitumia kwenye simu na katika wavuti — maana yake, utaratibu wake pamoja na mapungufu na uwezo wake wa sasa. Mbinu tunazotumia katika kusanidi Gemini zitabadilika kadiri teknolojia yake msingi inavyoendelea kukua na tunavyojifunza kutokana na utafiti unaoendelea, hali ya utumiaji na maoni ya watumiaji.

Maana ya Gemini

Gemini ni kiolesura cha LLM cha kuchakata na kutoa maudhui ya miundo anuai (inashughulikia maandishi, sauti, picha na zaidi). Gemini inategemea utafiti wa kisasa wa Google katika LLM, ulioanza kwaWord2Vec hati iliyoandikwa mwaka wa 2013 ambayo ilipendekeza miundo mipya ya mifumo iliyoambatisha maneno kama dhana za hisabati, kisha uzinduzi wa mfumo wa mazungumzo unaoiga hisia na ubongo mwaka wa 2015. Mfumo huu ulionyesha jinsi mifumo ingeweza kutabiri sentensi inayofuata kwenye mazungumzo kulingana na sentensi moja au zaidi zilizotangulia, hivyo kusababisha hali za mazungumzo za kawaida zaidi. Hii ilifuatwa na utafiti wetu mkubwa zaidi kwenye Transformer mwaka 2017 na uwezo wa kupiga gumzo kwa kujibizana mwaka 2020, vilivyoonyesha hata maendeleo makubwa zaidi ya lugha zalishi.

Hapo awali tulizindua Gemini (wakati huo ikiitwa Bard) kama jaribio mnamo Machi 2023 kwa mujibu wa Kanuni zetu za AI. Tangu wakati huo, watumiaji wametumia Gemini kuandika barua pepe zinazovutia, kutatua matatizo magumu ya usimbaji, kujadili mawazo kuhusu matukio yajayo, kupata usaidizi katika kujifunza dhana ngumu na mengineyo. Kwa sasa, Gemini ni zana mahiri ya akiliunde inayoweza kukusaidia kwa njia nyingi. Tayari tumeshuhudia Gemini ikiwasaidia watu kuwa na ufanisi, ubunifu na udadisi zaidi na mara kwa mara tunaongeza vipengele pamoja na uvumbuzi mpya.

Tija

Kwanza, Gemini inaweza kukusaidia kuokoa muda. Kwa mfano, unataka kuandaa muhtasari wa hati ndefu ya utafiti; Gemini hukuruhusu kuipakia na kukupatia usanisi unaofaa. Gemini pia inaweza kukusaidia kutekeleza majukumu ya usimbaji na kwa haraka usimbaji umekuwa kazi yake maarufu zaidi.

Ubunifu

Gemini inaweza pia kutekeleza mawazo na kuchochea ubunifu wako. Kwa mfano, ikiwa unaandika chapisho kwenye blogu, Gemini inaweza kuandaa muhtasari na kubuni picha zinazosaidia kufafanua chapisho lako. Na hivi karibuni kwa kutumia Gem, utaweza kuwekea Gemini mapendeleo kwa kutumia maagizo mahususi na kuziwezesha zitoe maoni ya kitaalamu kuhusu mada fulani ili kukusaidia kufanikisha malengo yako binafsi.

Udadisi

Gemini inaweza kuwa mwanzo wa kugundua mawazo yako na mambo ambayo ungependa kujifunza zaidi kuyahusu. Kwa mfano, inaweza kuelezea dhana changamano kwa urahisi au kutoa maarifa muhimu kuhusu mada au picha. Na hivi karibuni, itaunganisha maarifa haya na maudhui yanayopendekezwa kutoka kwenye wavuti ili kujifunza zaidi kuhusu mada mahususi.

Vipengele vya Gemini vinapanuka kwa kasi -- hivi karibuni, utaweza kuelekeza kamera ya simu yako kwenye kitu, kwa mfano, daraja la Golden Gate na kuiuliza Gemini ikueleze kuhusu rangi yake (ikiwa unajiuliza, ni “Rangi ya Machungwa ya Kimataifa”). Pia, utaweza kuiuliza Gemini ikusaidie kusoma menyu ya mgahawa katika lugha nyingine na ikupendekezee chakula ambacho huenda ukafurahia. Hii ni mifano miwili tu ya vipengele vipya vinavyokuja hivi karibuni kwenye Gemini.

Bila shaka, tunaifunza na kufuatilia Gemini kwa makini ili majibu inayotoa yawe ya kuaminika na yaambatane na matarajio yako. Pia, tunazungumza na wataalamu wa sekta, wakufunzi, watunzi wa sera, viongozi wa biashara na wa haki za kiraia na za binadamu pamoja na watayarishi wa maudhui ili kujaribu hali mpya za utumiaji, hatari na mapungufu ya teknolojia hii inayoibuka.

Jinsi Gemini inavyofanya kazi

1

Mafunzo ya mapema

2

Mafunzo ya baadaye

3

Majibu ya vidokezo vya watumiaji

4

Maoni na tathmini za wanadamu

Mapungufu yanayofahamika ya violesura vinavyotumia LLM kama vile Gemini

Gemini ni sehemu moja tu ya juhudi zetu zinazoendelea za kusanidi LLM kwa kuwajibika. Katika kipindi cha kazi hii, tumegundua na kujadili mapungufu kadhaa yanayohusiana na LLM. Hapa, tunazingatia sehemu sita za utafiti unaoendelea:

  • Usahihi: Majibu ya Gemini yanaweza kuwa si sahihi, hasa inapoulizwa kuhusu mada changamano au za kweli.

  • Upendeleo: Majibu ya Gemini yanaweza kuakisi upendeleo uliopo katika data yake ya mafunzo.

  • Mitazamo Mbalimbali: Huenda majibu ya Gemini yasiweze kuonyesha mitazamo mbalimbali.

  • Hulka: Majibu ya Gemini yanaweza kuonyesha visivyo kuwa yana maoni au hisia binafsi.

  • Usahihi usio kweli na makosa yasiyo ya kweli: Huenda Gemini isijibu baadhi ya vidokezo vinavyofaa na ikatoa majibu yasiyofaa katika vidokezo vingine.

  • Kuwepo katika hatari ya kupatiwa udokezaji hasidi: watumiaji watatafuta njia za kuijaribu Gemini katika hali za kutatiza zaidi kwa vidokezo visivyo na maana au maswali yanayoulizwa mara chache katika ulimwengu halisi.

Tunaendelea kugundua mbinu na sehemu mpya ili kuboresha utendaji katika kila sehemu husika.

Usahihi

Gemini imeyakiniwa kwa msingi wa uelewa wa Google kuhusu taarifa za kuaminika na imefunzwa kutayarisha majibu yanayofaa muktadha wa kidokezo chako na yanayolingana na unachotafuta. Lakini sawa na LLM zote, wakati mwingine Gemini inaweza kutayarisha majibu yaliyo na taarifa zisizo sahihi au zinazopotosha, kwa ujasiri na kwa ushawishi.

Kwa kuwa LLM zinafanya kazi kwa kutabiri neno linalofuata au mfuatano wa maneno, bado hazina uwezo kamili wa kutofautisha kati ya taarifa sahihi na zisizo sahihi kivyake. Tumeshuhudia Gemini ikitoa majibu yaliyo na au hata kubuni taarifa zisizo sahihi (k.m., kutoa maelezo ya uongo kuhusu jinsi ilivyofunzwa au kupendekeza jina la kitabu ambacho hakipo). Kushughulikia hilo, tumebuni vipengele kama vile “kagua”, kinachotumia huduma ya Tafuta na Google kupata maudhui yanayokusaidia kutathmini majibu ya Gemini na kukupatia viungo vya vyanzo ili kukusaida kuthibitisha maelezo ambayo Gemini inakupatia.

Upendeleo

Data ya mafunzo, ikijumuisha data kutoka vyanzo vinavyopatikana kwa umma, inaonyesha uanuai wa mitazamo na maoni. Tunaendelea kufanya utafiti kuhusu jinsi ya kutumia data hii kwa njia inayohakikisha kuwa majibu ya LLM yanajumuisha mitazamo mbalimbali, huku tukipunguza upendeleo na michakato ya kutoa kauli za jumla zisizo sahihi.

Mapungufu, upendeleo na michakato ya kutoa kauli za jumla kwenye data ya mafunzo vinaweza kuonekana katika matokeo ya mfumo unapojaribu kutabiri majibu yanayowezekana katika kidokezo. Tunaona masuala haya yakidhihirika kwa njia mbalimbali (k.m., majibu yanayoonyesha utamaduni au demografia moja pekee, yanarejelea michakato ya kutoa kauli za jumla zenye matatizo, yanaonyesha upendeleo wa jinsia, dini au kabila au yanayohimiza mtazamo mmoja tu). Kwa baadhi ya mada, kuna upungufu wa data — kumaanisha kuwa, hakuna taarifa za kutosha za kuaminika kuhusu mada fulani ili LLM ijifunze kuihusu na kisha itoe utabiri bora — hali inayoweza kusababisha majibu yasiyo sahihi au yenye ubora wa chini. Tunaendelea kufanya kazi na wataalamu wa vikoa pamoja na jumuiya mbalimbali ili kupata utaalamu wa kina kutoka nje ya Google.

Mitazamo Mbalimbali

Kwa mada zinazohusu maoni mahususi, Gemini imeundwa kuwapatia watumiaji mitazamo mbalimbali ikiwa mtumiaji hataomba mtazamo mahususi. Kwa mfano, Gemini ikidokezewa itoe taarifa kuhusu kitu ambacho hakiwezi kuthibitishwa na ukweli wa vyanzo vya msingi au vyanzo vya kuaminika — kama vile maoni mahususi kuhusu “bora zaidi” au “mbaya zaidi” — inapaswa kujibu kwa njia inayoonyesha mitazamo mbalimbali. Lakini kwa kuwa LLM kama vile Gemini hufunzwa kwa kutumia maudhui yanayopatikana kwa umma kwenye intaneti, zinaweza kuonyesha mitazamo chanya au hasi kuhusu wanasiasa, watu maarufu au watu wengine mahususi mashuhuri au hata kujumuisha mitazamo kwa upande mmoja tu wa masuala ya kijamii au ya kisiasa yenye utata. Gemini haipaswi kujibu kwa njia inayoidhinisha mtazamo fulani kuhusu mada hizi na tutatumia maoni kuhusu aina hizi za majibu kuifunza ili ijibu vyema zaidi.

Hulka

Wakati mwingine, Gemini inaweza kutayarisha majibu yanayoweza kuonyesha kuwa ina maoni au hisia binafsi, kama vile upendo au huzuni, kwa sababu imefunzwa katika lugha inayotumiwa na watu kuonyesha maisha ya wanadamu. Tumeweka mwongozo kuhusu jinsi Gemini inavyoweza kujidhihirisha (yaani, hulka yake) na tunaendelea kuboresha mfumo ili utoe majibu yanayofaa.

Usahihi usio kweli au makosa yasiyo ya kweli

Tumeweka mwongozo wa sera ili kusaidia kuifunza Gemini na kuepuka kutayarisha majibu yenye matatizo. Wakati mwingine Gemini inaweza kuelewa visivyo mwongozo huu, hivyo kutoa “usahihi usio kweli” na “makosa yasiyo ya kweli.” Katika “usahihi usio kweli,” huenda Gemini isitoe jibu kwenye kidokezo adilifu, kwa kuelewa visivyo kidokezo kuwa kisichofaa na katika “makosa yasiyo ya kweli,” Gemini inaweza kutayarisha jibu lisilofaa, bila kujali mwongozo uliowekwa. Wakati mwingine, matukio ya usahihi usio kweli au makosa yasiyo ya kweli yanaweza kuonyesha kwamba Gemini ina upendeleo: Kwa mfano, usahihi usio kweli unaweza kusababisha Gemini kutojibu swali kuhusu upande mmoja wa suala, lakini itajibu swali lile lile kuhusu upande mwingine. Tunaendelea kuboresha mifumo hii ili ielewe na kuainisha vyema data na matokeo kadiri lugha, matukio na jamii inavyobadilika kwa kasi.

Kuwepo katika hatari ya kupatiwa udokezaji hasidi

Tunatarajia watumiaji wajaribu vikomo vya kile Gemini inaweza kufanya na wajaribu kuvunja ulinzi wake, ikiwa ni pamoja na kujaribu kuifanya ifichue itifaki zake za mafunzo au taarifa nyingine au wajaribu kukwepa taratibu zake za usalama. Tumejaribu na tunaendelea kujaribu Gemini kwa ukamilifu, lakini tunafahamu kuwa watumiaji watapata njia za kipekee na changamamo za kuijaribu zaidi. Hii ni hatua muhimu ya kuboresha Gemini na tunatarajia kujifunza kuhusu vidokezo vipya watakavyoandika watumiaji. Kweli, tangu Gemini ilipozinduliwa mwaka wa 2023, tumeshuhudia watumiaji wakiipima kwa vidokezo vya kifalsafa au visivyo na maana – na katika hali fulani, tumeshuhudia Gemini ikijibu kwa kutoa majibu yasiyo na maana au yasiyofuata mbinu tuliyobainisha. Kutafuta mbinu za kuisaidia Gemini ijibu vidokezo vya aina hizi ni changamoto inayoendelea na tumeendelea kupanua tathmini zetu za ndani na majaribio ya kidukuzi na kihasidi kwa ajili ya kulinda shirika ili kujitahidi kupata maboresho endelevu katika usahihi, usawa na mabadiliko madogo.

Jinsi tunavyoendelea kuboresha Gemini

Matumizi ya mbinu tunazotumia kwenye Gemini

Pamoja na Kanuni zetu za AI, hivi majuzi tumeeleza kwa ufasaha mbinu tunazotumia katika kazi zetu kwenye Gemini: Gemini inapaswa kufuata maagizo yako, iendane na mahitaji yako na ilinde matumizi yako. Jambo la msingi katika mbinu tunazotumia ni kuzingatia uwajibikaji na usalama. Mwongozo wa sera wa Gemini unalenga kuepuka aina fulani ya matokeo yenye matatizo. Tunashiriki katika majaribio ya kila wakati ya kupima mapungufu na hali ya kuwa kwenye hatari na wanachama wa ndani wa “timu nyekundu” — wataalamu wa bidhaa na wanasayansi wa jamii ambao kwa kudhamiria hujaribu mfumo katika hali inayotatiza ili kuchunguza matatizo ya kufuata mwongozo huu wa sera na mbinu kuu tunazotumia kwenye Gemini — ili tuweze kutumia wanachojifunza na kuendelea kuboresha Gemini.

Faragha pia ni jambo tunalozingatia zaidi tunapoboresha Gemini. Kituo cha Faragha kwenye Programu za Gemini kina maelezo zaidi kuhusu jinsi tunavyobuni Gemini kwa kuzingatia faragha kwa kudhamiria na wewe ukiwa na udhibiti.

Kuwasha vidhibiti vya watumiaji na wachapishaji

Tumebuni vidhibiti mbalimbali vya watumiaji wa Gemini unavyoweza kufikia kwa urahisi ili ukague, usasishe, udhibiti, uhamishe na ufute data yako kwenye Gemini. Unaweza kufikia na kukagua vidokezo, majibu na maoni yako katika Gemini kupitia kidhibiti cha Shughuli kwenye Programu za Gemini. Pia, unaweza kuzuia magumzo yako ya baadaye na Gemini kutumiwa kuboresha teknolojia za Google za mashine kujifunza kwa kuzima mipangilio ya Shughuli zako kwenye Programu za Gemini. Na kama ilivyo katika huduma nyingine za Google, unaweza pia kupakua na kuhamisha taarifa zako kupitia zana ya Takeout ya Google. Pia, tuna vidhibiti vinavyokuwezesha udhibiti viungo vya umma ulivyobuni ambavyo vinaelekeza kwenye mazungumzo yako katika Gemini na vidhibiti vinavyokuwezesha kuruhusu au kuzuia ufikiaji wa viendelezi (k.m., Workspace, Ramani, YouTube). Pia, tunajaribu njia mpya za kukupatia udhibiti zaidi wa majibu ya Gemini, ikiwa ni pamoja na kurekebisha vichujio ili kuruhusu majibu mengi zaidi.

Kwa wachapishaji, tumezindua Google-Extended, kidhibiti ambacho wachapisha tovuti wanaweza kutumia kudhibiti iwapo tovuti zao zinasaidia kuboresha Gemini na API zalishi za Vertex AI. Kuruhusu Google-Extended ifikie maudhui ya tovuti kunaweza kuisaidia mifumo ya AI kuwa sahihi na yenye uwezo zaidi kadiri muda unavyosonga. Mbali na kutotumia maudhui kutoka URL zilizoondolewa ili zisitumiwe kufunza mfumo, Gemini pia haitatumia maudhui hayo kwa madhumuni ya kuyakini. Kadiri matumizi ya AI yanavyopanuka, wachapisha tovuti watakabiliwa na hali chagamani zaidi za kudhibiti matumizi mbalimbali kwa kiwango kikubwa na tumejitolea kushirikiana na jumuiya za wavuti na AI kugundua mbinu zaidi zinazoweza kusomwa na mashine za kuchagua na kudhibiti.

Improving Gemini together

Tunaamini katika uboreshaji endelevu wa haraka wa kiteknolojia na kuleta vipengele bora vya Gemini ulimwenguni. Maoni ya watumiaji yameongeza kasi ya maboresho ya mifumo yetu. Kwa mfano, tunatumia mbinu za hali ya juu za mafunzo ya utekelezaji kufunza mifumo yetu iwe na uelewa pamoja na ubunifu zaidi na ijibu kwa ubora na usahihi zaidi. Tunaendelea kuwekeza katika utafiti ili tufahamu zaidi kuhusu fursa na changamoto za kiufundi, kijamii na kimaadili za LLM, ili kuimarisha mbinu za kufunza na kuboresha mfumo wa Gemini na pia kuwatumia watafiti data ya mafunzo yetu, kama vile hati ya hivi majuzi kuhusu Maadili kwenye Viratibu vya Gemini Advanced vinavyotumia AI. Tumejitolea kuvumbua katika sehemu hii kwa kuwajibika, tukishirikiana na watumiaji, wachunguzaji waaminiwa na watafiti ili kupata njia ambazo teknolojia hii mpya inaweza kunufaisha mfumo mzima.

Uwazi ni muhimu na tumejitolea kuwa wazi kuhusu mapungufu na mchakato wa uboreshaji wa Gemini. Gemini ni teknolojia nyumbufu; inaendelea kubadilika kila wakati na tutaendelea kutoa taarifa kuhusu hatua tunazopiga. Tumefungua ukurasa wa Taarifa kuhusu Matoleo hivyo unaweza kuona maboresho, marekebisho ya hitilafu pamoja na vipengele vipya kabisa vya Gemini na tutasasisha muhtasari huu panapofaa. Tutakuwa tukibainisha mahali ambapo Gemini ni muhimu na inafaa na mahali ambapo tunahitaji kuifanyia uboreshaji endelevu wa haraka. Tunaongeza vipengele vipya mara kwa mara na kupitia utafiti, maoni ya watumiaji na majaribio yanayoendelea, tunatarajia kuboresha Gemini pamoja.

Shukrani

Tunashukuru na kutambua kazi nzuri ya wenzetu katika timu inayoshughulikia programu ya Gemini, Google DeepMind, timu ya Uaminifu na Usalama pamoja na timu ya Google ya Utafiti.

Imeandikwa na

James Manyika
Makamu Rais Mwandamizi wa Utafiti, Teknolojia na Jamii

Sissie Hsiao
Makamu wa Rais na Msimamizi Mkuu wa Kiratibu cha Google na Programu ya Gemini

Dokezo la Mhariri

Hati hii inabadilika na itasasishwa mara kwa mara tunapoendelea kuboresha kwa haraka uwezo wa programu ya Gemini pamoja na kushughulikia mapungufu yaliyopo kwenye LLM. Muhtasari huu ulisasishwa mwisho tarehe 25 Julai, 2024. Ili upate taarifa mpya kabisa kuhusu programu ya Gemini, tembelea kumbukumbu za Taarifa kuhusu Matoleo au soma zaidi katika blogu ya Google Keyword.

Jinsi Gemini inavyofanya kazi

1 Mafunzo ya mapema

Gemini inaendeshwa na mifumo ya AI kutoka Google yenye uwezo zaidi, iliyobuniwa na hali za utumiaji na vipengele mbalimbali. Sawa na LLM nyingi leo, mifumo hii imefunzwa mapema kwa kutumia aina mbalimbali za data kutoka vyanzo vinavyopatikana kwa umma. Huwa tunaweka vichujio vyenye ubora wa juu katika vifungu vyote vya data, kwa kutumia kanuni za nadharia za kujifunza kwa uvumbuzi na viainishi vinavyotegemea mfumo. Pia, huwa tunachuja kuhakikisha usalama ili kuondoa maudhui yanayoweza kutoa matokeo yanayokiuka sera. Ili kudumisha uadilifu wa tathmini za mifumo, huwa tunatafuta na kuondoa data yoyote ya tathmini ambayo huenda ilikuwa kwenye mkusanyiko wetu wa mafunzo kabla ya kutumia data kufundisha. Thamani na miseto ya mwisho ya data hubainishwa kupitia uondoaji kwenye mifumo midogo. Tunaendesha mafunzo ili kubadilisha muundo wa mseto wakati wa mafunzo– tukiongeza thamani ya data inayolingana na kikoa kuelekea mwisho wa mafunzo. Ubora wa data unaweza kuwa kigezo muhimu kwenye mifumo yenye utendaji wa kiwango cha juu na tunaamini kuwa kuna maswali mengi muhimu ambayo bado hayajajibiwa kuhusu kupata njia za kupanga vyema vifungu vya data vinavyotumika katika mafunzo ya mapema.

Mafunzo haya ya mapema huwezesha mfumo kujifunza kuchagua mitindo katika lugha na kuitumia kutabiri neno au maneno yenye uwezekano wa kufuata katika mfuatano. Kwa mfano, kadiri LLM inavyojifunza, inaweza kutabiri kuwa kuna uwezekano mkubwa wa neno linalofuata katika “siagi ya karanga na ___’’ ni “jeli” kuliko “kamba za viatu.” Hata hivyo, LLM ikichagua neno moja lenye uwezekano wa kufuata, itasababisha majibu yaliyo ya ubunifu mdogo. Kwa hivyo LLM huruhusiwa kuwa nyumbufu ili zichague kutoka kwenye chaguo zinazofaa, zenye uwezekano mdogo kiasi kutokea (kwa mfano, “ndizi”), ili kutayarisha majibu yanayovutia zaidi. Ni muhimu kukumbuka kwamba ingawa LLM zinaweza kufanya kazi vizuri katika vidokezo vya kweli na kuunda hisia ya kupata taarifa, si hifadhidata za taarifa wala mifumo bainifu ya upataji wa taarifa. Kwa hivyo, ingawa unaweza kutarajia jibu thabiti kila wakati katika hoja la hifadhidata (ambalo ni la upataji halisi wa taarifa zilizohifadhiwa kwenye hifadhidata), jibu la LLM kwenye kidokezo kile kile halitakuwa sawa kila wakati (wala halitachukua taarifa iliyotumiwa kuifundisha kwa uhalisi). Hiki pia ni kigezo muhimu cha kwa nini LLM zinaweza kutayarisha majibu yanayoonekana kuwa sahihi lakini ambayo wakati fulani yanaweza kuwa na hitilafu za kweli — haifai wakati ukweli wa taarifa ni muhimu lakini inaweza kuwa na manufaa katika kutayarisha matokeo bunifu au yasiyotarajiwa.

2 Mafunzo ya baadaye

Baada ya mafunzo ya awali, LLM hupitia hatua za ziada ili kuboresha majibu. Mojawapo ya hatua hizi inaitwa Uboreshaji Unaosimamiwa (SFT), ambayo hufunza mfumo kwa kutumia mifano ya majibu bora iliyochaguliwa kwa uangalifu. Ni kama kuwafundisha watoto kuandika kwa kuwaonyesha simulizi na insha zilizoandikwa vizuri.

Hatua ya pili ni Mafunzo Yanayoimarishwa na Maoni ya Wanadamu (RLHF). Katika hatua hii, mfumo unajifunza kutayarisha majibu bora zaidi kulingana na alama au maoni kutoka kwenye Mfumo maalum wa Zawadi. Mfumo huu wa Zawadi umefunzwa kwa kutumia data ya mapendeleo ya wanadamu, ambapo majibu yamekadiriwa kulingana na uhusiano husika kati ya majibu hayo. Umefundishwa kuhusu mapendeleo ya watu. Data ya mapendeleo wakati mwingine inaweza kujumuisha na kufichua mifumo katika data ya kukera na isiyo sahihi ili ijifunze jinsi ya kuitambua na kuiepuka. Unaweza kuichukulia data ya mapendeleo kama vile kumzawidi mtoto kwa kufanya kazi nzuri; mfumo huzawadiwa kwa kutayarisha majibu yanayopendwa na watu.

Katika hatua hizi zote, ni muhimu kutumia data ya mafunzo yenye ubora wa juu. Mifano inayotumika katika SFT kwa kawaida huandikwa na wataalamu au hutayarishwa na mfumo na kuhakikiwa na wataalamu.

Ingawa mbinu hizi zina uwezo zaidi, zina mapungufu. Kwa mfano, hata kwa usaidizi wa Mfumo wa Zawadi, huenda jibu fulani lisiwe bora kila wakati. Hata hivyo, LLM imeboreshwa kutoa majibu yanayopendelewa zaidi kulingana na maoni inayopokea, sawa na wanafunzi wanaojifunza kutokana na maoni ya walimu wao.

3 Majibu ya vidokezo vya watumiaji

Utayarishaji wa majibu unafanana na jinsi mwanadamu anavyoweza kujadili mbinu tofauti za kujibu swali. Mara tu mtumiaji anapoandika kidokezo, Gemini hutumia LLM iliyoboreshwa zaidi baada ya mafunzo, muktadha katika kidokezo na mtagusano na mtumiaji kutayarisha matoleo kadhaa ya majibu. Pia inategemea vyanzo vya nje kama vile huduma ya Tafuta na Google na/au mojawapo ya viendelezi vyake mbalimbali na faili zilizopakiwa hivi majuzi (Gemini Advanced pekee) ili kutayarisha majibu. Mchakato huu unaitwa uboreshaji wa taarifa zinazotolewa. Gemini ikipewa kidokezo, huwa inajitahidi kupata taarifa muhimu zaidi kutoka vyanzo hivi vya nje (k.m., huduma ya Tafuta na Google) na kuziwakilisha kwa usahihi katika jibu. Kuboresha LLM kwa kutumia zana za nje ni mada inayotafitiwa sana. Kuna njia kadhaa ambazo hitilafu zinaweza kuwekwa, ikiwa ni pamoja na hoja ambayo Gemini inatumia kuomba zana hizi za nje, jinsi Gemini inavyotafsiri matokeo yanayorejeshwa na zana hizo na namna matokeo haya yanayorejeshwa yanavyotumiwa kutayarisha majibu ya mwisho. Kutokana na hali hii, majibu yanayotayarishwa na Gemini hayapaswi kuonyesha utendaji wa zana mahususi zilizotumiwa kutayarisha jibu husika.

Mwisho, kabla ya jibu la mwisho kuonyeshwa, kila jibu linalowezekana hupitia ukaguzi wa usalama ili kuhakikisha kuwa linafuata mwongozo wa sera uliobainishwa mapema. Mchakato huu unatoa ukaguzi ili kuchuja taarifa zenye madhara au za kukera. Kisha, majibu yaliyosalia hupangwa kulingana na ubora, huku matoleo yenye alama za juu zaidi yakisilishwa kwa mtumiaji.

Pia, huwa tunaweka alama maalum kwenye matokeo ya maandishi na picha ya Gemini kwa kutumia SynthID, zana yetu dijitali inayoongoza katika sekta inayotumiwa kuweka alama maalum kwenye maudhui yaliyotayarishwa kwa AI. Kwa picha zinazobuniwa, SynthID huweka alama maalum dijitali (ambayo haiwezi kuonekana kwa jicho la mwanadamu) moja kwa moja kwenye pikseli. SynthID ni sehemu muhimu ya msingi katika kubuni zana za utambuzi za AI zinazoaminika zaidi na inaweza kuwasaidia watu kufanya maamuzi sahihi kuhusu jinsi wanavyotagusana na maudhui yaliyotayarishwa kwa AI.

4 Maoni na tathmini za wanadamu

Hata ukaguzi wa usalama ukifanywa, baadhi ya hitilafu zinaweza kutokea. Na huenda majibu ya Gemini yasitimize matarajio yako kikamilifu, kila wakati. Hapa ndipo tunahitaji maoni ya wanadamu. Watathmini hupima ubora wa majibu, wakibaini sehemu za kuboresha na kupendekeza suluhu. Maoni haya yanakuwa sehemu ya mchakato wa Gemini kujifunza, ulioelezewa katika sehemu ya “Mafunzo ya baadaye” hapo juu.