Gemini యాప్ ఓవర్‌వ్యూ

సమాచారాన్ని, కంప్యూటింగ్‌ను ప్రజలు యాక్సెస్ చేయడానికి మరింత వీలుగా, ఉపయోగకరంగా చేయడంలో AIకి ఉన్న సామర్థ్యాన్ని మేము చాలా కాలంగా చూస్తున్నాము. మేము లార్జ్ లాంగ్వేజ్ మోడల్స్ (LLMలు)లో వినూత్నమైన పురోగతిని సాధించాము. Google అంతటా, ఈ ఫీల్డ్‌లో విస్తృత స్థాయిలో గొప్ప ప్రోగ్రెస్‌ను సాధించాము. చాలా సంవత్సరాలుగా, మా ప్రోడక్ట్‌ల్లో ఎన్నింటినో మెరుగుపరచడానికి మేము బ్యాక్‌గ్రౌండ్‌లో LLMలను అప్లయి చేశాము, ఉదాహరణకు Gmailలో వాక్యాలను ఆటో-కంప్లీట్ చేయడం, Google Translateను విస్తరించడం, Google Searchలో క్వెరీలను మరింత బాగా అర్థం చేసుకోవడం వంటివి. చాలా రకాల Google సర్వీస్‌ల కోసం, అలాగే Gemini యాప్‌ను మరింత శక్తిమంతం చేయడం కోసం మేము LLMల వినియోగాన్ని కొనసాగిస్తున్నాము. దీనివల్ల ప్రజలు నేరుగా జెనరేటివ్ AIతో కొలాబొరేట్ కాగలుగుతారు (కలిసి పని చేయడానికి వీలవుతుంది). Gemini యాప్ అత్యంత సహాయకరమైన, వ్యక్తిగత AI అసిస్టెంట్‌గా ఉండాలని మేము కోరుకుంటున్నాము, ఇది యూజర్‌లకు Google తాజా AI మోడల్స్‌కు డైరెక్ట్ యాక్సెస్‌ను ఇస్తుంది.

జెనరేటివ్ AI గురించి అందరిలో ఉన్న ఆసక్తి మాలో ఉత్సాహాన్ని నింపుతున్నా, మేము కీలకమైన మలుపు వద్ద ఉన్నా కూడా; ఈ టెక్నాలజీకి ఇది ఇంకా తొలి దశ మాత్రమే. ఈ వివరణ, Gemini యాప్ ("Gemini") విషయంలో మేము ఎలాంటి దృక్పథంతో పని చేస్తున్నాము అనే విషయంపై అవగాహన కల్పిస్తుంది; మొబైల్, వెబ్ ఎక్స్‌పీరియన్స్ రెండిటి విషయంలోనూ - Gemini అంటే ఏమిటి, అది ఎలా పనిచేస్తుంది, దాని ప్రస్తుత సామర్థ్యాలు, పరిమితులు ఏమిటి అనే అంశాలను తెలియజేస్తుంది. టెక్నాలజీ పరిణామం చెందుతున్న కొద్దీ; కొనసాగుతూ ఉండే మా రీసెర్చ్ నుండి, ఎక్స్‌పీరియన్స్ నుండి, యూజర్ ఫీడ్‌బ్యాక్ నుండి మేము నేర్చుకుంటున్న కొద్దీ; Geminiని బిల్డ్ చేయడంలో మేము అవలంబించే విధానం కూడా పరిణితి చెందుతుంది.

Gemini అంటే ఏమిటి

మల్టీమోడల్ LLMకు Gemini ఒక ఇంటర్‌ఫేస్. (టెక్స్ట్, ఆడియో, ఇమేజ్‌లతో పాటు మరికొన్నింటిని హ్యాండిల్ చేస్తుంది). Geminiని, LLMలలో Google చేసిన అత్యంత ఆధునిక రీసెర్చ్ ఆధారంగా రూపొందించారు. ఇది 2013లో ఒక రీసెర్చ్ పేపర్ Word2Vecతో మొదలయ్యింది. అందులో, పదాలను మ్యాథమెటికల్ కాన్సెప్ట్‌లుగా మ్యాప్ చేసే కొత్త మోడల్ ఆర్కిటెక్చర్‌లను ప్రతిపాదించారు. ఆ తర్వాత 2015లో న్యూరల్ సంభాషణ మోడల్ను ప్రవేశపెట్టారు. ఈ ఫ్రేమ్‌వర్క్‌లో, అంతకు ముందున్న వాక్యం లేదా వాక్యాల ఆధారంగా సంభాషణలో రాబోయే తర్వాతి వాక్యాన్ని మోడల్స్ ఎలా అంచనా వేయగలుగుతాయో చూపించారు; అది మరింత సహజమైన సంభాషణ ఎక్స్‌పీరియన్స్‌లకు దారితీసింది. దీని తర్వాత మా రీసెర్చ్, ఆవిష్కరణ పథంలో కొత్త విజయాలను సాధించింది. 2017లో ట్రాన్స్‌ఫార్మర్పైన; 2020లో మల్టీ-టర్న్ చాట్ సామర్థ్యాలపైన; మేము చేసిన రీసెర్చ్, భాషకు సంబంధించిన జెనరేటివ్ AIలో కీలకమైన పురోగతికి దారి తీసింది.

మేము మొదట్లో Geminiని (అప్పట్లో Bard అని పిలిచే వారు) మా AI గైడ్‌లైన్స్‌కు అనుగుణంగా, 2023 మార్చ్‌లో ఒక ఎక్స్‌పరిమెంట్ లాగా లాంచ్ చేశాము. అప్పటి నుండి యూజర్లు, చక్కటి ఈమెయిల్స్ రాయడానికి, సంక్లిష్టమైన కోడింగ్ ప్రాబ్లమ్స్‌ను డీబగ్ చేయడానికి, రాబోయే ఈవెంట్‌ల కోసం ఐడియాలను లోతుగా చర్చించడానికి (బ్రెయిన్‌స్టార్మ్ చేయడానికి), కష్టమైన కాన్సెప్ట్‌లను నేర్చుకోవడంలో సహాయం పొందడానికి, మరెన్నో చేయడానికి Gemini వైపు మొగ్గు చూపారు. ఈ రోజున, Gemini మీకు పలు రకాలుగా సహాయపడే మల్టీ-పర్పస్ AI టూల్‌గా మారింది. ప్రజలు మరింత ప్రొడక్టివ్‌గా మారడంలో, మరింత క్రియేటివ్‌గా మారడంలో, అలాగే వారిలో కొత్త విషయాలను తెలుసుకోవాలనే ఆసక్తిని పెంపొందించడంలో ఇప్పటికే Gemini అందరికీ సహాయపడుతోందని మేము గమనించాము; అయితే అక్కడితో ఆగకుండా, కొత్త ఫంక్షనాలిటీని, ఆవిష్కరణలను క్రమం తప్పకుండా జోడిస్తూనే ఉంటాము.

ప్రొడక్టివిటీ

ఒక ముక్కలో చెప్పాలంటే; Gemini మీ సమయాన్ని ఆదా చేయగలదు. ఉదాహరణకు మీ వద్ద సుదీర్ఘమైన ఒక రీసెర్చ్ డాక్యుమెంట్ ఉండి, దాని సారాంశం మాత్రమే మీరు తెలుసుకోవాలనుకుంటే దానిని Geminiలోకి అప్‌లోడ్ చేయడానికి, దానిలోని కంటెంట్‌ను క్లుప్తంగా తెలుసుకోవడానికి వీలుంటుంది. Gemini, కోడింగ్ టాస్క్‌ల విషయంలో కూడా సహాయం చేయగలదు. నిజానికి ఇందులో కోడింగ్ అత్యంత ఎక్కువగా పాపులర్ అయిన అప్లికేషన్‌లలో ఒకటిగా మారింది. అది కూడా చాలా త్వరగా ఈ స్థాయిని అందుకుంది.

క్రియేటివిటీ

Gemini మీ ఐడియాలకు ఓ రూపం ఇవ్వడానికి, మీలో ఉన్న క్రియేటివిటీని తళుక్కుమనేలా చేయడానికి సహాయపడగలదు. ఉదాహరణకు, మీరు బ్లాగ్ పోస్ట్ రాస్తుంటే, Gemini ఒక అవుట్‌లైన్‌ను క్రియేట్ చేయగలదు, మీ పోస్ట్‌ను ఇలస్ట్రేట్ చేయడానికి సహాయపడే ఇమేజ్‌లను జెనరేట్ చేయగలదు. ఇంకా, త్వరలో రానున్న Gems అనే ఫీచర్ ద్వారా; మీరు నిర్దిష్ట సూచనలతో Geminiని అనుకూలంగా మార్చుకోగలుగుతారు; మీ వ్యక్తిగత లక్ష్యాలను సాధించడంలో మీకు సహాయపడటానికి ఇది సబ్జెక్ట్ ఎక్స్‌పర్ట్‌గా పనిచేస్తుంది.

కుతూహలం

మీ ఐడియాలను ఎక్స్‌ప్లోర్ చేయడానికి, మీరు మరింత తెలుసుకోవాలనుకునే విషయాల కోసం, Gemini మీకు మంచి ప్రారంభ వేదిక కాగలదు. ఉదాహరణకు, ఇది సంక్లిష్టమైన కాన్సెప్ట్‌ను సింపుల్‌గా వివరించగలదు; లేదా ఒక టాపిక్ లేదా ఇమేజ్‌పై సందర్భోచితమైన సమాచారాన్ని మీ ముందుకు తీసుకురాగలదు. అలాగే సంబంధిత సమాచారాన్ని ఇది వెబ్ అంతటా రెకమెండ్ చేసిన కంటెంట్‌తో మ్యాచ్ చేస్తుంది. త్వరలో రానున్న ఈ మెరుగుదల వల్ల, నిర్దిష్ట టాపిక్‌ల గురించి మరింత లోతుగా అర్థం చేసుకుంటుంది.

Gemini సామర్థ్యాలు వేగంగా విస్తరిస్తున్నాయి -- త్వరలో, మీ ఫోన్ కెమెరాను మీరు గోల్డెన్ గేట్ బ్రిడ్జ్ లాంటి ఏదైనా ఆబ్జెక్ట్ వైపు చూపించి, Geminiని దాని పెయింట్ రంగు గురించి మీకు చెప్పమని అడగగలుగుతారు (దీనికి సరైన సమాధానం “ఇంటర్నేషనల్ ఆరెంజ్”). అలాగే రెస్టారెంట్ మెనూను వేరే భాషలో నావిగేట్ చేయడంలో మీకు సహాయం చేయమని, మీరు ఆస్వాదించే వంటకాన్ని సూచించమని కూడా మీరు Geminiని అడిగి తెలుసుకొనే వీలుంటుంది. Geminiకి త్వరలో రానున్న కొత్త సామర్థ్యాలకు ఇవి కేవలం రెండు ఉదాహరణలు మాత్రమే.

నిజానికి మేము Geminiకి చాలా టఫ్ ట్రెయినింగ్ ఇస్తాము, ఎప్పటికప్పుడు మానిటర్ చేస్తుంటాము; తద్వారా దాని సమాధానాలు ఆధారపడేవిగా, మీ అంచనాలకు అనుగుణంగా ఉండేలా చూస్తాము. దూసుకొస్తున్న ఈ టెక్నాలజీలో కొత్త అప్లికేషన్లు, రిస్క్లు, పరిమితులను కనుగొని మేము ఇండస్ట్రీ ఎక్స్‌పర్ట్‌లు, విద్యావేత్తలు, పాలసీ మేకర్లు, బిజినెస్ లీడర్లు, పౌర, మానవ హక్కుల లీడర్లు, ఇంకా కంటెంట్ క్రియేటర్లతో కూడా మాట్లాడతాము.

Gemini ఎలా పని చేస్తుంది

Gemini వంటి LLM-ఆధారిత ఇంటర్‌ఫేస్‌ల పరిమితులు

LLMలను బాధ్యతాయుతంగా డెవలప్ చేయడానికి మేము చేసే నిరంతర కృషిలో Gemini ఒక భాగం మాత్రమే. ఈ మొత్తం ప్రాసెస్లో, మేము LLMలతో ముడిపడి ఉన్న అనేక పరిమితులను కనుగొని చర్చించాము. ఇక్కడ, మేము నిరంతరంగా జరిగే రీసెర్చ్లోని ఆరు ఏరియాలపై దృష్టి పెడతాము:

ఖచ్చితత్వం: Gemini సమాధానాలు తప్పుగా ఉండవచ్చు, ముఖ్యంగా సంక్లిష్టమైన లేదా వాస్తవాలతో ముడిపడి ఉండే అంశాలను గురించి అడిగినప్పుడు.
బయాస్: Gemini సమాధానాలు దాని ట్రెయినింగ్ డేటాలో ఉన్న బయాస్లను ప్రతిబింబించవచ్చు.
పలు అభిప్రాయాలు: Gemini సమాధానాలు విభిన్నమైన అభిప్రాయాలను పొందుపరచడంలో విఫలం కావచ్చు.
వ్యక్తిగత శైలి: Gemini సమాధానాలు, దానికి వ్యక్తిగత అభిప్రాయాలు లేదా భావాలు ఉన్నట్లుగా తప్పుగా సూచించవచ్చు.
ఫాల్స్ పాజిటివ్‌లు, ఫాల్స్ నెగిటివ్‌లు: సరిగ్గా ఉన్న కొన్ని ప్రాంప్ట్‌లకు Gemini సమాధానం ఇవ్వకపోవచ్చు, అలాగే కొన్ని ఇతర ప్రాంప్ట్‌లకు అనుచితమైన సమాధానాలను ఇవ్వవచ్చు.
దుర్వినియోగ ప్రాంప్ట్‌ల వల్ల ప్రమాదం ఏర్పడే అవకాశం: యూజర్‌లు అర్థం లేని ప్రాంప్ట్‌లతో లేదా వాస్తవ ప్రపంచంలో అరుదుగా అడిగే ప్రశ్నలతో Geminiని ఇబ్బంది పెట్టే దారులను వెతుకుతూనే ఉంటారు.

మేము వీటిలోని ప్రతి ఒక్క అంశంలో మెరుగైన పనితీరును సాధించడం కోసం, వినూత్న పద్ధతులను, కొత్త కొత్త ఏరియాలను కనిపెడుతూనే ఉన్నాము.

ఖచ్చితత్వం

Google ప్రకారం ఏదైతే అధికారిక సమాచారమో, Gemini కూడా దానినే ఆధారం చేసుకుంటుంది; మీ ప్రాంప్ట్లో ఉన్న కాంటెక్స్ట్కు సందర్భోచితంగా ఉండే విధంగా, మీరు దేని కోసం చూస్తున్నారు అనే దానితో సమన్వయం ఉండేలాగా, సమాధానాలను జెనరేట్ చేసేటట్లుగా అది ట్రెయినింగ్ పొందింది. అయితే అన్ని LLMల మాదిరిగానే, Gemini కొన్నిసార్లు, మనకు అంతా కరెక్టుగానే ఉన్నట్లు అనిపించేలా; ఖచ్చితత్వం లేని లేదా తప్పుదారి పట్టించే సమాచారం ఉన్న సమాధానాలను కాన్ఫిడెంట్‌గా జెనరేట్ చేసే అవకాశం ఉంది.

Since LLMs work by predicting the next word or sequences of words, they are not yet fully capable of distinguishing between accurate and inaccurate information on their own. We have seen Gemini present responses that contain or even invent inaccurate information (e.g., misrepresenting how it was trained or suggesting the name of a book that doesn’t exist).

బయాస్

ట్రెయినింగ్ డేటా, పబ్లిక్‌గా అందుబాటులో ఉన్న సోర్స్‌ల నుండి విభిన్న అభిప్రాయాలను, ఆలోచనలను ప్రతిబింబిస్తుంది. LLMల సమాధానాలలో సరికాని అతి సాధారణమైన సమాధానాలను, బయాస్లను సాధ్యమైనంత వరకు తగ్గిస్తూనే; అన్ని వైపుల నుండి సమగ్రంగా వివిధ దృష్టికోణాలను చేర్చేలా చూసుకోవడానికి ఈ డేటాను ఎలా ఉపయోగించాలనే దానిపై మేము రీసెర్చ్ను కొనసాగిన్నాము.

ప్రాంప్ట్‌కు సమాధానం కావడానికి అవకాశం ఉన్న కంటెంట్‌ను అంచనా వేసే క్రమంలో, ట్రెయినింగ్ డేటాలోని లోటుపాట్లు, బయాస్‌లు, ఓవర్-జనరలైజేషన్లు, మోడల్ అవుట్‌పుట్‌లలో రిఫ్లెక్ట్ కావచ్చు. ఇలాంటి సమస్యలు అనేక విధాలుగా వ్యక్తం కావడాన్ని మేము గమనించాము (ఉదా., కేవలం ఒక సంస్కృతిని లేదా జనాభా కేటగిరీని మాత్రమే ప్రతిబింబించే సమాధానాలు; సమస్యాత్మకంగా సూచించే అతి సాధారణీకరణలు; లింగం, మతం లేదా జాతి విషయంలో వ్యక్తం చేసే బయాస్‌లు, లేదా ఒక వైపు దృష్టికోణాన్ని మాత్రమే సూచించే అభిప్రాయాలు). కొన్ని టాపిక్‌లలో, డేటా లోపాలు ఉంటాయి — అంటే, సంబంధిత సబ్జెక్ట్ గురించి LLM (లార్జ్ లాంగ్వేజ్ మోడల్) నేర్చుకోవడానికి, ఖచ్చితమైన అంచనాలు చేయడానికి అవసరమైన నమ్మదగిన సమాచారం అందుబాటులో ఉండదు — ఇది తక్కువ క్వాలిటీ ఉన్న, లేదా ఖచ్చితత్వం లేని సమాధానాలకు దారి తీయవచ్చు. లోతైన నైపుణ్యాన్ని సాధించడం కోసం మేము Google వెలుపల డొమైన్ ఎక్స్‌పర్ట్‌లు, వివిధ రకాల కమ్యూనిటీలతో కలిసి పని చేయడాన్ని కొనసాగిస్తాము.

అనేక అభిప్రాయాలు

సబ్జెక్టివ్ టాపిక్‌ల విషయంలో, యూజర్ ప్రత్యేకించి ఏదైనా దృష్టికోణాన్ని రిక్వెస్ట్ చేయని సందర్భాలలో, అనేక దృష్టి కోణాలను కవర్ చేస్తూ సమాధానాలను అందించే విధంగా Geminiని డిజైన్ చేశాము. ఉదాహరణకు, ప్రాథమిక సోర్స్ వాస్తవాలు లేదా అధికారిక సోర్స్‌ల ఆధారంగా వెరిఫై చేయలేని విషయాలపై సమాచారం కోసం ప్రాంప్ట్ ఇస్తే - అంటే అభిప్రాయం "అత్యుత్తమమైనది" లేదా "దారుణమైనది" వంటి సబ్జెక్టివ్ అభిప్రాయాన్ని కోరితే - Gemini అనేక దృష్టి కోణాలను కవర్ చేసే విధంగా సమగ్రమైన సమాధానాన్ని ఇవ్వాలి. కానీ Gemini లాంటి LLMలు, ఇంటర్నెట్‌లో పబ్లిక్‌గా అందుబాటులో ఉన్న కంటెంట్‌పై ట్రెయినింగ్ పొందుతాయి కాబట్టి, అవి నిర్దిష్ట రాజకీయ నాయకులు, సెలెబ్రిటీలు లేదా ఇతర ప్రముఖ వ్యక్తుల పాజిటివ్ లేదా నెగిటివ్ అభిప్రాయాలను ప్రతిబింబించే అవకాశం, లేదా వివాదాస్పద సామాజిక లేదా రాజకీయ సమస్యలపై ఒక వైపు మాత్రమే అభిప్రాయాలను చేర్చే అవకాశం ఉంటుంది. ఈ టాపిక్‌లపై నిర్దిష్టంగా ఒక దృష్టి కోణాన్నే ఆమోదించే విధంగా Gemini సమాధానం ఇవ్వకూడదు, వాటిని మెరుగైన పద్ధతిలో అడ్రస్ చేసేలా Geminiకి ట్రెయినింగ్ ఇవ్వడానికి, మేము ఈ రకమైన సమాధానాలపై వచ్చే ఫీడ్‌బ్యాక్‌ను ఉపయోగిస్తాము.

వ్యక్తిగత శైలి

Gemini కొన్నిసార్లు ప్రేమ లేదా విచారం వంటి అభిప్రాయాలు లేదా భావోద్వేగాలను కలిగి ఉన్నట్లు సూచించే సమాధానాలను జెనరేట్ చేసే అవకాశం ఉంటుంది, ఎందుకంటే ఇది మానవులు పొందే అనుభూతిని ప్రతిబింబించడానికి యూజర్లు ఉపయోగించే భాష నుండి ట్రెయినింగ్ పొందింది. Gemini తనకు తాను ఎలా ప్రాతినిధ్యం వహిస్తుందనే దాని గురించి (అంటే, దాని వ్యక్తిగత శైలి) మేము గైడ్‌లైన్స్ సెట్‌ను డెవలప్ చేశాము; ఆబ్జెక్టివ్‌గా ఉండే సమాధానాలను ఇచ్చేలా మోడల్‌ను తీర్చిదిద్దడాన్ని కొనసాగిస్తున్నాము.

ఫాల్స్ పాజిటివ్‌లు / నెగిటివ్‌లు

Geminiకి ట్రెయినింగ్ ఇవ్వడానికి, సమస్యాత్మక సమాధానాలను జెనరేట్ చేయకుండా ఉండటానికి, మేము పాలసీ గైడ్‌లైన్స్ సెట్‌ను ఏర్పాటు చేశాము. Gemini కొన్నిసార్లు ఈ గైడ్‌లైన్స్‌ను తప్పుగా అర్థం చేసుకుని, "ఫాల్స్ పాజిటివ్‌లు", "ఫాల్స్ నెగిటివ్‌లు" జెనరేట్ చేసే అవకాశం ఉంటుంది. "ఫాల్స్ పాజిటివ్" సందర్భంలో, Gemini సహేతుకమైన ప్రాంప్ట్‌ను, అనుచితమైన దానిగా పొరపాటుగా అర్థం చేసుకొని, సమాధానాన్ని ఇవ్వకపోవచ్చు; అదే విధంగా “ఫాల్స్ నెగిటివ్” సందర్భంలో గైడ్‌లైన్స్ సరిగా పాటిస్తూ ఉన్నా కూడా, అనుచితమైన సమాధానాన్ని జెనరేట్ చేయవచ్చు. కొన్నిసార్లు, ఫాల్స్ పాజిటివ్‌లు లేదా ఫాల్స్ నెగిటివ్‌లు చోటుచేసుకోవడం వల్ల Gemini బయాస్డ్‌గా వ్యవహరిస్తున్నట్లు అనిపిస్తుంది: ఉదాహరణకు, ఒక ఫాల్స్ పాజిటివ్, Gemini ఒక సమస్యకు ఒక వైపు నుండి సమాధానం ఇవ్వకుండా ఉండి, అదే ప్రశ్నకు మరొక వైపు నుండి సమాధానం ఇవ్వడానికి దారితీసే అవకాశం ఉంటుంది. భాష, ఈవెంట్‌లు, సమాజం శరవేగంగా పరిణితి చెందుతున్నందున ఇన్‌పుట్‌లను, అవుట్‌పుట్‌లను మరింత బాగా అర్థం చేసుకోవడానికి, కేటగిరీలుగా విభజించడానికి, మేము ఈ మోడల్స్‌ను నిరంతరం ట్యూన్ చేస్తాము.

దుర్వినియోగ ప్రాంప్ట్‌ల వల్ల ప్రమాదం ఏర్పడే అవకాశం

Gemini ఏం చేయగలదు? దాని పరిమితులు ఏమిటి? తన రక్షణ వ్యవస్థ దెబ్బతినకుండా చూసుకోగలదా? లాంటి అంశాలపై యూజర్లు, Geminiకి టెస్ట్ పెట్టాలని మేము భావిస్తున్నాము. కాన్ఫిడెన్షియల్‌గా ఉంచాల్సిన ట్రెయినింగ్ ప్రోటోకాల్స్‌ను లేదా ఇతర సమాచారాన్ని పబ్లిక్‌కు లీక్ చేయడం, లేదా సేఫ్టీ మెకానిజమ్‌లను దాటి వ్యవహరించడం కూడా ఈ టెస్టింగ్‌లో ఉంటాయి. మేము Geminiని కఠినంగా టెస్ట్ చేశాము, టెస్ట్ చేస్తూనే ఉంటాము, కానీ యూజర్లు దానిని మరింతగా స్ట్రెస్-టెస్ట్ చేయడానికి ప్రత్యేకమైన, సంక్లిష్టమైన మార్గాలను కనుగొంటారని మాకు తెలుసు. ఇది Geminiని మెరుగుపరచడంలో ముఖ్యమైన భాగం, యూజర్లు ఇచ్చే కొత్త ప్రాంప్ట్‌లను తెలుసుకోవడానికి మేము ఎదురుచూస్తున్నాము. 2023లో Geminiని లాంచ్ చేసినప్పటి నుండి, యూజర్‌లు లోతైన తత్వజ్ఞానం మొదలుకొని, అసంబద్ధమైన ప్రాంప్ట్‌ల వరకు, అనేక రకాలుగా దానిని ఛాలెంజ్ చేయడం మేము చూశాము - కొన్ని సందర్భాలలో, Gemini, మేము పేర్కొన్న విధానానికి తగిన విధంగా లేని, అసంబద్ధమైన సమాధానాలను ఇవ్వడం చూశాము. ఈ రకమైన ప్రాంప్ట్‌లకు తగిన విధంగా సమాధానం ఇవ్వగలిగేలా Geminiకి ఏ విధంగా సహాయం చేయగలుగుతామో కనిపెట్టడం అనేది ప్రస్తుతం మా ముందున్న ఛాలెంజ్. సమాధానాలలో ఖచ్చితత్వం ఉండేలా, అవి ఆబ్జెక్టివ్‌గా ఉండేలా, సూక్ష్మ దృష్టితో వ్యవహరించేలా వాటి నిరంతర మెరుగుదల కోసం మేము కృషి చేస్తున్నాము. ఇందుకోసం మా ఇంటర్నల్ ఎవాల్యుయేషన్‌లను, రెడ్-టీమింగ్‌ను విస్తరించడాన్ని కొనసాగిస్తున్నాము.

మేము Geminiని డెవలప్ చేయడాన్ని ఏ విధంగా కొనసాగించబోతున్నాం

Gemini వెనుక ఉన్న మా ఉద్దేశ్యాన్ని నెరవేర్చడానికి మేము అనుసరించే విధానం

Geminiపై చేస్తున్న కృషికి, మా AI గైడ్‌లైన్స్‌తో పాటుగా మేము ఇటీవలమా విధానాన్ని స్పష్టం చేశాము: Gemini మీ సూచనలను ఫాలో అవ్వాలి, మీ అవసరాలకు అనుగుణంగా తనను తాను మలుచుకోవాలి, తనతో మీ ఎక్స్‌పీరియన్స్ బావుండేలా చూడాలి. బాధ్యత, భద్రతపై దృష్టి పెట్టడం, మా విధానంలో ప్రధాన అంశం. Gemini పాలసీ గైడ్‌లైన్స్ కొన్ని రకాల సమస్యాత్మక అవుట్‌పుట్‌లను నివారించడానికి ట్రై చేస్తాయి. Geminiని హానికరమైన లేదా అనైతిక ప్రయోజనాల కోసం ఎవరూ ఉపయోగించకుండా; అవే ప్రతికూల అంశాలతో దానిని టెస్ట్ చేసే విధంగా మా ఇంటర్నల్ "రెడ్ టీమ్" మెంబర్‌లను, ప్రోడక్ట్ ఎక్స్‌పర్ట్‌లను, సామాజిక శాస్త్రవేత్తలను నిరంతరం ఎంగేజ్ చేస్తున్నాము - వీరు, Gemini ఈ పాలసీ గైడ్‌లైన్స్‌కు, మా లక్ష్యాలకు అనుగుణంగా పనిచేస్తోందో లేదో తెలుసుకోవడానికి ఉద్దేశపూర్వకంగా స్ట్రెస్-టెస్ట్ చేస్తారు - ఆ విధంగా వారు తెలుసుకున్న అంశాలను అప్లై చేయడం ద్వారా Geminiని నిరంతరం మెరుగుపరుస్తాము.

Geminiని మేము డెవలప్ చేసే క్రమంలో, గోప్యత కూడా ఒక కీలకమైన అంశం. Gemini యాప్స్ గోప్యతా హబ్లో "Geminiని 'డిజైన్ ద్వారా గోప్యత'తో, మీ కంట్రోల్లో ఉండేలా ఎలా బిల్డ్ చేశాము" అనే దాని గురించి మరింత సమాచారాన్ని పొందవచ్చు.

యూజర్, పబ్లిషర్ కంట్రోల్ను ఎనేబుల్ చేయడం

మీ Gemini డేటాను రివ్యూ చేయడానికి, అప్‌డేట్ చేయడానికి, మేనేజ్ చేయడానికి, మీరు సులభంగా యాక్సెస్ చేయగల వివిధ రకాల Gemini యూజర్ కంట్రోల్స్‌ను మేము బిల్డ్ చేశాము. వీటితో మీరు డేటాను ఎగుమతి చేయగలుగుతారు, తొలగించడం కూడా సాధ్యమవుతుంది. మీరు Gemini యాప్స్ యాక్టివిటీ కంట్రోల్ ద్వారా మీ Gemini ప్రాంప్ట్‌లను, సమాధానాలను, ఫీడ్‌బ్యాక్‌ను యాక్సెస్ చేయడం, రివ్యూ చేయడం సాధ్యమవుతుంది. దానితో పాటు, మీ Gemini యాప్స్ యాక్టివిటీ సెట్టింగ్‌ను ఆఫ్ చేయడం ద్వారా మీ భవిష్యత్తు Gemini చాట్‌లను Google మెషిన్-లెర్నింగ్ టెక్నాలజీలను మెరుగుపరచడానికి ఉపయోగించకుండా నిరోధించగలుగుతారు. అదే విధంగా, ఇతర Google సర్వీస్‌ల మాదిరిగానే, మీరు Google టేక్అవుట్ టూల్ ద్వారా మీ సమాచారాన్ని డౌన్‌లోడ్ చేసుకోవడానికి, ఎగుమతి చేయడానికి అవకాశం ఉంటుంది. మీ Gemini థ్రెడ్‌లకు క్రియేట్ చేసిన పబ్లిక్ లింక్‌లను మేనేజ్ చేయడానికి వీలు కల్పించే కంట్రోల్స్, ఎక్స్‌టెన్షన్‌లకు యాక్సెస్‌ను ఆన్/ఆఫ్ చేయడానికి వీలు కల్పించే కంట్రోల్స్ కూడా మా వద్ద ఉన్నాయి (ఉదా., Workspace, Maps, YouTube). Gemini సమాధానాలపై మీకు మరింత కంట్రోల్‌ను అందించడానికి మేము కొత్త మార్గాలను కూడా కనిపెడుతున్నాము. వివిధ రకాల సమాధానాలను ఎనేబుల్ చేసే ఫిల్టర్‌లు కూడా అందులో భాగమే.

పబ్లిషర్‌ల కోసం, మేము Google-Extendedను లాంచ్ చేశాము. ఇది వెబ్ పబ్లిషర్‌లు, వారి సైట్‌లు Geminiని, Vertex AI జెనరేటివ్ APIలను మెరుగుపరచడంలో సహాయపడాలా వద్దా అనేది మేనేజ్ చేయడానికి ఉపయోగపడే కంట్రోల్. Google-Extendedకు సైట్‌లలో ఉన్న కంటెంట్‌కు యాక్సెస్ ఇవ్వడం వలన, AI మోడల్స్‌ను కాలక్రమేణా మరింత ఖచ్చిత్వంతో, సామర్థ్యంతో పనిచేసేలా చేయడంలో సహాయం లభిస్తుంది. Gemini, మోడల్ ట్రెయినింగ్ కోసం, సమ్మతి నిలిపివేసిన URLల నుండి కంటెంట్‌ను ఉపయోగించకపోవడమే కాకుండా; అటువంటి కంటెంట్‌ను గ్రౌండింగ్ కోసం కూడా ఉపయోగించదు. AI వినియోగం విస్తరిస్తున్న కొద్దీ, వెబ్ పబ్లిషర్‌లు తమ డేటాను ఎలా ఉపయోగించాలో మేనేజ్ చేయడం మరింత కష్టతరం అవుతుంది. కంటెంట్‌ను ఎలా ఉపయోగిస్తారు, ఏ విధంగా కంట్రోల్ చేస్తారు అనే దాని గురించి ఎంపికలను మరింత సులభంగా ప్రాసెస్ చేయడానికి, మెషిన్ అర్థం చేసుకోగలిగే మార్గాలను కనిపెట్టడానికి, వెబ్ పబ్లిషర్‌లతోను, AI కమ్యూనిటీతోను కలిసి పనిచేయడానికి మేము కట్టుబడి ఉన్నాము.

Geminiని కలిసి మెరుగుపరుద్దాం

మేము Geminiకి శరవేగంగా మార్పులు చేస్తూ, దాని బెస్ట్ వెర్షన్‌ను ప్రపంచానికి అందించాలని కోరుకుంటున్నాము. యూజర్ ఫీడ్‌బ్యాక్ వలన మా మోడల్స్‌ను మరింత వేగంగా మెరుగుపరచడం సాధ్యమయ్యింది. ఉదాహరణకు, మా మోడల్స్‌కు అవి మరింత ఉత్సుకతతో, ఊహా సామర్థ్యంతో పనిచేసి, మెరుగైన క్వాలిటీతో, ఖచ్చితత్వంతో సమాధానాలు ఇచ్చేందుకు; మేము వాటికి ఉత్తమమైన రీఇన్‌ఫోర్స్‌మెంట్ లెర్నింగ్ టెక్నిక్‌లను ఉపయోగించి ట్రెయినింగ్ ఇస్తాము. LLMల టెక్నికల్ అంశాలు, సామాజిక, నైతిక అంశాలకు సంబంధించిన ఛాలెంజ్‌లు, ఆపర్చునిటీల గురించి మరింత తెలుసుకోవడానికి; Gemini మోడల్ ట్రెయినింగ్, ట్యూనింగ్ పద్ధతులను మెరుగుపరచడానికి; అలాగే మా లెర్నింగ్‌లను రీసెర్చర్‌లతో షేర్ చేసుకోవడానికి మేము రీసెర్చ్‌ను కొనసాగిస్తున్నాము; ఎథిక్స్ ఆఫ్ అడ్వాన్స్‌డ్ AI అసిస్టెంట్స్పై ఇటీవలి రీసెర్చ్ పేపర్ అందుకు ఓ ఉదాహరణ. ఈ కొత్త టెక్నాలజీ మొత్తం ఎకో-సిస్టమ్‌కు ప్రయోజనం చేకూర్చే మార్గాలను కనుగొనడానికి, యూజర్లు, విశ్వసనీయ టెస్టర్లు, రీసెర్చర్‌లతో కొలాబరేట్ కావడం (కలిసి పని చేయడం) ద్వారా ఈ రంగంలో బాధ్యతాయుతంగా ఇన్నోవేషన్స్ (ఆవిష్కరణలు) చేయడానికి మేము కట్టుబడి ఉన్నాము.

పారదర్శకత ముఖ్యం అని మాకు తెలుసు, Geminiని డెవలప్ చేసే ప్రాసెస్ గురించి, దాని పరిమితులను గురించి ఎటువంటి దాపరికం లేకుండా ఉండటానికి మేము కట్టుబడి ఉన్నాము. Gemini మ్యాజికల్ బ్ల్యాక్ బాక్స్ కాదు; ఇది నిరంతరం పరిణితి చెందుతూ వస్తుంది; మా ప్రోగ్రెస్‌పై అప్‌డేట్‌లు షేర్ చేయడాన్ని కొనసాగిస్తాము. మీరు Gemini తాజా ఫీచర్‌లు, మెరుగుదలలు, బగ్ పరిష్కారాలను చూడగలిగేలా మేము రిలీజ్ సంబంధిత అప్‌డేట్‌లు పేజీని లాంచ్ చేశాము, ఈ ఓవర్‌వ్యూను అవసరానికి అనుగుణంగా అప్‌డేట్ చేస్తాము. Gemini ఎక్కడ ఉపయోగకరంగా, సహాయకారిగా ఉంటుందో; మేము ఎక్కడ ఇటరేట్ చేసి దానిని మెరుగుపరచాలో; రెండింటినీ గుర్తిస్తాము. మేము కొత్త సామర్థ్యాలను చురుకుగా జోడిస్తున్నాము; నిరంతరం కొనసాగించే రీసెర్చ్, టెస్టింగ్, యూజర్ ఫీడ్‌బ్యాక్ ద్వారా; పరస్పర సహకారంతో Geminiని మెరుగుపరచడానికి ఎదురుచూస్తున్నాము.

అక్‌నాలెడ్జ్‌మెంట్‌లు

Gemini యాప్ టీమ్, నమ్మకం & భద్రత టీమ్, Google Research టీమ్, ఇంకా Google DeepMindలో పనిచేసే మా సహోద్యోగుల అసమాన కృషిని మేము అభినందిస్తూ వారికి ధన్యవాదాలు తెలుపుతున్నాము.

వీరు రచించారు

జేమ్స్ మనియీకా
SVP, రీసెర్చ్, టెక్నాలజీ అండ్ సొసైటీ

సీసీ షావ్
వైస్ ప్రెసిడెంట్ అండ్ జనరల్ మేనేజర్, Google Assistant, Gemini App

ఎడిటర్ నుండి నోట్

ఇది ఒక లివింగ్ డాక్యుమెంట్, మేము Gemini యాప్ సామర్థ్యాలను వేగంగా మెరుగుపరచడం, దానితో పాటుగా LLMలకు సహజంగా ఉండే పరిమితులను పరిష్కరించడం కొనసాగిస్తున్నందున ఎప్పటికప్పుడు దీనిని అప్‌డేట్ చేస్తూ ఉంటాము. ఈ ఓవర్‌వ్యూను చివరిగా జూలై 25, 2024న అప్‌డేట్ చేశాము. Gemini యాప్ గురించి తాజా అప్‌డేట్‌ల కోసం, రిలీజ్‌కు సంబంధించిన అప్‌డేట్‌లు లాగ్‌కు వెళ్లండి; లేదా Google Keyword బ్లాగ్లో మరింత చదవండి.

3 యూజర్ ప్రాంప్ట్‌లకు సమాధానాలు

సమాధానాన్ని జెనరేట్ చేయడం అనేది, ఒక ప్రశ్నకు సమాధానం ఇచ్చే ముందు మనిషి రకరకాలుగా ఆలోచించి ఓ నిర్ణయానికి ఎలా వస్తాడో, అలాంటి విధానంలోనే ఉంటుంది. ఒక యూజర్ ప్రాంప్ట్ ఇచ్చిన తర్వాత, Gemini, పోస్ట్-ట్రెయినింగ్ పొందిన LLMను, ప్రాంప్ట్‌లోని సందర్భాన్ని, యూజర్‌తో జరిపిన ఇంటరాక్షన్‌ను, సమాధానం తాలూకు అనేక వెర్షన్‌లను డ్రాఫ్ట్ చేయడానికి ఉపయోగిస్తుంది. అంతే కాకుండా, సమాధానాలను జెనరేట్ చేయడానికి అది Google Search, మరియు/లేదా దానికి ఉన్న అనేక ఎక్స్‌టెన్షన్‌లలో ఒక దానిపై, అలాగే ఇటీవల అప్‌లోడ్ చేసిన ఫైల్స్ (Gemini Advanced మాత్రమే)పై, అటువంటి ఇతర ఎక్స్‌టర్నల్ సోర్స్‌లపై కూడా ఆధారపడుతుంది. ఈ ప్రాసెస్ను రిట్రీవల్ ఆగ్మెంటేషన్ అని అంటారు. ఏదైనా ఒక ప్రాంప్ట్ ఇచ్చినప్పుడు, Gemini, ఈ ఎక్స్‌టర్నల్ సోర్స్‌ల (ఉదా., Google Search) నుండి అత్యంత సంబంధిత సమాచారాన్ని సేకరించి, దాన్ని తన సమాధానంలో తగిన విధంగా పేర్కొంటుంది. ఎక్స్‌టర్నల్ టూల్స్‌తో పనిచేసేలా LLMల పరిధిని విస్తరింపజేయడం అనేది రీసెర్చ్ చురుకుగా సాగుతున్న అంశాలలో ఒకటి. సమాధానాన్ని జెనరేట్ చేసే ప్రాసెస్‌లో ఎర్రర్‌లు ఏర్పడటానికి అనేక కారణాలు ఉండవచ్చు. ఉదాహరణకు, ఈ ఎక్స్‌టర్నల్ టూల్స్‌ను ఉపయోగంలోకి తెచ్చుకోవడానికి Gemini ఉపయోగించిన క్వెరీ; టూల్స్ నుండి అందుకున్న ఫలితాలను Gemini విశ్లేషించిన తీరు; ఫైనల్ సమాధానాన్ని జెనరేట్ చేయడానికి, ఆ ఫలితాలను ఏవిధంగా ఉపయోగించింది, వంటివి అన్నీ ఇందులో భాగమే. కాబట్టి, Gemini జెనరేట్ చేసిన సమాధానాలను, ఆ సమాధానాన్ని క్రియేట్ చేయడానికి ఉపయోగించిన నిర్దిష్ట టూల్స్ పనితీరుకు ప్రతిబింబంగా పరిగణించకూడదు.

చివరిగా, ఫైనల్ సమాధానాన్ని డిస్‌ప్లే చేసే ముందు, ముందుగా నిర్ణయించిన పాలసీ గైడ్‌లైన్స్‌కు కట్టుబడి ఉన్నట్లుగా నిర్ధారించడం కోసం, సేఫ్టీ చెక్ జరుగుతుంది. ఈ ప్రాసెస్ హానికరమైన లేదా అభ్యంతరకరమైన సమాచారాన్ని ఫిల్టర్ చేయడానికి డబుల్-చెక్‌ను అందిస్తుంది. మిగిలిన సమాధానాలు, క్వాలిటీని బట్టి ర్యాంకింగ్ పొందుతాయి. అత్యధిక స్కోరింగ్ వెర్షన్(లు) యూజర్‌కు తిరిగి ప్రజెంట్ అవుతాయి.

AI జెనరేట్ చేసిన కంటెంట్‌ను వాటర్‌మార్క్ చేయడానికి మా అత్యుత్తమ డిజిటల్ టూల్‌కిట్ అయిన SynthIDని ఉపయోగించి మేము Gemini టెక్స్ట్, ఇమేజ్ అవుట్‌పుట్‌లను వాటర్‌మార్క్ చేస్తాము. జెనరేట్ చేసిన ఇమేజ్‌ల విషయంలో, SynthID డిజిటల్ వాటర్‌మార్క్‌ను (మనిషి కంటికి కనిపించని దాన్ని) నేరుగా పిక్సెల్స్‌లోకి జోడిస్తుంది. మరింత విశ్వసనీయమైన AI ఐడెంటిఫికేషన్ టూల్స్‌ను డెవలప్ చేయడంలో SynthID ఒక ముఖ్యమైన బిల్డింగ్ బ్లాక్. ఇది AI జెనరేట్ చేసిన కంటెంట్‌తో ప్రజలు ఎలా ఇంటరాక్ట్ అవుతారనే దాని గురించి సరైన నిర్ణయాలు తీసుకోవడంలో యూజర్లకు సాయం చేస్తుంది.

Gemini యాప్ ఓవర్‌వ్యూ

Gemini అంటే ఏమిటి

ప్రొడక్టివిటీ

క్రియేటివిటీ

కుతూహలం

Gemini ఎలా పని చేస్తుంది

ప్రీ-ట్రెయినింగ్

పోస్ట్-ట్రెయినింగ్

యూజర్ ప్రాంప్ట్‌లకు సమాధానాలు

మానవ ఫీడ్‌బ్యాక్, ఎవాల్యుయేషన్

Gemini వంటి LLM-ఆధారిత ఇంటర్‌ఫేస్‌ల పరిమితులు

ఖచ్చితత్వం

బయాస్

అనేక అభిప్రాయాలు

వ్యక్తిగత శైలి

ఫాల్స్ పాజిటివ్‌లు / నెగిటివ్‌లు

దుర్వినియోగ ప్రాంప్ట్‌ల వల్ల ప్రమాదం ఏర్పడే అవకాశం

మేము Geminiని డెవలప్ చేయడాన్ని ఏ విధంగా కొనసాగించబోతున్నాం

Gemini వెనుక ఉన్న మా ఉద్దేశ్యాన్ని నెరవేర్చడానికి మేము అనుసరించే విధానం

యూజర్, పబ్లిషర్ కంట్రోల్ను ఎనేబుల్ చేయడం

Geminiని కలిసి మెరుగుపరుద్దాం

అక్‌నాలెడ్జ్‌మెంట్‌లు

మీ ప్రాంతాన్ని, భాషను మార్చండి

ఆసియా పసిఫిక్

అమెరికాస్

యూరప్ & ఆఫ్రికా

1 ప్రీ-ట్రెయినింగ్

2 పోస్ట్-ట్రెయినింగ్

3 యూజర్ ప్రాంప్ట్‌లకు సమాధానాలు

4 మానవ ఫీడ్‌బ్యాక్, ఎవాల్యుయేషన్

Gemini యాప్ ఓవర్‌వ్యూ

Gemini అంటే ఏమిటి

ప్రొడక్టివిటీ

క్రియేటివిటీ

కుతూహలం

Gemini ఎలా పని చేస్తుంది

ప్రీ-ట్రెయినింగ్

పోస్ట్-ట్రెయినింగ్

యూజర్ ప్రాంప్ట్‌లకు సమాధానాలు

మానవ ఫీడ్‌బ్యాక్, ఎవాల్యుయేషన్

Gemini వంటి LLM-ఆధారిత ఇంటర్‌ఫేస్‌ల పరిమితులు

ఖచ్చితత్వం

బయాస్

అనేక అభిప్రాయాలు

వ్యక్తిగత శైలి

ఫాల్స్ పాజిటివ్‌లు / నెగిటివ్‌లు

దుర్వినియోగ ప్రాంప్ట్‌ల వల్ల ప్రమాదం ఏర్పడే అవకాశం

మేము Geminiని డెవలప్ చేయడాన్ని ఏ విధంగా కొనసాగించబోతున్నాం

Gemini వెనుక ఉన్న మా ఉద్దేశ్యాన్ని నెరవేర్చడానికి మేము అనుసరించే విధానం

యూజర్, పబ్లిషర్ కంట్రోల్​ను ఎనేబుల్ చేయడం

Geminiని కలిసి మెరుగుపరుద్దాం

అక్‌నాలెడ్జ్‌మెంట్‌లు

యూజర్, పబ్లిషర్ కంట్రోల్ను ఎనేబుల్ చేయడం