यो के हो र तपाईं यसलाई कसरी प्रयोग गर्न सक्नुहुन्छ?

यो ChatGPT हो र किन यो आधुनिक खोज इन्जिनहरू पछि सबैभन्दा महत्त्वपूर्ण उपकरण हुन सक्छ

ओपनएआईले ChatGPT भनिने लामो-फार्म प्रश्न-उत्तर एआई प्रस्तुत गर्‍यो जसले जटिल प्रश्नहरूको कुराकानीमा जवाफ दिन्छ।

यो एक क्रान्तिकारी टेक्नोलोजी हो किनभने यो जान्न प्रशिक्षित छ कि मानिसहरूले प्रश्न सोध्दा के मतलब छ।

धेरै प्रयोगकर्ताहरू मानव-गुणस्तरका प्रतिक्रियाहरू प्रदान गर्ने क्षमता देखेर अचम्मित हुन्छन्, यसले अन्ततः मानिसहरूले कम्प्युटरसँग कसरी अन्तरक्रिया गर्छ र जानकारी प्राप्त गर्ने तरिकालाई परिवर्तन गर्न सक्ने शक्ति हुन सक्छ भन्ने भावनालाई प्रेरित गर्दछ।

ChatGPT के हो?

ChatGPT एउटा ठूलो भाषा मोडेल च्याटबोट हो जुन OpenAI द्वारा GPT-3.5 मा आधारित विकसित गरिएको हो। योसँग कुराकानीत्मक संवाद फारममा अन्तरक्रिया गर्ने र प्रतिक्रियाहरू प्रदान गर्ने उल्लेखनीय क्षमता छ जुन आश्चर्यजनक रूपमा मानव देखा पर्न सक्छ।

ठूला भाषा मोडेलहरूले शब्दहरूको श्रृंखलामा अर्को शब्द भविष्यवाणी गर्ने कार्य गर्दछ।

रिइन्फोर्समेन्ट लर्निङ विथ ह्युमन फिडब्याक (RLHF) तालिमको एक अतिरिक्त तह हो जसले ChatGPT लाई निर्देशनहरू पालना गर्ने र मानिसहरूका लागि सन्तोषजनक प्रतिक्रियाहरू उत्पन्न गर्ने क्षमता सिक्न मद्दत गर्न मानव प्रतिक्रिया प्रयोग गर्दछ।

ChatGPT कसले बनायो?

ChatGPT सान फ्रान्सिस्को स्थित कृत्रिम बुद्धिमत्ता कम्पनी OpenAI द्वारा बनाईएको थियो। OpenAI Inc. नाफामुखी OpenAI LP को गैर-लाभकारी अभिभावक कम्पनी हो।

OpenAI यसको प्रख्यात DALL·E को लागि प्रख्यात छ, एउटा गहिरो सिकाइ मोडेल जसले पाठ निर्देशनहरूबाट छविहरू उत्पन्न गर्छ जसलाई prompts भनिन्छ।

सीईओ साम अल्टम्यान हुन्, जो पहिले वाई कम्बिनेटरका अध्यक्ष थिए।

माइक्रोसफ्ट १ अर्ब डलरको साझेदार र लगानीकर्ता हो । तिनीहरूले संयुक्त रूपमा Azure AI प्लेटफर्मको विकास गरे।

ठूला भाषा मोडेलहरू

ChatGPT एउटा ठूलो भाषा मोडेल (LLM) हो। ठूला भाषा मोडेलहरू (LLMs) लाई ठूलो मात्रामा डाटाको साथ तालिम दिइन्छ कि वाक्यमा कुन शब्द आउँछ भन्ने सही भविष्यवाणी गर्न।

यो पत्ता लगाइएको थियो कि डाटाको मात्रा बढाउँदा भाषा मोडेलहरूको क्षमता बढ्यो।

स्ट्यानफोर्ड विश्वविद्यालयका अनुसार:

"GPT-3 मा 175 बिलियन प्यारामिटरहरू छन् र 570 गीगाबाइट पाठमा तालिम दिइएको थियो। तुलनाको लागि, यसको पूर्ववर्ती, GPT-2, 1.5 बिलियन प्यारामिटरहरूमा 100 गुणा भन्दा बढी सानो थियो।

मापनमा भएको यो वृद्धिले मोडेलको व्यवहारमा ठूलो परिवर्तन ल्याउँछ — GPT-3 ले स्पष्ट रूपमा प्रशिक्षित नभएका कार्यहरू गर्न सक्षम छ, जस्तै अंग्रेजीबाट फ्रेन्चमा वाक्यहरू अनुवाद गर्ने, केही प्रशिक्षण उदाहरणहरू बिना।

यो व्यवहार प्रायः GPT-2 मा अनुपस्थित थियो। यसबाहेक, केही कार्यहरूका लागि, GPT-3 ले ती कार्यहरू समाधान गर्न स्पष्ट रूपमा प्रशिक्षित गरिएका मोडेलहरूलाई उत्कृष्ट प्रदर्शन गर्दछ, यद्यपि अन्य कार्यहरूमा यो छोटो हुन्छ।"

LLMs ले वाक्य र अर्को वाक्यमा शब्दहरूको शृङ्खलामा अर्को शब्दको भविष्यवाणी गर्छ - स्वत: पूर्ण जस्तै, तर दिमाग झुकाउने स्केलमा।

यो क्षमताले तिनीहरूलाई अनुच्छेद र सामग्रीको सम्पूर्ण पृष्ठहरू लेख्न अनुमति दिन्छ।

तर LLM हरू सीमित छन् कि तिनीहरूले सधैं मानिसले के चाहन्छ भन्ने कुरा बुझ्दैनन्।

र माथि उल्लेखित रिइन्फोर्समेन्ट लर्निङ विथ ह्युमन फिडब्याक (RLHF) तालिमको साथमा ChatGPT ले कलाको स्थितिमा सुधार गर्छ।

ChatGPT कसरी प्रशिक्षित भयो?

GPT-3.5 ChatGPT संवाद सिक्न र प्रतिक्रिया दिने मानव शैली प्राप्त गर्न मद्दत गर्न Reddit छलफलहरू जस्ता स्रोतहरू सहित इन्टरनेटबाट कोड र जानकारीको बारेमा ठूलो मात्रामा डेटाको बारेमा प्रशिक्षण दिइएको थियो।

ChatGPT मानव प्रतिक्रिया (मानव प्रतिक्रिया संग सुदृढीकरण शिक्षा भनिने एक प्रविधि) को प्रयोग गरेर पनि प्रशिक्षित गरिएको थियो ताकि AI ले मानिसहरूले प्रश्न सोध्दा के अपेक्षा गर्दछ भनेर सिक्न। LLM लाई यसरी तालिम दिनु क्रान्तिकारी हो किनभने यो LLM लाई अर्को शब्दको भविष्यवाणी गर्न तालिम दिनु भन्दा बाहिर जान्छ।

मार्च 2022 मा मानव प्रतिक्रियाको साथ निर्देशनहरू पालना गर्ने प्रशिक्षण भाषा मोडेलहरू शीर्षकको अनुसन्धान पत्रले यो एक सफलताको दृष्टिकोण हो भनेर वर्णन गर्दछ:

"यो कार्य हाम्रो उद्देश्यले ठूला भाषा मोडेलहरूको सकारात्मक प्रभावलाई बढाउने उद्देश्यले उत्प्रेरित गरिएको छ जसलाई मानिसहरूले उनीहरूले चाहेको कुरा गर्न प्रशिक्षण दिएर।

पूर्वनिर्धारित रूपमा, भाषा मोडेलहरूले अर्को शब्द भविष्यवाणी उद्देश्यलाई अप्टिमाइज गर्दछ, जुन हामीले यी मोडेलहरूले गर्न चाहेको कुराको लागि प्रोक्सी मात्र हो।

हाम्रा नतिजाहरूले संकेत गर्दछ कि हाम्रा प्रविधिहरूले भाषा मोडेलहरूलाई अझ उपयोगी, सत्य र हानिरहित बनाउने वाचा राख्छन्।

भाषा मोडेलहरू ठूला बनाउनुले तिनीहरूलाई प्रयोगकर्ताको अभिप्राय पछ्याउन स्वाभाविक रूपमा राम्रो बनाउँदैन।

उदाहरणका लागि, ठूला भाषा मोडेलहरूले आउटपुटहरू उत्पन्न गर्न सक्छन् जुन असत्य, विषाक्त, वा प्रयोगकर्ताको लागि उपयोगी छैन।

अर्को शब्दमा, यी मोडेलहरू तिनीहरूका प्रयोगकर्ताहरूसँग पङ्क्तिबद्ध छैनन्।

ChatGPT निर्माण गर्ने इन्जिनियरहरूले दुई प्रणाली, GPT-3 र नयाँ InstructGPT ( ChatGPT को "भाइबहिनी मोडेल") को आउटपुटहरू मूल्याङ्कन गर्न ठेकेदारहरू (लेबलर भनिने) काममा लिए।

मूल्याङ्कनको आधारमा, शोधकर्ताहरू निम्न निष्कर्षमा आए:

"लेबलरहरूले GPT-3 बाट आउटपुटहरूमा InstructGPT आउटपुटहरूलाई महत्त्वपूर्ण रूपमा प्राथमिकता दिन्छन्।

InstructGPT मोडेलहरूले GPT-3 मा सत्यतामा सुधारहरू देखाउँछन्।

InstructGPT ले GPT-3 मा विषाक्ततामा सानो सुधार देखाउँछ, तर पूर्वाग्रह होइन।"

अनुसन्धान पत्रले निष्कर्ष निकाल्छ कि InstructGPT को नतिजा सकारात्मक थियो। तैपनि, सुधारको लागि ठाउँ रहेको पनि उल्लेख गरिएको छ।

"समग्रमा, हाम्रा नतिजाहरूले मानव प्राथमिकताहरू प्रयोग गरेर ठूला भाषा मोडेलहरूलाई फाइन-ट्यून गर्ने कार्यहरूको विस्तृत दायरामा तिनीहरूको व्यवहारमा उल्लेखनीय सुधार गर्दछ, यद्यपि तिनीहरूको सुरक्षा र विश्वसनीयता सुधार गर्न धेरै काम गर्न बाँकी छ।"

ChatGPT साधारण च्याटबोट भन्दा फरक सेट गर्ने कुरा यो हो कि यो विशेष गरी प्रश्नमा मानव अभिप्राय बुझ्न र सहयोगी, सत्य र हानिरहित उत्तरहरू प्रदान गर्न प्रशिक्षित थियो।

त्यो तालिमको कारण, ChatGPT केही प्रश्नहरूलाई चुनौती दिन सक्छ र प्रश्नका केही अंशहरू खारेज गर्न सक्छ जुन अर्थमा हुँदैन।

ChatGPT सँग सम्बन्धित अर्को अनुसन्धान पत्रले देखाउँछ कि उनीहरूले कसरी AI लाई मानिसहरूले के मन पराउँछन् भनेर भविष्यवाणी गर्न तालिम दिए।

अन्वेषकहरूले याद गरे कि प्राकृतिक भाषा प्रशोधन AI को आउटपुटहरू मूल्याङ्कन गर्न प्रयोग गरिने मेट्रिक्सले मेट्रिक्समा राम्रो स्कोर प्राप्त गर्ने मेसिनहरूको परिणाम हो, तर मानिसहरूले अपेक्षा गरेको कुरासँग मेल खाएन।

अन्वेषकहरूले समस्यालाई कसरी व्याख्या गरे निम्न छन्:

"धेरै मेशिन लर्निङ एप्लिकेसनहरूले साधारण मेट्रिक्सलाई अप्टिमाइज गर्दछ जुन डिजाइनरले चाहेको कुराको लागि मात्र नराम्रो प्रोक्सीहरू हुन्। यसले समस्याहरू निम्त्याउन सक्छ, जस्तै YouTuBypassGPTe सिफारिसहरू क्लिक-बाइटलाई बढावा दिने।"

त्यसोभए तिनीहरूले डिजाइन गरेको समाधान भनेको एआई सिर्जना गर्नु हो जसले मानिसहरूले मनपर्ने कुराहरूमा अनुकूलित जवाफहरू आउटपुट गर्न सक्छ।

त्यसो गर्न, तिनीहरूले विभिन्न जवाफहरू बीचको मानव तुलनाको डेटासेटहरू प्रयोग गरेर AI लाई तालिम दिए ताकि मेसिनले मानिसहरूले सन्तोषजनक जवाफहरू के मान्छ भनेर भविष्यवाणी गर्न अझ राम्रो भयो।

Reddit पोष्टहरू संक्षेप गरेर प्रशिक्षण गरिएको थियो र समाचारहरूको सारांशमा पनि परीक्षण गरिएको थियो।

फेब्रुअरी 2022 को अनुसन्धान पत्रलाई मानव प्रतिक्रियाबाट संक्षेपमा लर्निङ भनिन्छ।

अनुसन्धानकर्ताहरू लेख्छन्:

"यस काममा, हामी देखाउँछौं कि मानव प्राथमिकताहरूको लागि अनुकूलन गर्न मोडेललाई तालिम दिएर सारांश गुणस्तरमा उल्लेखनीय सुधार गर्न सम्भव छ।

हामी सारांशहरू बीचको मानव तुलनाको ठूलो, उच्च-गुणस्तरको डेटासेट सङ्कलन गर्छौं, मानव-प्राथमिकताको सारांशको भविष्यवाणी गर्न एउटा मोडेललाई तालिम दिन्छौं, र सुदृढीकरण सिकाइ प्रयोग गरेर सारांश नीतिलाई राम्रो बनाउनको लागि त्यो मोडेललाई पुरस्कार प्रकार्यको रूपमा प्रयोग गर्छौं।"

ChatGPT को सीमाहरू के हुन्?

विषाक्त प्रतिक्रिया मा सीमितता

ChatGPT विषाक्त वा हानिकारक प्रतिक्रियाहरू प्रदान नगर्न विशेष रूपमा प्रोग्राम गरिएको छ। त्यसोभए यसले त्यस्ता प्रश्नहरूको जवाफ दिनबाट जोगिनेछ।

जवाफको गुणस्तर निर्देशनको गुणस्तरमा निर्भर गर्दछ

ChatGPT को महत्त्वपूर्ण सीमा भनेको आउटपुटको गुणस्तर इनपुटको गुणस्तरमा निर्भर हुन्छ। अन्य शब्दहरूमा, विशेषज्ञ निर्देशनहरू (प्रम्प्टहरू) राम्रो जवाफहरू उत्पन्न गर्छन्।

उत्तरहरू सधैं सही हुँदैनन्

अर्को सीमितता यो हो कि यो मानिसहरूलाई सही महसुस गर्ने जवाफहरू प्रदान गर्न प्रशिक्षित भएकोले, जवाफहरूले मानिसहरूलाई आउटपुट सही छ भनी बहकाउन सक्छ।

धेरै प्रयोगकर्ताहरूले पत्ता लगाए कि ChatGPT गलत जवाफहरू प्रदान गर्न सक्छ, जसमा केही बेग्लै गलत छन्।

कोडिङ प्रश्नोत्तर वेबसाइट स्ट्याक ओभरफ्लोका मध्यस्थहरूले मानिसहरूलाई सही लाग्ने जवाफहरूको अनपेक्षित परिणाम पत्ता लगाएका हुन सक्छन्।

स्ट्याक ओभरफ्लो ChatGPT बाट उत्पन्न भएका प्रयोगकर्ता प्रतिक्रियाहरूले भरिएको थियो जुन सही देखिन्छ, तर धेरै धेरै गलत जवाफहरू थिए।

हजारौं जवाफहरूले स्वयंसेवक मध्यस्थ टोलीलाई ओझेलमा पारे, प्रशासकहरूलाई ChatGPT बाट उत्पन्न जवाफहरू पोस्ट गर्ने कुनै पनि प्रयोगकर्ताहरू विरुद्ध प्रतिबन्ध लगाउन प्रेरित गर्दै।

ChatGPT जवाफहरूको बाढीले शीर्षकको पोस्टमा परिणाम आयो: अस्थायी नीति: ChatGPT प्रतिबन्धित छ:

"यो ChatGPT मार्फत सिर्जना गरिएका उत्तरहरू र अन्य सामग्रीहरूको आगमनलाई कम गर्ने उद्देश्यले अस्थायी नीति हो।

...प्राथमिक समस्या यो हो कि ChatGPT उत्पादन गर्ने जवाफहरूमा गलत हुने उच्च दर छ, तिनीहरू सामान्यतया "जस्तो देखिन्छन्" तिनीहरू "राम्रो" हुन सक्छन्..."

स्ट्याक ओभरफ्लो मोडरेटरहरूको गलत ChatGPT जवाफहरू जुन सहि देखिन्छन् भन्ने अनुभव भनेको OpenAI, ChatGPT का निर्माताहरूले नयाँ प्रविधिको घोषणा गर्दा सचेत र चेतावनी दिएका छन्।

OpenAI ले ChatGPT को सीमितताहरू बताउँछ

OpenAI घोषणाले यो चेतावनी प्रदान गर्‍यो:

ChatGPT कहिलेकाहीं प्रशंसनीय तर गलत वा बेकार जवाफहरू लेख्छ।

यो समस्या समाधान गर्न चुनौतीपूर्ण छ, जस्तै:

(1) RL प्रशिक्षणको समयमा, हाल सत्यको कुनै स्रोत छैन;

(२) मोडेललाई थप सतर्क हुन तालिमले यसले सही जवाफ दिन सक्ने प्रश्नहरू अस्वीकार गर्छ; र

(३) पर्यवेक्षित प्रशिक्षणले मोडेललाई भ्रामक बनाउँछ किनभने आदर्श जवाफ मानव प्रदर्शनकर्ताले के थाहा नभई मोडेललाई के थाहा छ त्यसमा भर पर्छ।"

ChatGPT प्रयोग गर्न नि: शुल्क छ?

ChatGPT को प्रयोग हाल "अनुसन्धान पूर्वावलोकन" समयमा नि: शुल्क छ।

च्याटबोट हाल प्रयोगकर्ताहरूको लागि प्रयास गर्न र प्रतिक्रियाहरूमा प्रतिक्रिया प्रदान गर्न खुला छ ताकि एआई प्रश्नहरूको जवाफ दिन र यसका गल्तीहरूबाट सिक्नको लागि अझ राम्रो बन्न सकोस्।

आधिकारिक घोषणाले भन्छ कि OpenAI गल्तीहरूको बारेमा प्रतिक्रिया प्राप्त गर्न उत्सुक छ:

"जब हामीले मोडेललाई अनुपयुक्त अनुरोधहरू अस्वीकार गर्न प्रयास गरेका छौं, यसले कहिलेकाहीँ हानिकारक निर्देशनहरूको प्रतिक्रिया दिन्छ वा पक्षपाती व्यवहार प्रदर्शन गर्दछ।

हामी केहि प्रकारको असुरक्षित सामग्रीलाई चेतावनी दिन वा ब्लक गर्न मध्यस्थता एपीआई प्रयोग गर्दैछौं, तर हामी अहिलेको लागि यसमा केही गलत नकारात्मक र सकारात्मकहरू हुने अपेक्षा गर्दछौं।

हामी यस प्रणालीलाई सुधार गर्न हाम्रो चलिरहेको कामलाई मद्दत गर्न प्रयोगकर्ता प्रतिक्रिया सङ्कलन गर्न उत्सुक छौं।"

प्रतिक्रियाहरू मूल्याङ्कन गर्न जनतालाई प्रोत्साहन गर्न ChatGPT क्रेडिटहरूमा $ 500 को पुरस्कारको साथ हाल प्रतियोगिता छ।

"प्रयोगकर्ताहरूलाई UI मार्फत समस्याग्रस्त मोडेल आउटपुटहरू, साथै बाह्य सामग्री फिल्टरबाट गलत सकारात्मक/नकारात्मकहरूमा प्रतिक्रिया प्रदान गर्न प्रोत्साहित गरिन्छ जुन इन्टरफेसको अंश पनि हो।

हामी हानिकारक आउटपुटहरू बारे प्रतिक्रियामा विशेष रुचि राख्छौं जुन वास्तविक संसारमा हुन सक्छ, गैर-विपरित परिस्थितिहरू, साथै प्रतिक्रिया जसले हामीलाई उपन्यास जोखिमहरू र सम्भावित न्यूनीकरणहरू पत्ता लगाउन र बुझ्न मद्दत गर्दछ।

तपाईं API क्रेडिटहरूमा $ 500 सम्म जित्ने मौकाको लागि ChatGPT प्रतिक्रिया प्रतियोगिता3 मा प्रवेश गर्न छनौट गर्न सक्नुहुन्छ।

प्रविष्टिहरू प्रतिक्रिया फारम मार्फत पेश गर्न सकिन्छ जुन ChatGPT इन्टरफेसमा लिङ्क गरिएको छ।

हाल चलिरहेको प्रतियोगिता डिसेम्बर 31, 2022 मा 11:59 pm PST मा समाप्त हुन्छ।

सम्बन्धित: OpenAI ले ChatGPT को सशुल्क प्रो संस्करण प्रस्तुत गर्न सक्छ

के भाषा मोडेलहरूले Google खोजलाई प्रतिस्थापन गर्नेछ?

Google आफैंले पहिले नै AI च्याटबोट सिर्जना गरिसकेको छ जसलाई LaMDA भनिन्छ। Google च्याटबोटको प्रदर्शन मानव वार्तालापको यति नजिक थियो कि Google इन्जिनियरले लामडा संवेदनशील भएको दाबी गरे।

यी ठूला भाषा मोडेलहरूले कसरी धेरै प्रश्नहरूको जवाफ दिन सक्छन् भन्ने कुरालाई ध्यानमा राख्दै, के यो धेरै टाढाको कुरा हो कि OpenAI, Google , वा Microsoft जस्ता कम्पनीले एक दिन पारंपरिक खोजलाई AI च्याटबोटले प्रतिस्थापन गर्नेछ?

Twitter केहीले पहिले नै घोषणा गरिसकेका छन् कि ChatGPT अर्को Google हुनेछ।

प्रश्न-उत्तर च्याटबोटले एक दिन Google प्रतिस्थापन गर्न सक्छ भन्ने परिदृश्य खोज मार्केटिंग पेशेवरहरूको रूपमा जीवन बिताउनेहरूका लागि डरलाग्दो छ।

यसले अनलाइन खोज मार्केटिङ समुदायहरूमा छलफलहरू सुरु गरेको छ, जस्तै लोकप्रिय FaceBypassGPTook SEOSignals ल्याब जहाँ कसैले सोध्यो कि खोजहरू खोज इन्जिनहरू र च्याटबटहरूबाट टाढा जान सक्छ।

ChatGPT परीक्षण गरिसकेपछि, म सहमत छु कि खोजी च्याटबोटले प्रतिस्थापन हुने डर निराधार छैन।

टेक्नोलोजीसँग अझै लामो बाटो छ, तर हाइब्रिड खोज र खोजको लागि च्याटबट भविष्यको कल्पना गर्न सम्भव छ।

तर ChatGPT को हालको कार्यान्वयन एउटा उपकरण जस्तो देखिन्छ जुन, केहि बिन्दुमा, प्रयोग गर्न क्रेडिटको खरीद आवश्यक पर्दछ।

ChatGPT कसरी प्रयोग गर्न सकिन्छ?

ChatGPT एउटा विशिष्ट लेखकको शैलीमा कोड, कविता, गीत र छोटो कथाहरू पनि लेख्न सक्छ।

निम्न निर्देशनहरूमा विशेषज्ञताले ChatGPT सूचना स्रोतबाट एउटा उपकरणमा उचाल्छ जुन कार्य पूरा गर्न सोध्न सकिन्छ।

यसले वस्तुतः कुनै पनि विषयमा निबन्ध लेख्नको लागि उपयोगी बनाउँछ।

ChatGPT लेख वा सम्पूर्ण उपन्यासहरूका लागि रूपरेखाहरू सिर्जना गर्न उपकरणको रूपमा कार्य गर्न सक्छ।

यसले वस्तुतः कुनै पनि कार्यको लागि प्रतिक्रिया प्रदान गर्नेछ जुन लिखित पाठको साथ जवाफ दिन सकिन्छ।

निष्कर्ष

पहिले उल्लेख गरिएझैं, ChatGPT एक उपकरणको रूपमा परिकल्पना गरिएको छ जुन जनताले अन्ततः प्रयोग गर्न तिर्नुपर्नेछ।

ChatGPT प्रयोग गर्न दर्ता गरेका छन्।