कसरी ChatGPT वाटरमार्क काम गर्दछ र यो किन पराजित हुन सक्छ

OpenAI को ChatGPT ले स्वचालित रूपमा सामग्री सिर्जना गर्ने तरिका प्रस्तुत गर्‍यो तर यसलाई पत्ता लगाउन सजिलो बनाउन वाटरमार्किङ सुविधा प्रस्तुत गर्ने योजनाले केही मानिसहरूलाई नर्भस बनाइरहेको छ। यसरी ChatGPT वाटरमार्किङले काम गर्छ र किन यसलाई हराउने तरिका हुन सक्छ।

ChatGPT एक अविश्वसनीय उपकरण हो जुन अनलाइन प्रकाशकहरू, सम्बद्धहरू र SEOs एकै साथ माया र डराउँछन्।

केही मार्केटरहरूले यसलाई मन पराउँछन् किनभने तिनीहरू सामग्री संक्षिप्त, रूपरेखा र जटिल लेखहरू उत्पन्न गर्न प्रयोग गर्ने नयाँ तरिकाहरू खोजिरहेका छन्।

अनलाइन प्रकाशकहरू AI सामग्रीले खोज परिणामहरूमा बाढी आउने सम्भावनासँग डराएका छन्, मानवद्वारा लेखिएका विशेषज्ञ लेखहरू प्रतिस्थापन गर्दै।

फलस्वरूप, ChatGPT-लेखक सामग्रीको पहिचानलाई अनलक गर्ने वाटरमार्किङ सुविधाको समाचार पनि चिन्ता र आशाको साथ प्रत्याशित छ।

क्रिप्टोग्राफिक वाटरमार्क

वाटरमार्क भनेको अर्ध-पारदर्शी चिन्ह (लोगो वा पाठ) हो जुन छविमा इम्बेड गरिएको हुन्छ। वाटरमार्कले कामको मूल लेखक हो भन्ने संकेत गर्छ।

यो तस्बिरहरूमा र बढ्दो भिडियोहरूमा देख्न सकिन्छ।

ChatGPT मा वाटरमार्किङ पाठले गोप्य कोडको रूपमा शब्दहरू, अक्षरहरू र विराम चिन्हहरूको ढाँचा इम्बेड गर्ने रूपमा क्रिप्टोग्राफी समावेश गर्दछ।

स्कट आरोनसन र ChatGPT वाटरमार्किङ

Scott Aaronson नामक एक प्रभावशाली कम्प्युटर वैज्ञानिकलाई OpenAI ले जुन 2022 मा AI सुरक्षा र पङ्क्तिबद्धतामा काम गर्न नियुक्त गरेको थियो।

AI सुरक्षा एक अनुसन्धान क्षेत्र हो जुन AI ले मानिसलाई हानि पुर्‍याउन सक्छ र त्यस प्रकारको नकारात्मक अवरोधलाई रोक्ने उपायहरू सिर्जना गर्न सक्छ।

ओपनएआईसँग सम्बद्ध लेखकहरूको विशेषता रहेको डिस्टिल वैज्ञानिक जर्नलले एआई सुरक्षालाई यसरी परिभाषित गर्छ:

"दीर्घकालीन आर्टिफिसियल इन्टेलिजेन्स (एआई) सुरक्षाको लक्ष्य भनेको उन्नत एआई प्रणालीहरू मानव मूल्यहरूसँग भरपर्दो रूपमा पङ्क्तिबद्ध छन् भनेर सुनिश्चित गर्नु हो - कि उनीहरूले मानिसहरूले गर्न चाहेको कुराहरू विश्वसनीय रूपमा गर्छन्।"

AI पङ्क्तिबद्धता कृत्रिम बुद्धिमत्ता क्षेत्र हो कि AI इच्छित लक्ष्यहरूसँग पङ्क्तिबद्ध छ भनेर सुनिश्चित गर्न सम्बन्धित छ।

ChatGPT जस्तो ठूलो भाषा मोडेल (LLM) लाई ओपनएआई द्वारा परिभाषित एआई अलाइनमेन्टका लक्ष्यहरू विपरीत जान सक्ने तरिकामा प्रयोग गर्न सकिन्छ, जसले मानवतालाई फाइदा पुग्ने एआई सिर्जना गर्ने हो।

तदनुसार, वाटरमार्किङको कारण मानवतालाई हानि गर्ने तरिकामा एआईको दुरुपयोग रोक्न हो।

Aaronson वाटरमार्किंग ChatGPT आउटपुट को कारण को व्याख्या:

"यो शैक्षिक साहित्यिक चोरी रोक्नको लागि उपयोगी हुन सक्छ, स्पष्ट रूपमा, तर पनि, उदाहरणका लागि, प्रचारको ठूलो पुस्ता ..."

ChatGPT वाटरमार्किङले कसरी काम गर्छ?

ChatGPT वाटरमार्किङ एक प्रणाली हो जसले सांख्यिकीय ढाँचा, कोड, शब्दहरूको छनोट र विराम चिन्हहरू सम्मिलित गर्दछ।

आर्टिफिसियल इन्टेलिजेन्सद्वारा सिर्जना गरिएको सामग्री शब्द छनोटको पर्याप्त अनुमानित ढाँचाको साथ उत्पन्न हुन्छ।

मानव र एआई द्वारा लेखिएका शब्दहरू सांख्यिकीय ढाँचा पछ्याउँछन्।

जेनेरेट गरिएको सामग्रीमा प्रयोग गरिएका शब्दहरूको ढाँचा परिवर्तन गर्नु भनेको पाठलाई "वाटरमार्क" गर्ने तरिका हो कि यो एआई टेक्स्ट जेनेरेटरको उत्पादन हो कि भनेर पत्ता लगाउन प्रणालीलाई सजिलो बनाउन।

AI सामग्री वाटरमार्किङ पत्ता लगाउन नसकिने युक्ति यो हो कि शब्दहरूको वितरण अझै पनि सामान्य AI उत्पन्न पाठ जस्तै अनियमित उपस्थिति छ।

यसलाई शब्दहरूको स्यूडोरेन्डम वितरण भनिन्छ।

Pseudorandomness भनेको शब्द वा संख्याहरूको सांख्यिकीय रूपमा अनियमित श्रृंखला हो जुन वास्तवमा अनियमित हुँदैन।

ChatGPT वाटरमार्किङ हाल प्रयोगमा छैन। यद्यपि ओपनएआईमा स्कट आरोनसन रेकर्डमा छन् कि यो योजना बनाइएको छ।

अहिले ChatGPT पूर्वावलोकनमा छ, जसले OpenAI लाई वास्तविक-विश्व प्रयोग मार्फत "मिसलाइनमेन्ट" पत्ता लगाउन अनुमति दिन्छ।

सम्भवतः वाटरमार्किङ ChatGPT को अन्तिम संस्करणमा वा त्यो भन्दा चाँडो प्रस्तुत गर्न सकिन्छ।

स्कट आरोनसनले कसरी वाटरमार्किङले काम गर्छ भन्ने बारे लेखे:

"मेरो मुख्य परियोजना अहिले सम्म GPT जस्तै पाठ मोडेल को आउटपुट को सांख्यिकीय वाटरमार्किंग को लागी एक उपकरण भएको छ।
सामान्यतया, जब पनि GPT ले केही लामो पाठ उत्पन्न गर्छ, हामी यसको शब्दहरूको छनोटमा अन्यथा नदेखिने गोप्य संकेत होस् भन्ने चाहन्छौं, जुन तपाईंले पछि प्रमाणित गर्न प्रयोग गर्न सक्नुहुन्छ, हो, यो GPT बाट आएको हो।"

आरोनसनले ChatGPT वाटरमार्किङले कसरी काम गर्छ भनेर थप व्याख्या गरे। तर पहिले, टोकनकरणको अवधारणा बुझ्न महत्त्वपूर्ण छ।

टोकनाइजेशन एक चरण हो जुन प्राकृतिक भाषा प्रशोधनमा हुन्छ जहाँ मेशिनले शब्दहरूलाई कागजातमा लिन्छ र तिनीहरूलाई शब्द र वाक्यहरू जस्ता सिमेन्टिक एकाइहरूमा विभाजन गर्दछ।

टोकनाइजेशनले पाठलाई मेसिन लर्निङमा प्रयोग गर्न सकिने संरचित रूपमा परिवर्तन गर्छ।

पाठ उत्पादनको प्रक्रिया अघिल्लो टोकनको आधारमा कुन टोकन अर्को आउँछ भनेर अनुमान लगाउने मेसिन हो।

यो एउटा गणितीय प्रकार्यको साथ गरिन्छ जसले अर्को टोकन के हुनेछ भन्ने सम्भाव्यता निर्धारण गर्दछ, जसलाई सम्भाव्यता वितरण भनिन्छ।

कुन शब्द अर्को हो भविष्यवाणी गरिएको छ तर यो अनियमित छ।

वाटरमार्किङ आफैं हो जुन आरोनले स्यूडोरेन्डमको रूपमा वर्णन गर्दछ, यसमा त्यहाँ कुनै विशेष शब्द वा विराम चिन्ह हुनुको लागि गणितीय कारण छ तर यो अझै सांख्यिकीय रूपमा अनियमित छ।

यहाँ GPT वाटरमार्किङ को प्राविधिक व्याख्या छ:

"GPT का लागि, प्रत्येक इनपुट र आउटपुट टोकनहरूको एक स्ट्रिङ हो, जुन शब्दहरू हुन सक्छ तर विराम चिन्हहरू, शब्दहरूको भागहरू, वा थप पनि हुन सक्छ - त्यहाँ कुल 100,000 टोकनहरू छन्।
यसको मूलमा, GPT ले अघिल्लो टोकनहरूको स्ट्रिङमा सशर्त उत्पन्न गर्न अर्को टोकनमा सम्भाव्यता वितरणलाई निरन्तर रूपमा उत्पन्न गरिरहेको छ।
न्यूरल नेटले वितरण उत्पन्न गरेपछि, OpenAI सर्भरले वास्तवमा त्यो वितरण अनुसार टोकनको नमूना बनाउँछ — वा 'तापमान' भनिने प्यारामिटरमा निर्भर गर्दै वितरणको केही परिमार्जित संस्करण।
तापक्रम शून्य नभएसम्म, यद्यपि, अर्को टोकनको छनोटमा सामान्यतया केही अनियमितता हुनेछ: तपाईँले एउटै प्रम्प्टको साथमा दौडन सक्नुहुन्छ, र प्रत्येक पटक फरक पूर्णता (जस्तै, आउटपुट टोकनहरूको स्ट्रिङ) प्राप्त गर्न सक्नुहुन्छ। ।
त्यसोभए वाटरमार्कमा, अर्को टोकन अनियमित रूपमा चयन गर्नुको सट्टा, क्रिप्टोग्राफिक स्यूडोरेन्डम प्रकार्य प्रयोग गरेर, जसको कुञ्जी OpenAI लाई मात्र थाहा छ, प्रयोग गरेर यसलाई छद्म अनियमित रूपमा चयन गर्ने विचार हुनेछ।

पाठ पढ्नेहरूलाई वाटरमार्क पूर्ण रूपमा प्राकृतिक देखिन्छ किनभने शब्दहरूको छनोटले अन्य सबै शब्दहरूको अनियमितताको नक्कल गरिरहेको छ।

यस्तो छ प्राविधिक व्याख्या:

"दृष्टान्तको लागि, GPT सँग सम्भावित टोकनहरूको गुच्छा थियो कि यसले समान रूपमा सम्भावित न्याय गर्‍यो, तपाईले केवल जुन टोकन अधिकतम g चयन गर्न सक्नुहुन्छ। कुञ्जी थाहा नभएको व्यक्तिलाई छनोट समान रूपमा अनियमित देखिनेछ, तर कुञ्जी थाहा भएको व्यक्तिले पछि सबै एन-ग्रामहरू जोड्न सक्छ र यो असामान्य रूपमा ठूलो भएको देख्न सक्छ।"

वाटरमार्किङ एक गोपनीयता-पहिलो समाधान हो

मैले सोशल मिडियामा छलफलहरू देखेको छु जहाँ केही व्यक्तिहरूले सुझाव दिए कि OpenAI ले प्रत्येक उत्पादनको रेकर्ड राख्न सक्छ र पत्ता लगाउनको लागि प्रयोग गर्न सक्छ।

स्कट आरोनसनले ओपनएआईले त्यसो गर्न सक्ने कुरा पुष्टि गरे तर त्यसो गर्दा गोपनीयता समस्या खडा हुन्छ। सम्भावित अपवाद कानून प्रवर्तन अवस्थाको लागि हो, जुन उनले विस्तृत गरेनन्।

ChatGPT वा GPT वाटरमार्किङ कसरी पत्ता लगाउने

केहि चाखलाग्दो कुरा जुन अझै राम्रोसँग थाहा छैन जस्तो देखिन्छ कि स्कट आरोनसनले नोट गरे कि वाटरमार्किङलाई हराउने तरिका हो।

उनले वाटरमार्किङलाई हराउन सम्भव छ भनेनन्, उनले भने कि यसलाई हराउन सकिन्छ ।

"अब, यो सबै पर्याप्त प्रयास संग पराजित गर्न सकिन्छ।
उदाहरणका लागि, यदि तपाईंले GPT को आउटपुटलाई व्याख्या गर्न अर्को AI प्रयोग गर्नुभयो - ठीक छ, हामी त्यो पत्ता लगाउन सक्षम हुने छैनौं।"

यस्तो देखिन्छ कि वाटरमार्किङलाई हराउन सकिन्छ, कम्तिमा नोभेम्बरमा जब माथिको कथनहरू बनाइएका थिए।

वाटरमार्किङ हाल प्रयोगमा छ भन्ने कुनै संकेत छैन। तर जब यो प्रयोगमा आउँछ, यो अज्ञात हुन सक्छ कि यो लुफोल बन्द थियो।

उद्धरण

स्कट आरोनसनको ब्लग पोस्ट यहाँ पढ्नुहोस्।