OpenAI GPT-4 आउने मध्यमा मार्च २०२३

जीपीटी-४-६४०बी६६डीबी८सी६०केएमसाठि सइजे-१५२०एक्स८००.जेपीएजी

Microsoft Germany CTO, Andreas Braun, ने पुष ९, २०२३ को एक सप्ताहमा GPT-4 को आगमन स्वीकार्य बताए र यसले बहुप्रकारक हुनेछको पुष्टि गर्दछ। बहुप्रकारक AI भनेको यसले भिडियो, तस्बिर र ध्वनि जस्ता बहु रकमका प्रवेशमा कार्य गर्न सक्नेछ।

अद्यावधिक: GPT-4 जारी मार्च १४, २०२३

OpenAIले GPT-4 जारी गर्यो मार्च १४, २०२३ मा। यसले छवि र पाठ प्रोम्प्टहरू स्वीकार गर्दछको एक बहुसांगत मोडल हो।

Modal एक मशीन लर्निङको अंग्रेजी शब्द हो जसले पाठ, तर साथै शब्दहरूबाट बाहिर प्रस्तुति, अवगाहन, दृष्टि, सुगन्ध आदि जस्ता अन्तरणस्थिति हरूलाई चिन्हाँको रूपमा प्रयोग गर्दछ।

ओपेनएआईको घोषणामा जीपीटि-४ का प्रगतिहरूको विस्तार देखाएको छ:

"... मानिसहरू भन्दा ढिला छोडि, विभिन्न पेशागत र शैक्षिक मापदण्डहरूमा मानिसको स्तरमा काम गर्दछ।

उदाहरणका लागि, यसले एक प्रतीत प्रयोगिक बार परीक्षामा असरदार दर्जा स्कोर गर्दछ जोकि परीक्षामा उपस्थित हुने परीक्षार्थीहरूको शीर्ष १०% माथि हुन्छ; तथापि, GPT-3.5 को स्कोर तल १०% भन्दा पनि कम होत्यो।

हामीले ६ महिनामा GPT-4 लाई केहि धेरै बदलिएर ज्यादै परिणामहरूमा समावेशित गरेका छौं जसले हामीलाई तत्वशक्तिकता, दिशामा निर्देशनयोग्यता र अतिरिक्त कार्य प्रति सतर्क नहुने गराउँछ।”

बहुध्रुवीय ठूलो भाषा मोडेलहरू

घोषणाबाट मुख्य बिन्दु भन्दा साथै, जी.पी.टि-४ मल्टिमोडल हो (एसईजेले जनवरी २०२३ मा जी.पी.टि-४ मल्टिमोडल हुने प्रावधान गर्नुभएको थियो।)

मोडालिटी एक संदर्भ हो जस्तो कि (यस मामिलामा) एक माथिल्लो भाषा मोडलले उपचार गर्दछ।

मल्टिमोडलले पाठ, बोली, तस्वीर र भिडियोलाई समावेश गर्न सक्छ।

GPT-3 र GPT-3.5 केवल एक प्रकारको, पाठको माध्यमबाट संचालित भइरहेछ।

जर्मन समाचार रिपोर्टको अनुसार, जीपीटी-४ अद्यावधिकता यसको कम्तिमा चार प्रकारको मोडालिटीमा काम गर्न सक्छ, जस्तै छायाँ, ध्वनि (श्रवण), पाठ र भिडियो।

डा. अण्ड्रियास ब्राउन, CTO माइक्रोसफ्ट जर्मनीले उद्धृत गर्छन्:

"हामी आउँदो हप्तामा GPT-4 पेश गर्नेछौं, जहाँ हामीमा मल्टिमोडल मोडेलहरू हुन जसले पूर्णताया विभिन्न संभावनाहरू उपलब्ध गराउनेछ - उदाहरणको लागि भिडियोहरू ..."

सूचना भित्रको रिपोर्टिङ्गले GPT-4को लागि निर्दिष्ट विवरणहरू अभावभाइ छ, यसैले अनेकतामा केही रिक्त समयबिनाका संयोजनका बारेमा चर्चा गरिएको जानकारीलाई केवल GPT-4बारे वा साधारण रूपले मात्र हो भनेर स्पष्ट छैन।

माइक्रोसफ्टका निदेशक व्यावसायिक रणनीति होल्गर केन उदाहरणहरूका आधारमा बहुरूपताहरूको व्याख्या गर्नुभयो, तर रिपोर्टिंग स्पष्ट थिएन यदि उहाँले जीपीटी-४ बहुरूपता वा साधारण बहुरूपतामा संदर्भ गरेका थिए।

मेरो विश्वास छ कि उनका बहुमुद्रामा संदर्भहरू GPT-4 सम्बन्धी थिए।

समाचार प्रकाशित गर्दछ:

"केनले बताएका अनुसार, मल्टिमोडल AI केहिले पनि वाक्यहरूलाई छवि, संगीत र भिडियोमा अनुवाद गर्न सक्छ।"

अर्को रोचक तथ्य यो हो कि Microsoft ले "विश्वासः मापन" लाई गतिमा राख्नका लागि काम गर्दै छ, ताकि यो अत्यन्त विश्वसनीय वा विश्वसनीय बनाउनका लागि तथ्यहरूको साथ आधार तय गर्न सक्दैन।

माइक्रोसफ्ट कोस्मोस-१

संयुक्त राज्यहरूमा प्रतिवेदन गरिएको कुरा भनेर जानेको होइन, माइक्रोसफ्टले २०२३ को मार्चको सुरुमा कोस्मोस-१ नामक एक बहुसंवेदी भाषा मोडल जारी गरेको थियो।

जर्मन समाचार पोर्टल Heise.de ले दी खबरब्यापार गर्दै भन्छन्:

"... टोलीले पूर्वप्रशिक्षित मोडेललाई विविध परीक्षाहरूको अवलोकनमा राख्यो, जसमा छविहरूलाई वर्गीकृत गर्ने, छवि सामग्रीबारे प्रश्नहरूका उत्तर दिने, छविहरूको स्वचालित लेबिलिङ गर्ने, आँक्सीजोनल टेक्स्ट पहिचान गर्ने र भाषण उत्पन्न गर्ने कार्यहरूमा राम्रो परिणाम छ।"

...यहाँ भाषा नलाई मध्यस्थी चरणको रुपमा अपयोग गरेर तस्बिरहरूको बारेमा निष्कर्ष खिचाउने सब्यस्तित जस्तो देखिन्छ...

Kosmos-1 एक बहुमोडल मोडल हो जुन टेक्स्ट र तस्वीरहरूको मोडालिटीहरूलाई एकीकृत गर्दछ।

GPT-4 ले Kosmos-1 भन्दा थप मिलाउँछ किनकि यसमा तीनौं प्रकारको प्रचार जोडिन्छ, भिडियो र साउन्डको पनि प्रकारलाई समावेश गर्ने देखिन्छ।

विभिन्न भाषामा काम गर्दछ

GPT-4 लाई जसरीजसरी भाषाहरूमा काम गर्छ। यसलाई जर्मनमा सवाल प्राप्त गर्छ र इटालियनमा उत्तर दिन सक्छ।

यो केही अनोखो उदाहरण हो किनकि, कोलुमबियाली भाषामा सवाल पुछ्न र उत्तर आईतालियनमा प्राप्त गर्न चाहने को हो?

यो निश्चित भएको छ:

"...यस प्रबिधि सो धेरै दूर पुगेको छ कि, यसले मुख्यतः सबै भाषामा काम गर्दछ: तपाईं जर्मन भाषामा प्रश्न पूछ्नुहुन्छ र इटालियन भाषामा उत्तर प्राप्त गर्नुहुन्छ।"

मल्टीमोडालिटीले, माइक्रोसफ्ट(-ओपनएआई) 'मोडलहरूलाई समाग्री बनाउने' हुनेछ।"

मलाई विश्वास छ कि विफलताको बिन्दुमा मोडेलले भाषा तर्फ जान, त्यसको शक्तिबाट विभिन्न भाषामा ज्ञान खिचियाउन सक्छ। यदि जवाफ इटालियनमा छ भने, यसलाई थाहा हुन्छ र स्वाला क्षेत्रमा सोधिएको भाषामा जवाफ प्रदान गर्न सक्नेछ।

यो गूगलको बहुस्रोत एआई, ममको लक्ष्यसँग समान बनाउनेछ। ममले ज्यापानी जस्ता अर्को भाषामा मात्र अवस्थित डाटाका लागि अंग्रेजीमा जवाफ दिन सक्नेछ।

GPT-4 अनुप्रयोगहरू

जीपीटी-४ले कहाँ देखिनेलाई सम्पुर्ण घोषणा भएको छैन। तर Azure-OpenAI विशेष रूपमा उल्लेख गरिएको थियो।

गूगलले आफ्नो खुद्रा अनुसन्धान मध्ये माइक्रोसोफ्टलाई पीछाडी धेरै पक्का गर्न खोजी गर्दैछ। यो विकासले गूगलले झरेको छिटो, ग्राहकलाई एआईमा नेतृत्वनभएको ढाँचा नभएको बारेमा गुनासो गर्दछ।

गुगलले पहिले नै एआईलाई कई विभिन्न उत्पादहरूमा वितरण गर्दछ जस्की वजहले गुगल लेंस, गुगल म्याप्स र अन्य क्षेत्रमा सञ्चालनकर्ताहरू सँग इज्जतापूर्ण सम्पर्क स्थापना गर्ने छ। यस ढाँचामा एआईलाई सहायता साधनका रुपमा प्रयोग गर्ने उद्देश्यले जनतालाई सानो कार्यहरूमा मद्दत गर्ने छ।

माइक्रोसफ्टले यसको अमललाई अधिक द्योतन गरिरहेको छ र नतिजतन्त्रमा यसले सबै ध्यान आकर्षित गर्दैरहेको छ, त्यसैले गूगललाई कुनै समस्या हुँदैन र पिछड्न मा सघाउँदैरहेको छ।

यहाँ ओफिसियल OpenAI GPT-4 जारी घोषणा पढ्न यहाँ क्लिक गर्नुहोस्।

यहाँ मूल जर्मन रिपोर्टिंग पढ्नुहोस्:

GPT-4 आगामी हप्ता आउँदैछ - र यसले बहुसाधारण हुनेछ, Microsoft Germany सुचना दिँदैछ

सम्बन्धित लेखहरू

थप हेर्नुहोस् >>

HIX.AI सँग AI को शक्ति अनलक गर्नुहोस्!