कसरी Python मा OpenAI ChatGPT API को प्रयोग गरेर AI आवाज सहायक निर्माण गर्ने

इकाई-एन्त्रप्रेन्योरना नेपालीमा.png

तपाईंले आफ्नो आफ्नो एआई आवाज सहायक निर्माण गर्ने आग्रह छ? यस तपाईंलाई देखाउनेछ कि कसरी OpenAI ChatGPT API प्रयोग गरेर पायथनमा एक AI आवाज सहायक निर्माण गर्ने? हामी यसलाई ‘कोड’को प्रत्येक पंक्तिमा सबैले समावेश गर्नेछौं, त्यसैले यदि तपाईंले OpenAI को बारेमा परिचित नभएकालाई पनि अनुसर्न सक्नुहुन्छ।

वातावरण सेट गर्नुहोस्

कोडमा ढुङ्गामा लेखि जानु अघि, आवश्यक साधनहरूले हाम्रो पर्यावरण सेट गर्नु पर्छ। पहिलो , हामीले पर्याप्त पुस्तकालयहरू, जस्तै Chargpt APA, OpenAI Whisper, र CoQE TTS text-to-speech सहित कई पुस्तकालयहरू स्थापना गर्नेछौं। हामी पनि हाम्रो अनुप्रयोगका लागि इन्टरफेस निर्माणमा मद्दत गर्ने सजिलो प्रयोग उपकरणको रूपमा Gradio मा सबै कुरा निर्माण गर्नेछौं।

अर्को कुरा, हामी पाठबद्ध मोडेल, वाणीबद्ध मोडेल, र हाम्रो OpenAI कुञ्जी सेट गर्नेछौं। हामी आवाज ट्रान्सक्रिप्शनका लागि OpenAI Whisper पुस्तकालय र GPT-3 पूर्णता को लागि OpenAI API प्रयोग गर्नेछौं।

लाइब्रेरीहरू स्थापना गर्नुहोस्

सुरु गर्नका लागि, हामीलाई आवश्यक पुस्तकालयहरू स्थापना गर्नु पर्छ। हामी TTS (पाठबाचनको लागि) र Numpy, OpenAI Whisper, Gradio र OpenAI प्रयोग गर्दैछौं।

फरक

!pip install TTS
!pip install numpy==1.21
!pip install openai==0.10.2
!pip install gradio
!pip install openai_whisper

पुस्तकालयहरू आयात गर्नुहोस्

यसै गर्ने, हामीले पुस्तकालयहरू स्थापना गरेपछि, हामीले सबै आवश्यक मोडेलहरू आयात गर्नेछौं। हामीले Whisperous, Whisper, Gradio, OpenAI, र TTS आयात गर्नेछौं। यी पुस्तकालयहरूले हामीलाई हाम्रो AI शब्द सहायकका विभिन्न घटकहरू निर्माण गर्नु पर्छ।

पाइथन

व्हिस्पेरस.व्हिस्पर import को रूपमा योग्य हुनुहुन्छ
ग्राडिओमा गाह्रो गर्नुहोस् र ओपेनएआइएपीआई.चलानुहोस् भनेर जति असंख्य भाषामा योग्यतामा छ
टिटीएसमा टिटीएस छ

टेक्स्ट-टु-स्पीच मेरो समायोजन गर्दै

अर्को, हामी पाठबद्ध-बोल्ने उत्पादनमा सेट अप गर्नेछौं। हामी TTS पुस्तकालय प्रयोग गर्नेछौं उत्पादनमा। यसले हाम्रो AI ध्वनि सहायकलाई पाठलाई बोल्ने बनाउनेछ।

मेकफाइल

# स्थापित गर्नुहोस् टिटिएस माेडल
टिटिएस = टिटिएस.टिटिएस()
टिटिएस.माेडेल_लाेड(engine="tts", lang="en")

मुखपुस्तिका-देखि-पाठ-मॉडेल सजाएको छानबिन

हामीले बोलीबाट-पाठलाई टेक्स्टमा रुपान्तरित गर्न यस्तो आवाज सहायक मोडल सेट गर्न पनि आवश्यक हुनेछ। हामी Whisper पुस्तकालयलाई यस मोडललाई निर्माण गर्नको लागि प्रयोग गर्छौं। यसले हाम्रो AI आवाज सहायकलाई बोलीलाई टेक्स्टमा रूपान्तरण गर्न अनुमति दिनेछ।

csharp

# Whisper सेट गर्नुहोस्
wh = whisper.Whisper()
wh.init(whisper.DeviceType.GPU, "en-US")

ओपनएआई एपीआई कुञ्जी सेटअप गर्न

अन्तःसध्यमा, हामीले हाम्रो OpenAI API कुंजी सेट गर्नेछौं। यसले हामीलाई भाषा पूर्ति को लागि GPT-3 का प्रयोग गर्न अनुमति दिनेछ।

मेकफाइल

# ओपेनएआई एपीआई कुटी गर्नुहोस्
api_key = "तपाईंको_एपीआई_कुटी"
api.api_key = api_key

एआई भोलमण्डली निर्माण गर्दै

अब हामीले हाम्रो पर्यावरण सेट गरेका छौं, हामी आइ भोल्टे कलेमया सहायक बनाउनुको लागि तयार छौं। हामीहरू आवेदनको लागि प्रयोग गर्ने प्रयोगकर्ता इंटरफेस प्रणालीको रूपमा ग्राडियो प्रयोग गर्ने छौं। यसले प्रयोगकर्तालाई सवाल सोध्ने र हाम्रो आई भोल्टे सहायकबाट उत्तर प्राप्त गर्ने अनुमति दिनेछ।

पाइथन

def generate_response(text):
    # गोबिंदा भाषा मा लेख बजारा
    audio = tts.get_tts(text, "female")

    # आवाज बाट पाठ लेख बजारा
    text = wh.transcribe(audio, "en-US")

    # GPT-3 को सहायतामा जवाफ तयार गर्नुहोस्
    prompt = "उपरोक्त प्रश्नको उत्तर दिनुहोस्: " + text
    response = api.Completion.create(engine="text-davinci-002", prompt=prompt, max_tokens=1000)

    # उत्तरलाई शब्दहरूमा परिवर्तन गर्नुहोस्
    answer = response.choices[0].text

    # लेख बजाराको आवाजमा परिवर्तन गर्नुहोस्
 

निष्कर्ष

सारांशमा, OpenAI ChatGPT API र पाइथनका सहजतासाथ एआई ध्वनि सहायक निर्माण गर्दा एआई प्रविधिको संभावनाहरू अन्वेषण गर्ने एक उत्कृष्ट तरिका हो। पुस्तकालयहरू र उपकरणहरू उपलब्ध छन्, यसको उपयोग गर्ने वातावरण स्थापित गर्न र वापरकर्ताले सोधिएका प्रश्नहरूको उत्तर दिन र विविध कार्यहरू प्रदान गर्न सक्ने एआई ध्वनि सहायक सिर्जना गर्न साधारण छ।

यस ट्युटोरियलमा, हामीले आवश्यक पुस्तकालयहरू र मोडेलहरू स्थापित गर्ने प्रक्रिया चलाएँ। यसपछि हामीले पाठ-बोलि र बोलि-पाठ मोडेलहरू बनाएँ र OpenAI API कुञ्जी स्थापना गरौं। अन्ततः, हामीले हाम्रो AI ध्वनि सहायकका लागि उपभोक्ता इंटरफेस सिर्जना गर्न को लागि ग्राडियो प्रयोग गर्यौं।

यस ट्यूटोरियल साथै एक ठहर बिनाको जोत २ौँरूपमा छ, तर तपाईंले आफ्नो AI भोलिस असिस्टेन्टलाई सुधार र मेजबानीकरण गर्नका लागि अरू धेरै तरिकाहरू छन्। उदाहरणको लागि, तपाईंले अझै कुछ फंक्सनलिटी थप्न सक्नुहुन्छ जस्तै ईमेल पठाउने, संगीत बजाउने, वा स्मार्ट होम उपकरणहरूमा नियन्त्रण गर्न सक्नुहुन्छ। सोधिन्छ जति, तपाईं विशेष डोमेनमा आफ्नो AI मोडेललाई बुझाउन सक्नुहुन्छ वा फाइन-ट्यूनमा मजबूती प्राप्त गर्न सक्नुहुन्छ।

सामग्री बाट जति सम्भव हुन्छ त्यति देखि उपयोगकर्ताहरूलाई धेरै मूल्य प्रदान गर्ने एक अविरामी र मनोरम परियोजना हो एक AI आवाज सहायक निर्माण गर्नुहोस्। OpenAI ChatGPT API र Python को शक्ति सहित, सम्भावनाहरू अनन्त हुन्छन्।

प्रश्नहरू

निश्चित गर्नुहोस्, यसले ओपेनएआईको च्याटजीपिटी एपीआई प्रयोग गरेर पाइथनमा एक एआई भोलिसाको निर्माण गर्ने केही उपयोगी प्रश्नोत्तरहरू छन्:

Q1: एक्सेल के हो AI आवाज सहायक?

A1: एआई आवाज सहायक एक सफ्टवेयर प्रोग्राम हो जुन अकृतिम बुद्धिमत्ता र प्राकृतिक भाषा प्रसंस्करण प्रयोग गरेर उपयोगकर्ताहरूसँग बोलिएको भाषा द्वारा सहभागिता गर्दछ।

Q2: Python बाट OpenAI ChatGPT API को सहयोगमा एक AI आवाज सहायक बनाउनको लागि कुन पुस्तकालयहरू आवश्यक छन्?

A2: तपाईंले Chargpt APA, OpenAI Whisper, CoQE TTS text-to-speech, Gradio, र Numpy जस्ता पुस्तकालयहरू इन्स्टल गर्नुपर्छ र आयात गर्नुपर्छ।

Q3: ग्राडियो के हो र AI भाषा सहायक तयार गर्नमा कसरी प्रयोग गरिन्छ?

३: Gradio एक सजिलै प्रयोग गर्न सकिने UI टुल हो, जुन तपाईंको AI ध्वनि सहायकका लागि प्रयोग गर्न सकिन्छ। यसले प्रयोगकर्तालाई प्रश्न पूछ्ने र एआइ ध्वनि सहायकबाट प्रतिक्रिया प्राप्त गर्ने अनुमान गर्दछ।

Q4: एक AI आवाज सहायकको लागि पाठ बोल्ने मोडल कसरी सेट गर्ने?

A4: तपाईं आफ्नो एआई आवाज सहायकका लागि पायथनमा टीटीएस पुस्तकालय प्रयोग गर्न सक्नुहुन्छ।

Q5: कैसे एक AI आवाज सहायकको लागि भाषामा-मात्र सिद्धान्त (speech-to-text) मॉडल बनाउने?

A5: तपाईंले आफ्नो AI आवाज सहायकका लागि स्पीच-टु-टेक्स्ट माेडल सेट गर्न Pythonमा OpenAI Whisper पुस्तकालयलाई प्रयोग गर्न सक्नुहुन्छ।

Q6: एक एआई आवाज सहायकको लागि ओपनएआई एपीआई कुंजी कसरी सेट गर्ने?

A6: नेपाली भाषा पूर्णता को लागि GPT-3 का लागी, तपाईंले एक OpenAI API कुञ्जीको लागि साइन अप गर्नुपर्छ र यसलाई तपाईंको पाइथन पर्यावरणमा सेट गर्नुपर्छ।

Q7: के तपाईं एआई आवाज सहायकलाई विशेष कार्यहरू प्रदान गर्न सानमापन गर्न सक्नुहुन्छ?

A7: येस, तपाईं AI भाषा सहायकमा कार्यान्वयन सक्नुहुन्छ जस्तै इमेल पठाउनु, संगीत खेल्नु, वा ईन्टेलिजेन्ट गृह यन्त्रहरूमाथि नियन्त्रण सक्नुहुन्छ।

Q8: के तपाइँ एआई भ्वाइस सहायकको शुद्धता बढा सक्नुहुन्छ?

A8: हुन्छ, तपाईं विशेष डोमेनहरूमा एआई मोडेललाई निरन्तर शुद्ध गर्न सक्नुहुन्छ वा यसको सट्टा दैटामा अरु तकनीकहरू प्रयोग गर्न सक्नुहुन्छ जसले यसको निखारता मजबूत गर्दछ।

सम्बन्धित लेखहरू

थप हेर्नुहोस् >>

HIX.AI सँग AI को शक्ति अनलक गर्नुहोस्!