आवाज की हू-ब-हू नकल करने वाले स्पीच AI Model को तैयार कर रहा Microsoft, लॉन्च को लेकर है डर

माइक्रोसॉफ्ट ने VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

नई दिल्ली। माइक्रोसॉफ्ट ने एक रिसर्च प्रोजेक्ट को दिखाया है, जिसमें VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी गई है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है, जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

VALL-E 2 को लेकर जानकारी देते हुए कंपनी का कहना है कि नया मॉडल पुराने मॉडल VALL-E पर आधारित है। इस नए मॉडल में रिपीटिशन अवेयर सैम्पलिंग और ग्रुप्ड कोड मॉडलिंग की सुविधा है।

  • रिपीटिशन अवेयर सैम्पलिंग
  • ग्रुप्ड कोड मॉडलिंग

रिपीटिशन अवेयर सैम्पलिंग

रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।

ग्रुप्ड कोड मॉडलिंग

ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।

Leave a Reply

Your email address will not be published. Required fields are marked *