आवाज की हू-ब-हू नकल करने वाले स्पीच AI Model को तैयार कर रहा Microsoft, लॉन्च को लेकर है डर

माइक्रोसॉफ्ट ने VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

नई दिल्ली। माइक्रोसॉफ्ट ने एक रिसर्च प्रोजेक्ट को दिखाया है, जिसमें VALL-E स्पीच एआई मॉडल के सेकेंड जनरेशन को लेकर जानकारी दी गई है। यह स्पीच एआई मॉडल ऑडियो सैंपल की मदद से आवाज को तैयार कर सकता है। इस मॉडल को VALL-E 2 नाम दिया गया है। इस मॉडल को पिछले मॉडल अलग दो नए बदलावों के साथ तैयार किया जा रहा है, जो इसकी परफोर्मेंस को बेहतर करने के लिए पेश किए जा रहे हैं।

VALL-E 2 को लेकर जानकारी देते हुए कंपनी का कहना है कि नया मॉडल पुराने मॉडल VALL-E पर आधारित है। इस नए मॉडल में रिपीटिशन अवेयर सैम्पलिंग और ग्रुप्ड कोड मॉडलिंग की सुविधा है।

रिपीटिशन अवेयर सैम्पलिंग
ग्रुप्ड कोड मॉडलिंग

रिपीटिशन अवेयर सैम्पलिंग

रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।

ग्रुप्ड कोड मॉडलिंग

ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।