Speech to Speech AI: तकनीकी दुनिया लगातार तेजी से बदल रही है, और भारत के युवा इस परिवर्तन का हिस्सा बन रहे हैं. इसी कड़ी में जयपुर में IIT के एक छात्र ने एक ऐसा अनोखा AI मॉडल विकसित किया है, जो गाना गा सकता है. यह मॉडल न केवल सुर और ताल पहचानता है, बल्कि इंसानी आवाज की तरह भावनाओं के साथ गाने की क्षमता भी रखता है. जयपुर के स्पर्श अग्रवाल ने ‘लूना AI’ मॉडल पेश किया है.
दुनिया का पहला ‘स्पीच-टू-स्पीच’ एआई मॉडल
उनका दावा है कि दुनिया में अपनी तरह का यह पहला ‘स्पीच-टू-स्पीच’ एआई मॉडल है जो गा सकता है, फुसफुसा सकता है और भावनात्मक बुद्धिमत्ता के साथ जवाब दे सकता है. उन्होंने इसे अपने स्टार्टअप ‘पिक्सा एआई’ के तहत पेश किया है. उन्होंने कहा कि लूना एआई आवाज (ऑडियो) को पाठ (टेक्स्ट) में बदलने के बजाय सीधे उसे मानव जैसी आवाज में बदलने के लिए प्रोसेस करता है.
उन्होंने कहा कि इस मॉडल की प्रणाली उसे फुसफुसाने, स्वर को नियंत्रित करने और यहां तक कि गाने की भी अनुमति देती है. यह ऐसा अनुभव प्रदान करता है जो कहीं अधिक मानवीय लगता है. ‘मैंने लूना को बनाने के लिए कई जगह से संसाधन जुटाए और यहां तक कि क्रेडिट कार्ड से कर्ज भी लिया. यह इस बात का प्रमाण है कि केवल संसाधनों से नहीं, बल्कि कुशलता से भारत में विश्व स्तरीय प्रौद्योगिकी विकसित हो सकती है.’
वाहन निर्माताओं, गेमिंग प्लेटफॉर्म की तरफ से आई डिमांड
स्पर्श अग्रवाल भारतीय प्रौद्योगिकी संस्थान (IIT)-बीएचयू से स्नातक हैं. इस परियोजना में उनके अन्य साथी नितीश कार्तिक, अपूर्व सिंह और प्रत्यूष कुमार हैं. कुणाल शाह, कुणाल कपूर और निखिल कामथ जैसे निवेशकों द्वारा समर्थित ‘पिक्सा एआई’ का लक्ष्य लूना को वैश्विक मनोरंजन, स्वास्थ्य और ऑटोमोटिव पारिस्थितिकी तंत्र के लिए ‘वॉयस लेयर’ बनाना है. उनके मुताबिक, इसे लेकर वाहन निर्माताओं, गेमिंग प्लेटफ़ॉर्म और उपभोक्ता एआई कंपनियों की ओर से शुरुआती मांग सामने आई है.




