नई दिल्ली, 16 फरवरी . चैटजीपीटी निर्माता ओपनएआई ने एक नए टेक्स्ट-टू-वीडियो मॉडल सोरा लॉन्च किया है, जो विजुअल क्वालिटी और यूजर के प्रॉम्प्ट का पालन करते हुए एक मिनट तक के वीडियो तैयार कर सकता है.
सोरा एक प्रसार मॉडल है, जो एक वीडियो तैयार करता है और वीडियो में मौजूद सोर को धीरे-धीरे कई चरणों में हटाकर इसे बदल देता है.
कंपनी ने कहा, “सोरा एक बार में पूरी वीडियो बनाने या जेनरेट किए गए वीडियो को लंबा करने में सक्षम है.”
केवल टेक्स्ट इंस्ट्रक्शन से एक वीडियो तैयार करने में सक्षम होने के अलावा, मॉडल एक मौजूदा स्टिल इमेज लेने और इमेज कंटेंट को सटीकता और छोटी डिटेल्स पर ध्यान देने के साथ एक वीडियो तैयार करने में भी सक्षम है.
जीपीटी मॉडल के समान, सोरा एक ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, जो बेहतर स्केलिंग परफॉर्मेंस को अनलॉक करता है.
कंपनी ने कहा कि वह सोरा को रेड टीमर्स (डोमेन एक्सपर्ट्स) को नुकसान या जोखिम के लिए महत्वपूर्ण क्षेत्रों का आकलन करने के लिए उपलब्ध करा रही है.
ओपनएआई ने एक बयान में कहा, “हम क्रिएटिव प्रोफेशनल्स के लिए मॉडल को सबसे ज्यादा उपयोगी बनाने के तरीके को आगे बढ़ाने के बारे में फीडबैक प्राप्त करने के लिए कई विजुअल आर्टिस्ट्स, डिजाइनर्स और फिल्म मेकर्स तक पहुंच प्रदान कर रहे हैं.”
सोरा कई करेक्टर्स, कई तरह के मोशन और बैकग्राउंड के सटीक डिटेल्स के साथ मुश्किल सीन्स जनरेट करने में सक्षम होगा.
ओपनएआई के अनुसार, “मॉडल न केवल यह समझता है कि यूजर ने प्रॉम्प्ट में क्या मांगा है, बल्कि यह भी समझता है कि फिजिकल वर्ल्ड में वे चीजें कैसे मौजूद हैं.”
सोरा एक ही जेनरेट किए गए वीडियो के भीतर कई शॉट भी बना सकता है जो करेक्टर्स और विजुअल स्टाइल को सटीक रूप से बनाए रखता है.
हालांकि, कंपनी ने स्वीकार किया कि मौजूदा मॉडल की अपनी कमजोरियां हैं.
कंपनी ने कहा कि वह सोरा को ओपनएआई के प्रोडक्ट्स में उपलब्ध कराने से पहले महत्वपूर्ण सुरक्षा कदम उठाएगी.
कंपनी ने कहा, ”हम गलत सूचना, नफरत फैलाने वाले कंटेंट और भेदभाव जैसे क्षेत्रों में रेड टीमर्स डोमेन एक्सपर्ट्स के साथ काम कर रहे हैं जो मॉडल की टेस्टिंग करेंगे. हम भ्रामक कंटेंट का पता लगाने में मदद करने के लिए टूल भी बना रहे हैं, जैसे कि एक डिटेक्शन क्लासिफायर जो बता सकता है कि सोरा द्वारा कोई वीडियो कब बनाया गया था.”
–
पीके/