OpenAI deploys Cerebras chips for 'near-instant' code generation in first major move beyond Nvidia

nuneybits Vector art of retro CRT monitor displaying cascading 4c1978f2 debf 4c64 bcac 269b5f7df6ca
ओपनएआई ने गुरुवार को जीपीटी-5.3-कोडेक्स-स्पार्क लॉन्च किया, जो लगभग तात्कालिक प्रतिक्रिया समय के लिए इंजीनियर किया गया एक स्ट्रिप्ड-डाउन कोडिंग मॉडल है, जो अपने पारंपरिक एनवीडिया-प्रभुत्व वाले बुनियादी ढांचे के बाहर कंपनी की पहली महत्वपूर्ण अनुमान साझेदारी को चिह्नित करता है। यह मॉडल सेरेब्रस सिस्टम्स के हार्डवेयर पर चलता है, जो एक सनीवेल-आधारित चिप निर्माता है, जिसके वेफर-स्केल प्रोसेसर कम-विलंबता एआई वर्कलोड में विशेषज्ञ हैं।

यह साझेदारी OpenAI के लिए एक महत्वपूर्ण क्षण पर पहुंची है। कंपनी खुद को लंबे समय से चिप आपूर्तिकर्ता एनवीडिया के साथ एक ख़राब रिश्ते से जूझ रही है, चैटजीपीटी में विज्ञापन पेश करने के अपने फैसले पर आलोचना बढ़ रही है, एक नया घोषित पेंटागन अनुबंध, और आंतरिक संगठनात्मक उथल-पुथल ने एक सुरक्षा-केंद्रित टीम को भंग कर दिया है और कम से कम एक शोधकर्ता ने विरोध में इस्तीफा दे दिया है।

"जीपीयू हमारे प्रशिक्षण और अनुमान पाइपलाइनों में मूलभूत बने हुए हैं और व्यापक उपयोग के लिए सबसे अधिक लागत प्रभावी टोकन प्रदान करते हैं।" ओपनएआई के प्रवक्ता ने वेंचरबीट को बताया। "सेरेब्रस उन वर्कफ़्लो में उत्कृष्ट प्रदर्शन करके उस आधार को पूरा करता है जो बेहद कम विलंबता की मांग करता है, एंड-टू-एंड लूप को कसता है ताकि कोडेक्स में रीयल-टाइम कोडिंग जैसे मामलों का उपयोग आप पुनरावृत्त करते समय अधिक प्रतिक्रियाशील महसूस करें।"

सावधानीपूर्वक फ़्रेमिंग – उस जीपीयू पर जोर देना "मूलभूत बने रहें" सेरेब्रस को एक के रूप में स्थान देते हुए "पूरक" – OpenAI द्वारा बनाए जाने वाले नाजुक संतुलन को रेखांकित करता है क्योंकि यह AI त्वरक में प्रमुख शक्ति एनवीडिया को अलग किए बिना अपने चिप आपूर्तिकर्ताओं में विविधता लाता है।

गति में वृद्धि क्षमता परिवर्तन के साथ आती है जिसे ओपनएआई का कहना है कि डेवलपर्स स्वीकार करेंगे

कोडेक्स-स्पार्क वास्तविक समय कोडिंग सहयोग के लिए निर्मित ओपनएआई के पहले मॉडल का प्रतिनिधित्व करता है। कंपनी का दावा है कि मॉडल डिलीवर करता है अल्ट्रा-लो विलंबता हार्डवेयर पर परोसे जाने पर प्रति सेकंड 1000 से अधिक टोकन, हालांकि इसने समय-से-पहले-टोकन आंकड़े जैसे विशिष्ट विलंबता मेट्रिक्स प्रदान करने से इनकार कर दिया।

"हम विशिष्ट विलंबता संख्याओं को साझा करने में सक्षम नहीं हैं, हालांकि कोडेक्स-स्पार्क को तत्काल महसूस करने के लिए अनुकूलित किया गया है – वास्तविक दुनिया कोडिंग कार्यों के लिए अत्यधिक सक्षम रहते हुए प्रति सेकंड 1000 से अधिक टोकन वितरित करता है," OpenAI के प्रवक्ता ने कहा।

गति में वृद्धि स्वीकृत क्षमता ट्रेडऑफ़ के साथ आती है। एसडब्ल्यूई-बेंच प्रो और टर्मिनल-बेंच 2.0 पर – दो उद्योग बेंचमार्क जो जटिल सॉफ्टवेयर इंजीनियरिंग कार्यों को स्वायत्त रूप से करने के लिए एआई सिस्टम की क्षमता का मूल्यांकन करते हैं – कोडेक्स-स्पार्क पूर्ण जीपीटी-5.3-कोडेक्स मॉडल से कम प्रदर्शन करता है। ओपनएआई इसे एक स्वीकार्य एक्सचेंज के रूप में रखता है: डेवलपर्स को रचनात्मक प्रवाह बनाए रखने के लिए काफी तेजी से प्रतिक्रियाएं मिलती हैं, भले ही अंतर्निहित मॉडल सबसे परिष्कृत मल्टी-स्टेप प्रोग्रामिंग चुनौतियों से नहीं निपट सकता है।

मॉडल 128,000-टोकन संदर्भ विंडो के साथ लॉन्च होता है और केवल टेक्स्ट का समर्थन करता है – कोई छवि या मल्टीमॉडल इनपुट नहीं। ओपनएआई ने इसे कोडेक्स ऐप, कमांड-लाइन इंटरफेस और विजुअल स्टूडियो कोड एक्सटेंशन के माध्यम से चैटजीपीटी प्रो ग्राहकों के लिए एक शोध पूर्वावलोकन के रूप में उपलब्ध कराया है। उद्यम भागीदारों के एक छोटे समूह को एकीकरण संभावनाओं का मूल्यांकन करने के लिए एपीआई पहुंच प्राप्त होगी।

"हम डिज़ाइन साझेदारों के एक छोटे समूह के लिए कोडेक्स-स्पार्क को एपीआई में उपलब्ध करा रहे हैं, ताकि वे समझ सकें कि डेवलपर्स कोडेक्स-स्पार्क को अपने उत्पादों में कैसे एकीकृत करना चाहते हैं," प्रवक्ता ने समझाया. "हम आने वाले हफ्तों में पहुंच का विस्तार करेंगे क्योंकि हम वास्तविक कार्यभार के तहत अपने एकीकरण को समायोजित करना जारी रखेंगे।"

सेरेब्रस हार्डवेयर उन बाधाओं को दूर करता है जो पारंपरिक जीपीयू क्लस्टरों को परेशान करती हैं

कोडेक्स-स्पार्क के पीछे की तकनीकी वास्तुकला अनुमान अर्थशास्त्र के बारे में एक कहानी बताती है जो एआई कंपनियों के उपभोक्ता-सामना वाले उत्पादों के पैमाने के रूप में तेजी से मायने रखती है। सेरेब्रस का वेफर स्केल इंजन 3 – लगभग 4 ट्रिलियन ट्रांजिस्टर युक्त एक डिनर प्लेट के आकार की एक चिप – संचार ओवरहेड के अधिकांश भाग को समाप्त कर देती है जो तब होता है जब एआई वर्कलोड छोटे प्रोसेसर के समूहों में फैलता है।

बड़े मॉडलों के प्रशिक्षण के लिए, वह वितरित दृष्टिकोण आवश्यक है और एनवीडिया के जीपीयू इसमें उत्कृष्ट हैं। लेकिन अनुमान के लिए – उपयोगकर्ता प्रश्नों के जवाब उत्पन्न करने की प्रक्रिया – सेरेब्रस का तर्क है कि इसकी वास्तुकला नाटकीय रूप से कम विलंबता के साथ परिणाम दे सकती है। सेरेब्रस के सीटीओ और सह-संस्थापक सीन ली ने साझेदारी को एक अवसर के रूप में तैयार किया कि डेवलपर्स एआई सिस्टम के साथ कैसे बातचीत करते हैं।

"GPT-5.3-कोडेक्स-स्पार्क के बारे में जो बात हमें सबसे अधिक उत्साहित करती है, वह OpenAI और डेवलपर समुदाय के साथ साझेदारी है ताकि यह पता लगाया जा सके कि तेजी से अनुमान लगाना क्या संभव बनाता है – नए इंटरैक्शन पैटर्न, नए उपयोग के मामले और एक मौलिक रूप से अलग मॉडल अनुभव," झूठ ने एक बयान में कहा। "यह पूर्वावलोकन तो बस शुरुआत है."

ओपनएआई की इंफ्रास्ट्रक्चर टीम ने अपने अनुकूलन कार्य को सेरेब्रस हार्डवेयर तक सीमित नहीं रखा। कंपनी ने अपने संपूर्ण अनुमान स्टैक में विलंबता सुधारों की घोषणा की, जो अंतर्निहित हार्डवेयर की परवाह किए बिना सभी कोडेक्स मॉडलों को लाभान्वित करता है, जिसमें लगातार वेबसॉकेट कनेक्शन और रिस्पॉन्स एपीआई के भीतर अनुकूलन शामिल हैं। परिणाम: प्रति क्लाइंट-सर्वर राउंड ट्रिप ओवरहेड में 80 प्रतिशत की कमी, प्रति-टोकन ओवरहेड में 30 प्रतिशत की कमी, और टाइम-टू-फर्स्ट-टोकन में 50 प्रतिशत की कमी।

$100 बिलियन का एनवीडिया मेगाडील पर्दे के पीछे चुपचाप टूट गया है

ओपनएआई और एनवीडिया के बीच बढ़ते जटिल संबंधों को देखते हुए सेरेब्रस साझेदारी अतिरिक्त महत्व रखती है। पिछली बार, जब ओपनएआई ने अपनी स्टारगेट इंफ्रास्ट्रक्चर पहल की घोषणा की, तो एनवीडिया ने सार्वजनिक रूप से ओपनएआई का समर्थन करने के लिए 100 बिलियन डॉलर का निवेश करने की प्रतिबद्धता जताई, क्योंकि उसने एआई इंफ्रास्ट्रक्चर का निर्माण किया था। यह घोषणा दुनिया की सबसे मूल्यवान एआई कंपनी और उसके प्रमुख चिप आपूर्तिकर्ता के बीच एक रणनीतिक गठबंधन को मजबूत करती प्रतीत हुई।

कई रिपोर्टों के अनुसार, पांच महीने बाद, वह मेगाडील प्रभावी रूप से रुक गई है। एनवीडिया के सीईओ जेन्सेन हुआंग ने सार्वजनिक रूप से तनाव से इनकार किया है और जनवरी के अंत में संवाददाताओं से कहा था कि ऐसा है "कोई नाटक नहीं" और एनवीडिया ओपनएआई के मौजूदा फंडिंग दौर में भाग लेने के लिए प्रतिबद्ध है। लेकिन कई स्रोतों से उपजे मनमुटाव के कारण यह रिश्ता काफी हद तक ठंडा हो गया है।

ओपनएआई ने वैकल्पिक चिप आपूर्तिकर्ताओं के साथ आक्रामक रूप से साझेदारी की है, जिसमें सेरेब्रस डील और एएमडी और ब्रॉडकॉम के साथ अलग-अलग समझौते शामिल हैं। एनवीडिया के दृष्टिकोण से, ओपनएआई अपने प्रभाव का उपयोग उसी हार्डवेयर को कमोडिटाइज़ करने के लिए कर सकता है जिसने इसकी एआई सफलताओं को संभव बनाया है। OpenAI के दृष्टिकोण से, एकल आपूर्तिकर्ता पर निर्भरता कम करना विवेकपूर्ण व्यावसायिक रणनीति का प्रतिनिधित्व करता है।

"हम निरंतर आधार पर सभी उपयोग के मामलों में सबसे अधिक मूल्य-प्रदर्शन वाले चिप्स का मूल्यांकन करने के लिए पारिस्थितिकी तंत्र के साथ काम करना जारी रखेंगे।" ओपनएआई के प्रवक्ता ने वेंचरबीट को बताया। "अनुसंधान और अनुमान में लागत-संवेदनशील और थ्रूपुट-प्रथम उपयोग के मामलों के लिए जीपीयू हमारी प्राथमिकता बनी हुई है।" यह कथन लचीलेपन को बनाए रखते हुए एनवीडिया के विरोध से बचने के लिए एक सावधानीपूर्वक प्रयास के रूप में पढ़ा जाता है – और एक व्यापक वास्तविकता को दर्शाता है कि फ्रंटियर एआई मॉडल को प्रशिक्षित करने के लिए अभी भी उसी तरह की बड़े पैमाने पर समानांतर प्रसंस्करण की आवश्यकता होती है जो एनवीडिया जीपीयू प्रदान करता है।

विघटित सुरक्षा टीमें और शोधकर्ता प्रस्थान ओपनएआई की प्राथमिकताओं पर सवाल उठाते हैं

कोडेक्स-स्पार्क लॉन्च तब हुआ है जब ओपनएआई आंतरिक चुनौतियों की एक श्रृंखला से निपट रहा है जिसने कंपनी की दिशा और मूल्यों की जांच तेज कर दी है। इस सप्ताह की शुरुआत में, रिपोर्टें सामने आईं कि ओपनएआई ने अपनी मिशन संरेखण टीम को भंग कर दिया, एक समूह जिसे सितंबर 2024 में कृत्रिम सामान्य बुद्धिमत्ता से मानवता को लाभ सुनिश्चित करने के कंपनी के घोषित लक्ष्य को बढ़ावा देने के लिए स्थापित किया गया था। टीम के सात सदस्यों को अन्य भूमिकाओं में पुनः नियुक्त किया गया है, नेता जोशुआ अचियम को ओपनएआई के रूप में एक नया शीर्षक दिया गया है "मुख्य भविष्यवादी."

ओपनएआई ने पहले 2024 में एक और सुरक्षा-केंद्रित समूह, सुपरएलाइनमेंट टीम को भंग कर दिया था। उस टीम ने एआई से दीर्घकालिक अस्तित्व संबंधी जोखिमों पर ध्यान केंद्रित किया था। सुरक्षा-उन्मुख टीमों को भंग करने के पैटर्न ने शोधकर्ताओं की आलोचना की है, जो तर्क देते हैं कि ओपनएआई का व्यावसायिक दबाव इसके मूल गैर-लाभकारी मिशन पर भारी पड़ रहा है।

कंपनी को चैटजीपीटी में विज्ञापन पेश करने के अपने फैसले का भी खामियाजा भुगतना पड़ रहा है। शोधकर्ता ज़ो हिट्ज़िग ने इस सप्ताह इस बात पर इस्तीफा दे दिया कि उन्होंने क्या कहा था "फिसलन वाली ढलान" विज्ञापन-समर्थित एआई के बारे में, न्यूयॉर्क टाइम्स के एक निबंध में चेतावनी दी गई है कि चैटजीपीटी का अंतरंग उपयोगकर्ता वार्तालापों का संग्रह हेरफेर के लिए अभूतपूर्व अवसर पैदा करता है। एंथ्रोपिक ने टैगलाइन वाले सुपर बाउल विज्ञापन अभियान के साथ विवाद को पकड़ लिया: "एआई पर विज्ञापन आ रहे हैं। लेकिन क्लाउड को नहीं."

अलग से, कंपनी Genai.mil के माध्यम से पेंटागन को ChatGPT प्रदान करने के लिए सहमत हुई, जो एक नया रक्षा विभाग कार्यक्रम है जिसके लिए OpenAI की अनुमति की आवश्यकता होती है "सभी वैध उपयोग" कंपनी द्वारा लगाए गए प्रतिबंधों के बिना – वे शर्तें जिन्हें एंथ्रोपिक ने कथित तौर पर अस्वीकार कर दिया था। और रिपोर्टें सामने आईं कि ओपनएआई के उत्पाद नीति के उपाध्यक्ष रयान बेयरमिस्टर, जिन्होंने एक योजनाबद्ध स्पष्ट सामग्री सुविधा के बारे में चिंता व्यक्त की थी, को भेदभाव के आरोप के बाद जनवरी में समाप्त कर दिया गया था, जिससे वह इनकार करती हैं।

ओपनएआई एआई कोडिंग सहायकों की कल्पना करता है जो त्वरित संपादन और जटिल स्वायत्त कार्यों को संभालते हैं

आसपास की अशांति के बावजूद, कोडेक्स के लिए ओपनएआई का तकनीकी रोडमैप महत्वाकांक्षी योजनाओं का सुझाव देता है। कंपनी एक ऐसे कोडिंग असिस्टेंट की कल्पना करती है जो लंबे समय तक चलने वाले स्वायत्त कार्यों के साथ रैपिड-फायर इंटरैक्टिव संपादन को सहजता से मिश्रित करता है – एक एआई जो पृष्ठभूमि में अधिक जटिल समस्याओं पर काम करने वाले कई एजेंटों को एक साथ व्यवस्थित करते हुए त्वरित सुधार को संभालता है।

"समय के साथ, मोड मिश्रित हो जाएंगे – पृष्ठभूमि में उप-एजेंटों को लंबे समय तक चलने वाले काम को सौंपते समय, या जब आप चौड़ाई और गति चाहते हैं तो समानांतर में कई मॉडलों को कार्य सौंपते समय कोडेक्स आपको एक तंग इंटरैक्टिव लूप में रख सकता है, इसलिए आपको सामने से एक भी मोड चुनने की ज़रूरत नहीं है," ओपनएआई के प्रवक्ता ने वेंचरबीट को बताया।

इस दृष्टि के लिए न केवल तेज़ अनुमान की आवश्यकता होगी बल्कि विभिन्न आकारों और क्षमताओं के मॉडलों में परिष्कृत कार्य विघटन और समन्वय की भी आवश्यकता होगी। कोडेक्स-स्पार्क उस अनुभव के इंटरैक्टिव हिस्से के लिए कम-विलंबता आधार स्थापित करता है; भावी रिलीज़ों को स्वायत्त तर्क और बहु-एजेंट समन्वय प्रदान करने की आवश्यकता होगी जो पूर्ण दृष्टि को संभव बनाएगी।

अभी के लिए, कोडेक्स-स्पार्क अन्य ओपनएआई मॉडल से अलग दर सीमा के तहत काम करता है, जो अनुसंधान पूर्वावलोकन के दौरान सीमित सेरेब्रा बुनियादी ढांचे की क्षमता को दर्शाता है। "क्योंकि यह विशेष कम-विलंबता हार्डवेयर पर चलता है, उपयोग एक अलग दर सीमा द्वारा नियंत्रित होता है जो अनुसंधान पूर्वावलोकन के दौरान मांग के आधार पर समायोजित हो सकता है," प्रवक्ता ने कहा. सीमाएँ डिज़ाइन की गई हैं "उदार," OpenAI उपयोग पैटर्न की निगरानी करता है क्योंकि यह निर्धारित करता है कि स्केल कैसे करना है।

असली परीक्षा यह है कि क्या तेज़ प्रतिक्रियाएँ बेहतर सॉफ़्टवेयर में परिवर्तित होती हैं

एआई-संचालित डेवलपर टूल के लिए तीव्र प्रतिस्पर्धा के बीच कोडेक्स-स्पार्क की घोषणा हुई है। एंथ्रोपिक के क्लाउड कोवर्क उत्पाद ने पिछले सप्ताह पारंपरिक सॉफ्टवेयर शेयरों में बिकवाली शुरू कर दी क्योंकि निवेशकों ने विचार किया कि क्या एआई सहायक पारंपरिक उद्यम अनुप्रयोगों को विस्थापित कर सकते हैं। Microsoft, Google और Amazon अपने संबंधित क्लाउड प्लेटफ़ॉर्म के साथ एकीकृत AI कोडिंग क्षमताओं में भारी निवेश करना जारी रखते हैं।

ओपनएआई के कोडेक्स ऐप ने दस दिन पहले लॉन्च होने के बाद से तेजी से अपनाए जाने का प्रदर्शन किया है, जिसमें दस लाख से अधिक डाउनलोड और साप्ताहिक सक्रिय उपयोगकर्ता सप्ताह-दर-सप्ताह 60 प्रतिशत बढ़ रहे हैं। 325,000 से अधिक डेवलपर्स अब निःशुल्क और सशुल्क स्तरों पर सक्रिय रूप से कोडेक्स का उपयोग करते हैं। लेकिन ओपनएआई – और व्यापक एआई उद्योग के सामने बुनियादी सवाल यह है कि क्या कोडेक्स-स्पार्क द्वारा वादा किए गए गति सुधार सार्थक उत्पादकता लाभ में तब्दील होते हैं या परिणामों को बदले बिना केवल अधिक सुखद अनुभव पैदा करते हैं।

एआई कोडिंग टूल के प्रारंभिक साक्ष्य से पता चलता है कि तेज़ प्रतिक्रियाएँ अधिक पुनरावृत्त प्रयोग को प्रोत्साहित करती हैं। क्या वह प्रयोग बेहतर सॉफ्टवेयर तैयार करता है, इस पर शोधकर्ताओं और अभ्यासकर्ताओं के बीच समान रूप से विवाद बना हुआ है। जो स्पष्ट प्रतीत होता है वह यह है कि ओपनएआई अनुमान विलंबता को पर्याप्त निवेश के लायक प्रतिस्पर्धी सीमा के रूप में देखता है, भले ही वह निवेश इसे पारंपरिक एनवीडिया साझेदारी से परे वैकल्पिक चिप आपूर्तिकर्ताओं के साथ अप्रयुक्त क्षेत्र में ले जाता है।

सेरेब्रस डील एक परिकलित शर्त है कि विशेष हार्डवेयर उन उपयोग के मामलों को अनलॉक कर सकता है जिन्हें सामान्य प्रयोजन के जीपीयू लागत-प्रभावी ढंग से पूरा नहीं कर सकते हैं। एक कंपनी के लिए जो एक साथ प्रतिस्पर्धियों से जूझ रही है, तनावपूर्ण आपूर्तिकर्ता संबंधों का प्रबंधन कर रही है, और अपनी व्यावसायिक दिशा पर आंतरिक असंतोष का सामना कर रही है, यह एक अनुस्मारक भी है कि एआई दौड़ में, स्थिर रहना कोई विकल्प नहीं है। OpenAI ने तेजी से आगे बढ़ते हुए और परंपराओं को तोड़ते हुए अपनी प्रतिष्ठा बनाई। अब उसे यह साबित करना होगा कि वह और भी तेजी से आगे बढ़ सकता है – बिना खुद को तोड़े।



<a href

Leave a Comment