OpenAI Launches GPT-5.4 With Native Computer Use Mode, Financial Plugins For Microsoft Excel, Google Sheets

एआई अपडेट धीमा नहीं हो रहा है। ओपनएआई द्वारा चैटजीपीटी के लिए जीपीटी-5.3 इंस्टेंट नामक एक नया अंतर्निहित एआई मॉडल लॉन्च करने के दो दिन बाद, कंपनी ने एक और, और भी अधिक बड़े अपग्रेड का अनावरण किया है: जीपीटी-5.4।

दरअसल, GPT-5.4 दो किस्मों में आता है: GPT-5.4 सोच और GPT-5.4 प्रोबाद वाला सबसे जटिल कार्यों के लिए डिज़ाइन किया गया है।

दोनों ओपनएआई के पेड एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) और कोडेक्स सॉफ्टवेयर डेवलपमेंट एप्लिकेशन में उपलब्ध होंगे, जबकि जीपीटी-5.4 थिंकिंग चैटजीपीटी के सभी भुगतान किए गए ग्राहकों के लिए उपलब्ध होगी (प्लस, $20-प्रति-माह प्लान और ऊपर) और प्रो चैटजीपीटी प्रो ($200 मासिक) और एंटरप्राइज प्लान उपयोगकर्ताओं के लिए आरक्षित होगा।

ओपनएआई के प्रवक्ता के अनुसार, चैटजीपीटी फ्री उपयोगकर्ताओं को जीपीटी-5.4 का स्वाद भी मिलेगा, लेकिन केवल तभी जब उनके प्रश्न मॉडल पर ऑटो-रूटेड होंगे।

इस रिलीज़ पर बड़ी सुर्खियाँ दक्षता हैं, OpenAI की रिपोर्ट के अनुसार GPT-5.4 अपने पूर्ववर्तियों की तुलना में बहुत कम टोकन (कुछ कार्यों पर 47% कम) का उपयोग करता है, और, यकीनन और भी प्रभावशाली ढंग से, एक नया "देशी" कंप्यूटर उपयोग मोड एपीआई और उसके कोडेक्स के माध्यम से उपलब्ध है जो GPT-5.4 को उपयोगकर्ता के कंप्यूटर को एक इंसान की तरह नेविगेट करने और सभी एप्लिकेशन पर काम करने देता है।

कंपनी एक भी जारी कर रही है ChatGPT एकीकरण का नया सुइट GPT-5.4 को सीधे उपयोगकर्ताओं के Microsoft Excel और Google शीट में प्लग करने की अनुमति देता है स्प्रेडशीट और सेल, ग्रैन्युलर विश्लेषण और स्वचालित कार्य पूर्णता को सक्षम करते हैं जिससे पूरे उद्यम में काम में तेजी आनी चाहिए, लेकिन एंथ्रोपिक के क्लाउड और इसके नए कोवर्क एप्लिकेशन की समान पेशकशों के बाद सफेदपोशों की छंटनी का डर और भी अधिक स्पष्ट हो सकता है।

OpenAI का कहना है कि GPT-5.4 एपीआई और कोडेक्स में संदर्भ के 1 मिलियन टोकन तक का समर्थन करता है, जो एजेंटों को लंबी अवधि में कार्यों की योजना बनाने, निष्पादित करने और सत्यापित करने में सक्षम बनाता है – हालांकि, इनपुट 272,000 टोकन से अधिक होने पर यह प्रति 1 मिलियन टोकन पर दोगुना लागत लेता है।

देशी कंप्यूटर का उपयोग: स्वायत्त वर्कफ़्लो की ओर एक कदम

OpenAI की सबसे परिणामी क्षमता यह है कि GPT-5.4 इसका पहला सामान्य-उद्देश्य वाला मॉडल है, जो कोडेक्स और एपीआई में देशी, अत्याधुनिक कंप्यूटर-उपयोग क्षमताओं के साथ जारी किया गया है, जो एजेंटों को कंप्यूटर संचालित करने और अनुप्रयोगों में बहु-चरण वर्कफ़्लो करने में सक्षम बनाता है।

ओपनएआई का कहना है कि मॉडल प्लेराइट जैसे पुस्तकालयों के माध्यम से कंप्यूटर संचालित करने के लिए कोड लिख सकता है और स्क्रीनशॉट के जवाब में माउस और कीबोर्ड कमांड जारी कर सकता है। ओपनएआई एजेंटिक वेब ब्राउजिंग में उछाल का भी दावा करता है।

बेंचमार्क परिणाम इस बात के प्रमाण के रूप में प्रस्तुत किए गए हैं कि यह केवल यूआई रैपर नहीं है।

ब्राउजकॉम्प पर, जो यह मापता है कि एआई एजेंट कठिन-से-पता लगाने योग्य जानकारी खोजने के लिए कितनी अच्छी तरह वेब ब्राउज़ कर सकते हैं, ओपनएआई ने बताया कि जीपीटी-5.4 में जीपीटी-5.2 की तुलना में 17% सुधार हुआ है, और जीपीटी-5.4 प्रो 89.3% तक पहुंच गया है, जिसे कला की एक नई स्थिति के रूप में वर्णित किया गया है।

OSWorld-Verified पर, जो स्क्रीनशॉट के साथ-साथ कीबोर्ड और माउस क्रियाओं का उपयोग करके डेस्कटॉप नेविगेशन को मापता है, OpenAI ने GPT-5.4 को 75.0% सफलता की रिपोर्ट दी है, जबकि GPT-5.2 के लिए यह 47.3% थी, और नोट्स ने मानव प्रदर्शन को 72.4% बताया।

WebArena-सत्यापित पर, GPT-5.4 DOM- और स्क्रीनशॉट-संचालित इंटरैक्शन दोनों का उपयोग करके 67.3% सफलता तक पहुंचता है, जबकि GPT-5.2 के लिए यह 65.4% है। ऑनलाइन-माइंड2वेब पर, OpenAI अकेले स्क्रीनशॉट-आधारित अवलोकनों का उपयोग करके 92.8% सफलता की रिपोर्ट करता है।

OpenAI कंप्यूटर के उपयोग को दृष्टि और दस्तावेज़ प्रबंधन में सुधार से भी जोड़ता है। एमएमएमयू-प्रो पर, जीपीटी-5.4 उपकरण के उपयोग के बिना 81.2% सफलता तक पहुंचता है, जबकि जीपीटी-5.2 के लिए यह 79.5% है, और ओपनएआई का कहना है कि यह “सोच टोकन” के एक अंश का उपयोग करके उस परिणाम को प्राप्त करता है।

ओमनीडॉकबेंच पर, GPT-5.4 की औसत त्रुटि 0.109 बताई गई है, जो GPT-5.2 के लिए 0.140 से बेहतर है। पोस्ट में उच्च-निष्ठा छवि इनपुट के लिए विस्तारित समर्थन का भी वर्णन किया गया है, जिसमें 10.24M पिक्सेल तक का “मूल” विवरण स्तर भी शामिल है।

OpenAI GPT-5.4 को लंबे समय तक, बहु-चरणीय वर्कफ़्लो के लिए निर्मित करता है – वह कार्य जो तेजी से एक बार प्रतिक्रिया देने वाले चैटबॉट के बजाय कई कार्यों में स्थिति को बनाए रखने वाले एजेंट की तरह दिखता है।

टूल खोज और बेहतर टूल ऑर्केस्ट्रेशन

जैसे-जैसे टूल इकोसिस्टम बड़ा होता जा रहा है, ओपनएआई का तर्क है कि प्रत्येक टूल परिभाषा को प्रॉम्प्ट में डंप करने का सरल दृष्टिकोण हर अनुरोध पर भुगतान किए गए कर का निर्माण करता है: लागत, विलंबता और संदर्भ प्रदूषण।

GPT-5.4 एपीआई में टूल सर्च को एक संरचनात्मक सुधार के रूप में प्रस्तुत करता है। सभी टूल परिभाषाओं को अग्रिम रूप से प्राप्त करने के बजाय, मॉडल को टूल की एक हल्की सूची और एक खोज क्षमता प्राप्त होती है, और यह पूर्ण टूल परिभाषाओं को तभी पुनः प्राप्त करता है जब उनकी वास्तव में आवश्यकता होती है।

OpenAI एक ठोस तुलना के साथ दक्षता की जीत का वर्णन करता है: स्केल के MCP एटलस बेंचमार्क से 250 कार्यों पर, 36 MCP सर्वर सक्षम होने के साथ चलने पर, टूल-सर्च कॉन्फ़िगरेशन ने कॉन्फ़िगरेशन के समान सटीकता प्राप्त करते हुए कुल टोकन उपयोग को 47% कम कर दिया, जिसने सभी MCP कार्यों को सीधे संदर्भ में उजागर किया।

वह 47% का आंकड़ा विशेष रूप से उस मूल्यांकन में टूल-सर्च सेटअप के बारे में है – यह कोई स्पष्ट दावा नहीं है कि जीपीटी-5.4 हर प्रकार के कार्य के लिए 47% कम टोकन का उपयोग करता है।

डेवलपर्स और कोडिंग वर्कफ़्लो के लिए सुधार

ओपनएआई की कोडिंग पिच यह है कि जीपीटी-5.4 जीपीटी-5.3-कोडेक्स की कोडिंग शक्तियों को मजबूत टूल और कंप्यूटर-उपयोग क्षमताओं के साथ जोड़ता है जो तब मायने रखते हैं जब कार्य एकल-शॉट नहीं होते हैं।

GPT-5.4 तर्क प्रयासों में कम विलंबता के साथ SWE-बेंच प्रो पर GPT-5.3-कोडेक्स से मेल खाता है या उससे बेहतर प्रदर्शन करता है।

कोडेक्स को वर्कफ़्लो-स्तरीय नॉब भी मिलते हैं। OpenAI का कहना है कि /फास्ट मोड GPT-5.4 सहित समर्थित मॉडलों में 1.5× तक तेज प्रदर्शन प्रदान करता है, इसे वही मॉडल और इंटेलिजेंस “बस तेज” के रूप में वर्णित करता है।

और यह एक प्रायोगिक कोडेक्स कौशल, “प्लेराइट (इंटरएक्टिव)” को जारी करने का वर्णन करता है, जिसका उद्देश्य यह प्रदर्शित करना है कि कोडिंग और कंप्यूटर का उपयोग एक साथ कैसे काम कर सकता है – वेब और इलेक्ट्रॉन ऐप्स को विज़ुअली डिबग करना और ऐप के निर्माण के दौरान उसका परीक्षण करना।

माइक्रोसॉफ्ट एक्सेल और गूगल शीट्स के लिए ओपनएआई

GPT-5.4 के साथ, OpenAI उद्यमों और वित्तीय संस्थानों के लिए निर्मित ChatGPT में सुरक्षित AI उत्पादों के एक सूट की घोषणा कर रहा है, जो उन्नत वित्तीय तर्क और एक्सेल-आधारित मॉडलिंग के लिए GPT-5.4 द्वारा संचालित है।

केंद्रबिंदु है एक्सेल और गूगल शीट्स के लिए चैटजीपीटी (बीटा), जिसे OpenAI चैटजीपीटी के रूप में वर्णित करता है, जो उन सूत्रों और संरचनाओं का उपयोग करके जटिल वित्तीय मॉडल बनाने, विश्लेषण करने और अपडेट करने के लिए स्प्रेडशीट में सीधे एम्बेडेड होता है, जिन पर टीमें पहले से ही भरोसा करती हैं।

सुइट में बाजार, कंपनी और आंतरिक डेटा को एक ही वर्कफ़्लो में एकीकृत करने के उद्देश्य से नया चैटजीपीटी ऐप एकीकरण भी शामिल है, जिसका नामकरण किया गया है फैक्टसेट, एमएससीआई, थर्ड ब्रिज और मूडीज।

और यह आय पूर्वावलोकन, तुलनीय विश्लेषण, डीसीएफ विश्लेषण और निवेश ज्ञापन प्रारूपण जैसे आवर्ती वित्त कार्यों के लिए पुन: प्रयोज्य “कौशल” का परिचय देता है।

OpenAI एक आंतरिक बेंचमार्क दावे के साथ वित्त को बढ़ावा देता है: OpenAI आंतरिक निवेश बैंकिंग बेंचमार्क पर विचार करते हुए मॉडल प्रदर्शन GPT-5 के साथ 43.7% से बढ़कर GPT-5.4 के साथ 88.0% हो गया।

पेशेवर काम के मुकाबले एआई प्रदर्शन को मापना

ओपनएआई केवल पहेली-सुलझाने के लिए नहीं, बल्कि वास्तविक कार्यालय डिलिवरेबल्स से मिलते-जुलते बेंचमार्क पर निर्भर करता है। जीडीपीवल पर, 44 व्यवसायों में “अच्छी तरह से निर्दिष्ट ज्ञान कार्य” का मूल्यांकन करते हुए, ओपनएआई की रिपोर्ट है कि जीपीटी-5.4, जीपीटी-5.2 के लिए 71.0% की तुलना में 83.0% की तुलना में उद्योग के पेशेवरों से मेल खाता है या उससे आगे है।

कंपनी उन कलाकृतियों के प्रकारों में विशिष्ट सुधारों पर भी प्रकाश डालती है जो मॉडल की कमजोरियों को उजागर करती हैं: संरचित तालिकाएँ, सूत्र, कथा सुसंगतता और डिज़ाइन गुणवत्ता।

एक जूनियर निवेश बैंकिंग विश्लेषक जो कर सकता है उसके आधार पर तैयार किए गए स्प्रेडशीट मॉडलिंग कार्यों के आंतरिक बेंचमार्क में, GPT-5.4 का औसत स्कोर 87.5% तक पहुंच जाता है, जबकि GPT-5.2 का औसत स्कोर 68.4% है।

और प्रेजेंटेशन मूल्यांकन संकेतों के एक सेट पर, ओपनएआई का कहना है कि मानव मूल्यांकनकर्ताओं ने मजबूत सौंदर्यशास्त्र, अधिक दृश्य विविधता और छवि निर्माण के अधिक प्रभावी उपयोग का हवाला देते हुए जीपीटी-5.2 की तुलना में 68.0% समय जीपीटी-5.4 की प्रस्तुतियों को प्राथमिकता दी।

विश्वसनीयता में सुधार और मतिभ्रम को कम करना

OpenAI GPT-5.4 को अब तक का अपना सबसे तथ्यात्मक मॉडल बताता है और उस दावे को एक व्यावहारिक डेटासेट से जोड़ता है: डी-आइडेंटिफाइड प्रॉम्प्ट जहां उपयोगकर्ताओं ने पहले तथ्यात्मक त्रुटियों को चिह्नित किया था। उस सेट पर, OpenAI GPT-5.4 की रिपोर्ट करता है व्यक्तिगत दावे इसके झूठे होने की संभावना 33% कम है और इसके पूर्ण प्रतिक्रियाएँ GPT-5.2 की तुलना में किसी भी प्रकार की त्रुटि होने की संभावना 18% कम है।

OpenAI की ओर से वेंचरबीट को दिए गए बयानों में और शुरुआती GPT-5.4 परीक्षकों को जिम्मेदार ठहराते हुए, Walleye Capital के डैनियल स्वेकी का कहना है कि आंतरिक वित्त और एक्सेल मूल्यांकन पर, GPT-5.4 ने सटीकता में 30 प्रतिशत अंकों का सुधार किया है, जिसे वह मॉडल अपडेट और परिदृश्य विश्लेषण के लिए विस्तारित स्वचालन से जोड़ता है।

मर्कोर के सीईओ ब्रेंडन फूडी, GPT-5.4 को कंपनी द्वारा आजमाया गया सबसे अच्छा मॉडल बताते हैं और कहते हैं कि यह अब पेशेवर सेवाओं के काम के लिए मर्कोर के एपेक्स-एजेंट बेंचमार्क में शीर्ष पर है, जो स्लाइड डेक, वित्तीय मॉडल और कानूनी विश्लेषण जैसे लंबे-क्षितिज डिलिवरेबल्स पर जोर देता है।

मूल्य निर्धारण और उपलब्धता

एपीआई में, ओपनएआई का कहना है कि जीपीटी-5.4 थिंकिंग के रूप में उपलब्ध है gpt-5.4 और GPT-5.4 प्रो के रूप में gpt-5.4-pro. कीमत इस प्रकार है:

जीपीटी-5.4: $2.50 / 1एम इनपुट टोकन; $15 / 1एम आउटपुट टोकन
जीपीटी-5.4 प्रो: $30 / 1एम इनपुट टोकन; $180 / 1एम आउटपुट टोकन
बैच + फ्लेक्स: आधी दर; प्राथमिकता प्रसंस्करण: 2× दर

यह GPT-5.4 को संपूर्ण फ़ील्ड की तुलना में API पर चलाने के लिए अधिक महंगे मॉडलों में से एक बनाता है, जैसा कि नीचे दी गई तालिका में देखा गया है।

नमूना	इनपुट	उत्पादन	कुल लागत	स्रोत
क्वेन 3 टर्बो	$0.05	$0.20	$0.25	अलीबाबा क्लाउड
Qwen3.5-फ्लैश	$0.10	$0.40	$0.50	अलीबाबा क्लाउड
डीपसीक-चैट (V3.2-एक्सप)	$0.28	$0.42	$0.70	डीपसीक
डीपसीक-रीज़नर (V3.2-एक्सप)	$0.28	$0.42	$0.70	डीपसीक
ग्रोक 4.1 तेज़ (तर्क)	$0.20	$0.50	$0.70	एक्सएआई
ग्रोक 4.1 तेज़ (गैर-तर्क)	$0.20	$0.50	$0.70	एक्सएआई
मिनीमैक्स एम2.5	$0.15	$1.20	$1.35	अल्पमहिष्ठ
जेमिनी 3.1 फ्लैश-लाइट	$0.25	$1.50	$1.75	गूगल
मिनीमैक्स एम2.5-लाइटनिंग	$0.30	$2.40	$2.70	अल्पमहिष्ठ
जेमिनी 3 फ्लैश पूर्वावलोकन	$0.50	$3.00	$3.50	गूगल
किमी-k2.5	$0.60	$3.00	$3.60	चन्द्रमा
जीएलएम-5	$1.00	$3.20	$4.20	Z.ai
एर्नी 5.0	$0.85	$3.40	$4.25	Baidu
क्लाउड हाइकु 4.5	$1.00	$5.00	$6.00	anthropic
क्वेन3-मैक्स (2026-01-23)	$1.20	$6.00	$7.20	अलीबाबा क्लाउड
जेमिनी 3 प्रो (≤200K)	$2.00	$12.00	$14.00	गूगल
जीपीटी-5.2	$1.75	$14.00	$15.75	ओपनएआई
क्लाउड सॉनेट 4.6	$3.00	$15.00	$18.00	anthropic
जीपीटी-5.4	$2.50	$15.00	$17.50	ओपनएआई
जेमिनी 3 प्रो (>200K)	$4.00	$18.00	$22.00	गूगल
क्लाउड ओपस 4.6	$5.00	$25.00	$30.00	anthropic
जीपीटी-5.2 प्रो	$21.00	$168.00	$189.00	ओपनएआई
जीपीटी-5.4 प्रो	$30.00	$180.00	$210.00	ओपनएआई

एक और महत्वपूर्ण नोट: GPT-5.4 के साथ, 272,000 इनपुट टोकन से अधिक अनुरोधों को सामान्य दर से 2X पर बिल किया जाता है, जो पहले समर्थित मॉडल की तुलना में बड़े संकेत भेजने की क्षमता को दर्शाता है।

कोडेक्स में, संकुचन डिफ़ॉल्ट रूप से 272k टोकन पर होता है, और उच्चतर दीर्घकालिक-संदर्भ मूल्य निर्धारण केवल तभी लागू होता है जब इनपुट 272k से अधिक हो जाता है – जिसका अर्थ है कि डेवलपर्स उच्च दर को ट्रिगर किए बिना उस आकार पर या उसके नीचे संकेत भेजना जारी रख सकते हैं, लेकिन संघनन सीमा को बढ़ाकर बड़े संकेतों का विकल्प चुन सकते हैं, केवल उन बड़े अनुरोधों को अलग तरीके से बिल किया जाता है।

ओपनएआई के प्रवक्ता ने कहा कि एपीआई में अधिकतम आउटपुट 128,000 टोकन है, जो पिछले मॉडल के समान है।

अंत में, बेसलाइन पर GPT-5.4 की कीमत अधिक क्यों है, प्रवक्ता ने इसके लिए तीन कारकों को जिम्मेदार ठहराया: जटिल कार्यों पर उच्च क्षमता (कोडिंग, कंप्यूटर उपयोग, गहन शोध, उन्नत दस्तावेज़ निर्माण और टूल उपयोग सहित), OpenAI के रोडमैप से प्रमुख अनुसंधान सुधार, और अधिक कुशल तर्क जो तुलनीय कार्यों के लिए कम तर्क टोकन का उपयोग करता है – यह कहते हुए कि OpenAI का मानना है कि वृद्धि के साथ भी मूल्य निर्धारण पर GPT-5.4 तुलनीय फ्रंटियर मॉडल से नीचे बना हुआ है।

व्यापक बदलाव

रिलीज़ और अनुवर्ती स्पष्टीकरणों में, GPT-5.4 को एक मॉडल के रूप में तैनात किया गया है जिसका उद्देश्य “उत्तर पीढ़ी” से आगे बढ़ना और निरंतर पेशेवर वर्कफ़्लो में जाना है – जिनके लिए टूल ऑर्केस्ट्रेशन, कंप्यूटर इंटरैक्शन, लंबे संदर्भ और आउटपुट की आवश्यकता होती है जो कलाकृतियों की तरह दिखते हैं जो लोग वास्तव में काम पर उपयोग करते हैं।

ओपनएआई का टोकन दक्षता, उपकरण खोज, मूल कंप्यूटर उपयोग और उपयोगकर्ता-ध्वजांकित तथ्यात्मक त्रुटियों को कम करने पर जोर एक ही दिशा में इंगित करता है: पुनर्प्रयास की लागत को कम करके एजेंटिक सिस्टम को उत्पादन में अधिक व्यवहार्य बनाना – चाहे वह पुन: प्रयास एक मानव पुन: संकेत हो, एक एजेंट दूसरे उपकरण को बुला रहा हो, या एक वर्कफ़्लो फिर से चल रहा हो क्योंकि पहला पास टिक नहीं पाया।

<a href

OpenAI launches GPT-5.4 with native computer use mode, financial plugins for Microsoft Excel, Google Sheets

देशी कंप्यूटर का उपयोग: स्वायत्त वर्कफ़्लो की ओर एक कदम

टूल खोज और बेहतर टूल ऑर्केस्ट्रेशन

डेवलपर्स और कोडिंग वर्कफ़्लो के लिए सुधार

माइक्रोसॉफ्ट एक्सेल और गूगल शीट्स के लिए ओपनएआई

पेशेवर काम के मुकाबले एआई प्रदर्शन को मापना

विश्वसनीयता में सुधार और मतिभ्रम को कम करना

मूल्य निर्धारण और उपलब्धता

व्यापक बदलाव

Like this:

Related

Leave a Comment Cancel reply

देशी कंप्यूटर का उपयोग: स्वायत्त वर्कफ़्लो की ओर एक कदम

टूल खोज और बेहतर टूल ऑर्केस्ट्रेशन

डेवलपर्स और कोडिंग वर्कफ़्लो के लिए सुधार

माइक्रोसॉफ्ट एक्सेल और गूगल शीट्स के लिए ओपनएआई

पेशेवर काम के मुकाबले एआई प्रदर्शन को मापना

विश्वसनीयता में सुधार और मतिभ्रम को कम करना

मूल्य निर्धारण और उपलब्धता

व्यापक बदलाव

Share this:

Like this:

Related

Leave a Comment Cancel reply