भारत-विशिष्ट एआई कार्यों में सर्वम एआई ने गूगल जेमिनी और चैटजीपीटी से बेहतर प्रदर्शन किया: सर्वम एआई क्या है और यह क्यों मायने रखता है |

बेंगलुरु के हलचल भरे तकनीकी केंद्रों में, एक शांत क्रांति सामने आई है। सर्वम एआई, एक एआई स्टार्टअप, ने कथित तौर पर वैश्विक एआई दुनिया में तूफान ला दिया है। अपने नवीनतम मॉडल, सर्वम विजन और बुलबुल वी3 के साथ, कंपनी का दावा है कि उसने Google जेमिनी और ओपनएआई के चैटजीपीटी सहित कृत्रिम बुद्धिमत्ता के कुछ सबसे बड़े नामों से बेहतर प्रदर्शन किया है। प्रत्यूष कुमार के अनुसार, सर्वम एआई के विज़न ने आधिकारिक तौर पर एक्स पर जानकारी जारी की, जिसमें अंग्रेजी और अन्य भारतीय भाषाओं में डिजिटलीकरण में सर्वोत्तम परिणामों के साथ राज्य-अंतरिक्ष-आधारित 3-बिलियन-पैरामीटर विज़न भाषा मॉडल की घोषणा की गई।
भारत का सर्वम एआई क्या है जो अन्य एआई मॉडल को मात देता है
यह नया एआई मॉडल अवधारणाओं को देखने के लिए पाठ और आवाज में काम का विस्तार करता है। उनका मुख्य ध्यान भौतिक दस्तावेजों, अभिलेखों और पांडुलिपियों से लेकर भारतीय भाषाओं पर अधिक ध्यान केंद्रित करते हुए दस्तावेज़ खुफिया चुनौतियों को हल करने पर है।इस मॉडल को 22 आधिकारिक भारतीय भाषाओं को कवर करने वाले उच्च-गुणवत्ता वाले डेटासेट पर प्रशिक्षित किया गया था, जिसमें विभिन्न वित्तीय दस्तावेज़, साहित्य, समाचार पत्र, ऐतिहासिक ग्रंथ और बहुत कुछ शामिल थे। अभी के लिए, सर्वम एआई प्रचार के बजाय निष्पादन पर केंद्रित लगता है। स्थानीय अंतर्दृष्टि, अत्याधुनिक एआई और वैश्विक बेंचमार्किंग के मिश्रण के साथ, यह चुपचाप भारत के प्रौद्योगिकी दृष्टिकोण को नया आकार दे सकता है। और एआई दौड़ पर नज़र रखने वाले किसी भी व्यक्ति के लिए, यह ध्यान देने योग्य है।दस्तावेज़ इंटेलिजेंस एपीआई फरवरी 2026 के लिए मुफ़्त है, जो उपयोगकर्ताओं को सर्वम विज़न के साथ बड़े पैमाने पर अन्वेषण और निर्माण करने की अनुमति देता है, जिसकी शुरुआत आज पूरी तरह से मुफ़्त है।
सर्वम एआई की विशेषताओं के बारे में बताया गया
सटीकता की दृष्टि से, विशेष रूप से वैश्विक मानकों पर भारतीय भाषाओं को समझने में, इसमें कई विशेषताएं हैं, जिनमें शामिल हैं:
- मल्टीमॉडल दृष्टि-भाषा
यह छवि कैप्शनिंग, चार्ट या तालिका व्याख्या को अधिक आसानी से सक्षम करने के लिए छवियों और टेक्स्ट को एक साथ समझने में मदद करता है।
- दस्तावेज़ को समझना (भारतीय भाषाओं पर केंद्रित)
इसमें ऐतिहासिक ग्रंथों और स्कैन किए गए दस्तावेजों सहित 22 भारतीय भाषाओं के लिए उच्च सटीकता वाली ओसीआर और ज्ञान निष्कर्षण है।
- चार्ट और डेटा व्याख्या
यह ग्रंथों से अधिक समझने में सक्षम है। दस्तावेज़ों के चार्ट, डेटा, चित्र और दृश्य विश्लेषण।एक ही दस्तावेज़ में कई भाषाओं में दृश्य तत्वों को समझता और व्याख्या करता है।वैश्विक अंग्रेजी बेंचमार्क में उत्कृष्टता प्राप्त की और भारतीय भाषाओं के लिए सर्वम इंडिक ओसीआर बेंच की शुरुआत की।दस्तावेज़ इंटेलिजेंस एपीआई उत्पादन के लिए तैयार हैं और फरवरी 2026 में प्रयोग के लिए निःशुल्क हैं।
सर्वम विजन ओसीआर सटीकता स्तर
कंपनी के ओसीआर मॉडल, सर्वम विजन ने कथित तौर पर जेमिनी 3 प्रो और डीपसीक ओसीआर वी2 को पीछे छोड़ते हुए ओएलएमओसीआर-बेंच पर 84.3% सटीकता हासिल की है। ओमनीडॉकबेंच v1.5 पर, इसने और भी अधिक 93.28% हासिल किया। आधिकारिक सर्वम ब्लॉग के अनुसार मॉडल विविध सामग्री प्रकारों, स्कैन किए गए दस्तावेज़ों और जटिल लेआउट को संभालता है। टीम ने न केवल प्रौद्योगिकी पर ध्यान केंद्रित किया, बल्कि इसे भारत के बहुभाषी परिदृश्य के लिए व्यावहारिक बनाने पर भी ध्यान केंद्रित किया।कंपनी खुद को “सॉवरेन” एआई कहती है। विचार सरल है: भारत के भीतर एआई को सुलभ, विश्वसनीय और नियंत्रित बनाना। उनकी वेबसाइट भारतीय आवश्यकताओं के अनुरूप मूलभूत एआई घटकों के निर्माण की महत्वाकांक्षा को नोट करती है। सर्वम एआई के काम पर किसी का ध्यान नहीं गया।
सर्वम एआई जेमिनी और चैटजीपीटी जैसे अन्य एआई मॉडल से कैसे भिन्न है
इस एआई मॉडल की सबसे दिलचस्प विशेषता इसका फोकस भारतीय भाषाओं पर है, जिसमें अंग्रेजी को प्राथमिकता दी गई है और बाकी को गौण माना गया है। चूँकि यह 22 भारतीय भाषाओं में प्रशिक्षित है, जो क्षेत्रीय लिपियों के लिए उच्च सटीकता प्रदान करता है।जबकि अन्य मॉडल केवल दस्तावेजों या छवियों से पाठ को आकर्षित करने में सक्षम हैं, सर्वम दृश्य तत्वों को बेहतर समझ और अतिरिक्त ज्ञान में व्याख्या कर सकता है। यह भारतीय भाषाओं के लिए बड़े पैमाने पर इंडिक ओसीआर बेंचमार्क के साथ समझ के स्तर पर विभिन्न जटिल दस्तावेजों पर बेहतर प्रदर्शन सुनिश्चित करता है।


