
नेशनल ब्यूरो। नई दिल्ली
Alt News का कहना है कि पश्चिम बंगाल की 2026 की मतदाता सूचियाँ CAPTCHA-गेटेड स्कैन किए गए PDF हैं, जिनमें वॉटरमार्क लगे हैं, जिससे खोज और विश्लेषण लगभग असंभव हो गया है । चुनाव आयोग ऑफ इंडिया अपने ERONET सिस्टम में मतदाता डेटा को संरचित, मशीन-रीडेबल फॉर्मेट में रखता है। लेकिन जो कुछ सार्वजनिक रूप से उपलब्ध कराया जाता है आम जनता, शोधकर्ताओं और यहां तक कि राजनीतिक दलों के लिए उसे सीमित रखा जाता है।
पारदर्शिता पर उठे सवाल
Alt News ने गुरुवार शाम को प्रकाशित रिपोर्ट में चुनाव आयोग ऑफ इंडिया (ECI) के कामकाज में अपारदर्शिता पर सवाल उठाए गए हैं। रिपोर्ट में समझाया गया है कि “सूचियाँ खोजने योग्य, मशीन-रीडेबल फाइलों के रूप में नहीं, बल्कि स्कैन किए गए PDF इमेज के रूप में अपलोड की गई थीं यानी मुद्रित पृष्ठों की तस्वीरें। इन्हें खोजा नहीं जा सकता। इनका अर्थपूर्ण विश्लेषण नहीं किया जा सकता।
हर पृष्ठ को डिजाइन के अनुसार जांच से बचाया गया है, जो तीव्र राजनीतिक प्रतिस्पर्धा के इस समय में एक केंद्रीय सवाल उठाता है: जब सार्वजनिक डेटा को व्यावहारिक रूप से उपयोग करने लायक नहीं बनाया जाता, तो किसे फायदा होता है?”
रिपोर्ट में स्पष्ट रूप से न कहे गए एक और मुद्दे पर चिंता जताई गई है कि क्या कोई सुरक्षा उपाय हैं, जिनसे सुनिश्चित हो कि मशीन-रीडेबल डेटा को चयनित राजनीतिक दलों या एजेंसियों, जैसे भाजपा को, न चुनिंदा तरीके से साझा किया जाए। AltNews ने कहा कि इन बाधाओं को पार करने के लिए उसे भारी मेहनत करनी पड़ी। उसने दो निर्वाचन क्षेत्रों की मतदाता सूचियों का विश्लेषण करने से पहले तीन प्रमुख बाधाओं की पहचान की:
भवानीपुर का उदाहरण
केवल भवानीपुर में ही 267 जोन हैं। चुनाव आयोग की वेबसाइट केवल 10 क्षेत्रों की एक बार में डाउनलोड की अनुमति देती है, और हर डाउनलोड CAPTCHA से सुरक्षित है, जो स्वचालन को पूरी तरह रोक देता है। मैन्युअल डाउनलोड करने में घंटों लग गए।
किसी काम की नहीं इमेज फाइल
स्कैन किए गए PDF औसतन डिजिटली पढ़ने योग्य फाइलों से 228 गुना बड़े हैं, लेकिन उनमें अंतर्निहित संरचित डेटा बिल्कुल नहीं है। यह कोई तकनीकी सीमा नहीं है। भारत पहले से ही आधार, UPI और DigiLocker जैसे बड़े पैमाने के डिजिटल सिस्टम चला रहा है। PDF के साथ एक CSV फाइल (कॉमा से अलग किए गए मूल्यों वाली कंप्यूटर फाइल) प्रकाशित करना तुलनात्मक रूप से बहुत आसान काम है। इसलिए ऐसे फॉर्मेट की अनुपस्थिति एक सोचा-समझा फैसला है।
सामग्री की बाधा: लगभग हर 10 में से एक मतदाता प्रविष्टि पर तिरछा “UNDER ADJUDICATION” वॉटरमार्क लगा होता है, जो अक्सर मतदाता का नाम ढक देता है। यह संयोग नहीं है। यह स्वचालित डेटा निकासी में सीधे बाधा डालता है और कुछ मामलों में मैन्युअल पढ़ने को भी मुश्किल बना देता है।
बंगाल में SIR क्यों अलग है
2026 विधानसभा चुनाव से पहले जारी की गई सूची देखने के लिए हर परत जांच के अलग-अलग चरण को लक्षित करती है: CAPTCHA संग्रह को रोकता है, इमेज फॉर्मेट विश्लेषण को रोकता है, वॉटरमार्क पहचान को रोकता है,” । चुनाव आयोग के पास यह डेटा पहले से ही संरचित रूप में मौजूद है, क्योंकि PDF स्वयं डेटाबेस से तैयार किए जाते हैं। केवल स्कैन की गई इमेज प्रकाशित करना, बिना मशीन-रीडेबल फाइलों के साथ, केवल सूचना को रोकना भर नहीं है बल्कि उसकी उपयोगिता रोकना है।
सार्वजनिक तौर पर संभव नहीं विश्लेषण
Alt न्यूज कहता है चुनाव आयोग ने ERONET बनाने पर सार्वजनिक धन खर्च किया। यह केंद्रीकृत सिस्टम पश्चिम बंगाल में एक करोड़ से अधिक “तार्किक विसंगतियों” को चिह्नित कर चुका है, लेकिन यह सार्वजनिक रूप से नहीं बता रहा कि वे फ्लैग कैसे उत्पन्न किए गए। लोकतंत्र में, तकनीकी रूप से सार्वजनिक डेटा को व्यावहारिक रूप से भी सुलभ होना चाहिए। “जब ऐसा नहीं होता, तो बाधा तकनीकी नहीं, राजनीतिक होती है।”
डेटा माइनिंग का दिखाया गया डर
रिपोर्ट ने चुनाव आयोग द्वारा मतदाता सूचियों को केवल इमेज-आधारित फॉर्मेट में रखने के लिए पहले दिए गए औचित्यों को भी याद किया। “जनवरी 2018 में, उसने सभी राज्य मुख्य निर्वाचन अधिकारियों को निर्देश दिया कि सूचियों को इमेज फाइलों के रूप में प्रकाशित किया जाए, डेटा सुरक्षा की चिंता का हवाला देते हुए, खासकर विदेशी तत्वों द्वारा दुरुपयोग का खतरा।
जब कांग्रेस नेता कमल नाथ द्वारा इस नीति को अदालत में चुनौती दी गई, तो आयोग ने तर्क दिया कि खोजने योग्य, मशीन-रीडेबल फॉर्मेट बड़े पैमाने पर डेटा माइनिंग को सक्षम बनाएंगे और मतदाता गोपनीयता का उल्लंघन कर सकते हैं। भारत के सर्वोच्च न्यायालय ने इस दावे की मेरिट पर जांच करने से इनकार कर दिया और फॉर्मेट चुनने का फैसला आयोग के विवेक पर छोड़ दिया।”
आयोग ने कहा था मशीन रीडेबल फाइल हो सकती है एडिट
हाल ही में, अगस्त 2025 में, मुख्य चुनाव आयुक्त ज्ञानेश कुमार ने कहा कि मशीन-रीडेबल फाइलें प्रभावी रूप से “प्रतिबंधित” हैं क्योंकि वे “एडिट की जा सकती हैं”, जिससे दुरुपयोग का रास्ता खुल जाता है। इस तर्क की व्यापक रूप से आलोचना की गई है और इसे तकनीकी रूप से गलत बताया गया है। डाउनलोड की गई डेटासेट को एडिट करने से मूल रिकॉर्ड में कोई बदलाव नहीं होता, जो आयोग द्वारा रखे जाते हैं। आधिकारिक सूचियों की अखंडता सार्वजनिक रूप से साझा किए गए फॉर्मेट पर निर्भर नहीं है।


