
এটা ভবানীপুর কেন্দ্রে তথাকথিত নির্বাচন কমিশনের অবিশ্বাস্য অনাচারের গল্প। এবং একই সঙ্গে সেই অনাচার খুঁড়ে বার করার অভিযানেরও গল্প। গল্পের শেষে অনুসন্ধানের ফলাফলও থাকবে, কিন্তু তার আগে পুরোটা পড়বেন, কারণ যে পাহাড়গুলো আমাদের ডিঙোতে হয়েছে, সেই পাহাড়গুলো আকাশ থেকে পড়েনি, ইচ্ছে করে তৈরি করা হয়েছে, যাতে টপকানো না যায়। সেটা প্রতিটি মানুষের জানা দরকার।
ভবানীপুর এবং আরও কয়েকটা কেন্দ্র নিয়ে আমরা কাজ শুরু করেছিলাম অনেকদিন আগে। অল্ট নিউজ এবং সবর ইনস্টিটিউট এই কেন্দ্র নিয়ে তাদের প্রাথমিক অনুসন্ধান ইতিমধ্যেই পেশ করেছে। আমাদের প্রাথমিক অনুসন্ধানও তাদের সঙ্গে মেলে। তার পরেও কেন আলাদা করে প্রকাশ করছি, এবং কেন এত দেরি হল, তার উত্তরও এই লেখাতেই পাবেন। উত্তর একটাই, আমরা শুধু প্রাথমিক অনুসন্ধান নয়, কাজটা সম্পূর্ণ নিখুঁত ভাবে করতে চেয়েছিলাম। এখন মোটামুটি ৯৯% নিখুঁতভাবে শেষ হয়েছে এই কাজ। এবং সেই কারণেই অল্ট নিউজ বা সবরের থেকে এর ফলাফল খানিকটা আলাদা। বিপদ ওঁরা বা আমাদের প্রাথমিক অনুসন্ধান যা আঁচ করেছিল, তার চেয়েও বেশি, লেখাটা পড়লেই বুঝতে পারবেন। কিন্তু তার আগে আমাদের পাহাড় ডিঙোনোর যাত্রাপথের গল্প।
প্রথম পাহাড়
সবাই জানেন, যে সারা দেশে কোথাও সিএসভি ফরম্যাটে মেশিন রিডেবল ভোটার-তালিকা দেওয়া হচ্ছেনা। দেওয়া হচ্ছে পিডিএফ, এবং তাও বুথ ভিত্তিক। কেন, তার কোনো ব্যাখ্যা নেই। এই পাহাড়টার কথা আমাদের জানাই ছিল। কিন্তু যেটা জানা ছিলনা, সেটা হল পিডিএফ নামানোই একটা পাহাড়। সারা পশ্চিমবঙ্গ এবং ভবানীপুরের সব পিডিএফ নামিয়ে নেব ঠিক করেছিলাম, নির্বাচন কমিশনের সরকারি ওয়েবসাইট ব্যবহার করে। আশা ছিল এক ক্লিকেই সব ডাউনলোড হবে। কিন্তু অজ্ঞাত কারণে দেখা গেল, একবারে মাত্র ১০টির বেশি ফাইল নামানো যায়না না। এমনকি প্রতিবার নতুন ক্যাপচা টাইপ করতে হয়। শুধু তাই নয়, আমাদের আন্দাজ, ওয়েবসাইটের ভেতরে এমন কিছু লুকানো কোড আছে যা নজর রাখে কেউ বেশি ফাইল ডাউনলোড করছে কি না। সেই কোডটি গোপনে ব্রাউজারকে ব্লক করে দেয় এবং ক্র্যাশ করিয়ে দেয়। অন্তত তিনটি উইন্ডোজ পিসি (ক্রোম এবং এজ ব্রাউজার চলাকালীন) এমনভাবে ক্র্যাশ করে যে নতুন করে উইন্ডোজ ইনস্টল করতে হয়েছিল। প্রোফাইল বদলানো বা ব্রাউজার ডেটা এডিট করেও কোনো কাজ হয়নি। তার পরেও আমরা পিডিএফ নামাই। কী করে আর লিখলাম না, বলে দিলে সেই রাস্তাও হয়তো বন্ধ করে দেওয়া হবে।
দ্বিতীয় পাহাড়
পিডিএফ তো নামানো হল। কিন্তু দেখা গেল, সেগুলোর অবস্থা মোটেই সুবিধের নয়। সরাসরি স্ক্যান করে টেক্সট-ফাইলে রূপান্তর করা তো একেবারেই অসম্ভব। ভোটার তথ্যগুলো চৌকো চৌকো বাক্সের ভেতর সাজানো ছিল, যেখানে একেকজন ভোটারের জন্য কয়েক লাইনের তথ্য। সোজা লাইন, কোথাও ছিলনা। এরও কোনো কারণ নেই। তাই আমাদের এমন একটি ওসিআর (OCR) টুল ব্যবহার করতে হয়েছে যা প্রতিটি পিডিএফ-কে ওই ছোট ছোট ব্লকে টুকরো করবে এবং তথ্যগুলোকে টেক্সটে টুকরো করবে। ২-৩ লক্ষ এন্ট্রির জন্য মানুষের পক্ষে এই কাজ করা অসম্ভব, তাই একটি প্রোগ্রামের প্রয়োজন ছিল। সেই প্রোগ্রামটা আমাদের ধরে বসে লিখতে হয়েছে, অনেকবার চেষ্টার পর জিনিসটায় সাফল্য আসে। এই কুস্তির কোনো কারণ ছিলনা, কিন্তু নির্বাচন কমিশন, ইচ্ছে করেই ফরম্যাটটা এমন বানিয়েছে, যাতে কাজটা কঠিন হয়।
তৃতীয় পাহাড়
ওসিআর করা হল আর সব মিটে গেল এমন না। অক্ষরগুলো দেখ গেল এমন করে সাজানো, যাতে প্রোগ্রাম চট করে চিনতে না পারে। রেজোলিউশন এবং ওসিআর সেটিংস নিয়ে অনেক নাড়াচাড়া করার পরেও দেখ গেল এলোমেলোভাবে ভুল স্ক্যান আসছিল, অদ্ভুত সব চিহ্ন চলে আসছিল, অথবা অক্ষর ও সংখ্যা বাদ যাচ্ছিল। ভোটার কার্ড নম্বর (EPIC), নাম, সম্পর্কের নাম, বয়স ইত্যাদি অন্তত ৯৫% নির্ভুলতায় আনার জন্য আমাদের একটি 'হিউরিস্টিক প্যাটার্ন ম্যাচিং', সংশোধন এবং প্রেডিকশন অ্যালগরিদম তৈরি করতে হয়েছিল।
চতুর্থ পাহাড়
শুধু ভবানীপুর না, সারা পশ্চিমবঙ্গের প্রাথমিক খসড় ভোটার তালিকা আমরা এইভাবে স্ক্যান করে ফেলি। তার ফলাফলও প্রকাশ করি। অন্য কেউ পড়ুক বা না পড়ুক, আমাদের আন্দাজ, নির্বাচন কমিশন ঠিকই পড়েছিল সেসব, এবং তারা অ্যাডজুডিকেশন তালিকা প্রকাশ করার সময় এবার নতুন একটা চাল চালল। নতুন তালিকায় এল নামের উপর অ্যাডজুডিকেশন এবং ডিলিট স্ট্যাম্প। এই স্ট্যাম্পগুলো নামের ওপর এমনভাবে পড়েছিল যে আসল নাম বোঝাই যাচ্ছিল না। চোখেই অনেক সময় বোঝা যাচ্ছিলনা, প্রোগ্রাম পড়বে কীকরে। অনেক প্রচেষ্টার পরেও প্রচুর নাম একেবারে অস্পষ্ট বা 'গার্বেজ' হিসেবে আসছিল। এর উপরেই আমাদের প্রাথমিক অনুসন্ধান হয়, তবে সেটা নিখুঁত হবার ধারেকাছেও ছিলনা। আড়াল থেকে নিশ্চয়ই কমিশন হাসছিল। তালিকা থেকে যদি নামই বার না করতে পারি, পরবর্তী বিশ্লেষণ হবে কীকরে?
তবে বেহুলার এই বাসরঘরেও ছিদ্র ছিল। কপালজোরে এপিক (EPIC) নম্বরগুলো অক্ষত ছিল। ওটার উপর স্ট্যাম্প মারার কথা কমিশন ভাবেনি। এইটা কাজে লাগিয়ে আমাদের যে কায়দাটা করতে হয়, তা একটু টেকনিকাল, কিন্তু বলা দরকার। কাজটার দুটো ধাপঃ
১। সংক্ষেপে বলতে গেলে—প্রথমে পিডিএফ গুলোতে কালার সেপারেশন করতে হয়েছে, ব্যাকগ্রাউন্ডের সব পিক্সেল মুছতে হয়েছে এবং একটি কোনাকুনি স্ট্যাম্প চিহ্নিত করতে হয়েছে। এরপর সেটিকে বারবার ঘুরিয়ে (Rotate) এমন একটি কোণে আনতে হয়েছে যাতে ওসিআর সেটি পড়তে পারে। কাজটা কঠিন, কিন্তু শেষ পর্যন্ত করতে পারা গেছে। ভবানীপুরের জন্য আমরা প্রায় ১৪,৩৭০টি অ্যাডজুডিকেশন রেকর্ড করেছি, যা দেশের অন্যান্য গবেষকদের তথ্যের সাথে মিলে যায়।
২। এতেও সব নাম নিখুঁতভাবে পড়া যাচ্ছিল, তা নয়।। কিন্তু আগেই বললাম, এপিক নম্বর গুলো অক্ষত ছিল। সেটা থেকে নামগুলো খুঁজে বার করার দরকার। এর জন্য আমরা সাহায্য নিলাম খসড়া তালিকার। পুরো খসড়া তালিকার পিডিএফ নামিয়ে আমাদের সিএসভি বানাতে হল। আমাদের প্রোগ্রাম অ্যাডজুডিকেশন তালিকা থেকে পড়ল এপিক। সেই এপিককে মিলিয়ে দেখল খসড়া-তালিকার সঙ্গে। তারপর মিলে যাওয়া এপিক দিয়ে খসড়া তালিকা থেকে বার করল নাম। এইভাবে চতুর্থ পাহাড়টা আমরা ডিঙোতে পারলাম, কয়েকদিন আগে।
পঞ্চম পাহাড়।
এ তো শুধু নামের তালিকা বার করা। কিন্তু আমাদের মূল উদ্দেশ্য ছিল ডেমোগ্রাফিক বিশ্লেষণ, যা থেকে বোঝা যায়, পুরো এসআইআর প্রক্রিয়ায় কোনো পক্ষপাত আছে কিনা। যেহেতু, তালিকায় শুধু নাম আছে, ধর্ম বা ভাষা নেই, ফলে কোনো প্রোগ্রামের পক্ষে নাম পড়ে এই বিশ্লেষণ করা সম্ভব না। আমরা প্রাথমিক ভাবে হিন্দু-মুসলিম জনসংখ্যার বিশ্লেষণই করব ঠিক করেছিলাম। এটা হয়ে দাঁড়াল বিরাট চ্যালেঞ্জ। অ-মুসলিম নাম যেহেতু অগণিত, তাই আমরা পরিচিত সকল মুসলিম নামের একটি লাইব্রেরি তৈরির চেষ্টা করলাম। এর জন্য আমরা জেমিনি (Gemini), চ্যাটজিপিটি (ChatGPT) এবং পশ্চিমবঙ্গ ও মুসলিম নাম সম্পর্কে অভিজ্ঞ সমাজকর্মীদের সাহায্য নিলাম। কিন্তু এটিও সম্পূর্ণ ছিল না। তাই আমরা ৪-৫টি নির্বাচনী এলাকার সিএসভি ফাইল ম্যানুয়ালি স্ক্যান করে সব মুসলিম নাম সংগ্রহ করে একটি পূর্ণাঙ্গ তালিকা তৈরি করলাম। তবে সমস্যা সেখানেই শেষ হয়নি। এমন অনেক নাম আছে যা মুসলিম এবং অ-মুসলিম ভারতীয়দের মধ্যে সাধারণ (Common), যেমন—সাহিল, পারভীন ইত্যাদি। আমাদের লিস্ট ব্যবহার করেও আমরা দ্বিধায় পড়ছিলাম যে কোন নামটিকে কোন শ্রেণিতে রাখব। এর একমাত্র সমাধান ছিল ডেটার ভেতরেই তথ্য খোঁজা। সেখানে নাম, পদবি এবং সাথে 'রিলেশন নেম' (পিতা/স্বামীর নাম) ও পদবি ছিল। আমরা এই সব তথ্য একত্রিত করলাম এবং একটি 'ডুয়াল নেম' লাইব্রেরি তৈরি করলাম। যদি কোনো নামে এমন শব্দ পাওয়া যায় যা উভয় সম্প্রদায়ের হতে পারে, তখন আমরা সেই ব্যক্তির নামের অন্যান্য অংশ এবং সম্পর্কের নাম ও পদবি মিলিয়ে দেখি। এই অ্যালগরিদমটি এখন ভবানীপুরের মতো এলাকায় ৯৯%-এর বেশি নির্ভুল ফলাফল দিচ্ছে।
এই হল আমাদের পাহাড় ডিঙোনোর যাত্রাপথ। যাত্রার শেষে আমরা কী পেলাম? সেই বিশ্লেষণ নিচে দেওয়া হলঃ
আমাদের ফলাফলের সঙ্গে অল্ট নিউজ ও সবর ইনস্টিটিউটের ফলাফল মোটের উপর একমত হলেও কিছু উল্লেখযোগ্য পার্থক্য আছে, যদিও, তিনটি বিশ্লেষণের মূল বার্তা মোটের উপর একই দিকে ইঙ্গিত করে, এবং, সেটি এই যে, বিচারাধীন তালিকায় মুসলিম ভোটারদের অনুপাত তাদের মোট জনসংখ্যার মুসলিম ভিত্তির তুলনায় অস্বাভাবিক রকম বেশি। এই তফাতের কারণ পদ্ধতিগত। শুধু স্ক্যানিং বা ওসিআরের টেকনোলজি নয়, নামভিত্তিক শ্রেণিবিভাগের পদ্ধতিতেও তিন দলের মধ্যে কিছু মূলগত পার্থক্য আছে। অল্ট নিউজ়ের প্রতিবেদন অনুযায়ী ওঁরা এআই-ভিত্তিক শ্রেণিবিভাগ ব্যবহার করেছেন, যেখানে প্রথম নাম ও পদবি একসঙ্গে বিশ্লেষণ করা হয়েছে, এর সম্ভাব্য কারণ বাংলায় হিন্দু প্রথম নামের সঙ্গে মুসলিম পদবি বা উল্টোটা থাকা অস্বাভাবিক নয়। ওঁদের রিপোর্ট করা কনফিডেন্স স্কোর অনুযায়ী, গোটা অ্যাডজুডিকেটেড তালিকা দেখলে তার ৯৩.৯% “হাই-কনফিডেন্স”, এবং শুধু মুসলিম সাবসেটের ক্ষেত্রে সেটা ৯৭.৩%। আমাদের পদ্ধতির সাথে অল্ট-নিউজ়ের মূল পার্থক্য দুটি, এক, আমাদের শ্রেণিবিভাগের পদ্ধতিতে এ-আই টুলস ব্যবহার করা হয়নি - যেটা অবশ্য এই প্রতিবেদনের প্রথম অংশ পড়লেই পরিষ্কার হয়ে যায়। এ-আই টুলস সর্বগ্রাসী এবং জনপ্রিয় এ নিয়ে সন্দেহ নেই, কিন্তু এ-আই ঠিক কী উপায়ে কাকে কোন শ্রেণিভুক্ত করেছে সেই অ্যালগোরিদম স্বচ্ছ হয় না, যাকে বলে “ব্ল্যাক-বক্স” বা “ক্লোজ়ড বক্স”, নিজের ইচ্ছেমতন রদবদল করা অসাধ্য না হলেও দুঃসাধ্য, এবং, সে কোথাও ভুল করলেও কেন ভুল বোঝার উপায় নেই, কারণ এ-আই ব্যাখ্যাতীত, এক্সপ্লেইনেবল নয়। আমাদের পদ্ধতি নিতান্ত গায়ে-গতরে খেটে, তালিকার পর তালিকা ধরে দুইদিকের ভ্রান্তি বারংবার ঠিক করে, একাধিক মানুষের অমানুষিক শ্রমের ফসল, এবং, এই পদ্ধতি “ওপেন বক্স”। আর, দুই, এটি অপেক্ষাকৃত ছোটো তফাত, দ্ব্যর্থক নামের ক্ষেত্রে আমরা শুধু সেই নামের উপর নির্ভর না করে ভোটার তালিকার মধ্যে থাকা সেই ব্যক্তির আত্মীয় বা সম্পর্কের নাম ও পদবিও একসঙ্গে বিবেচনা করেছি।
ফলাফল মোটের উপর এই - আমাদের বিশ্লেষণে ১৪,৩৭৪টি এন্ট্রির মধ্যে ৮,০১৯ জন মুসলিম, অর্থাৎ ৫৫.৭৯%। আর, অল্ট নিউজ ভবানীপুরের অ্যাডজুডিকেশন তালিকায় ১৫,৬১৮টি এন্ট্রি পেয়েছে এবং তাদের মধ্যে মুসলিম ভোটারের সংখ্যা - ৮,০৮৩, অর্থাৎ অনুপাত ৫১.৮%।
মুসলিম ভোটার ভিত্তির পরিমাপ-ও কিছু আলাদা। আমাদের বিশ্লেষণে মোট ১,৬৩,০৩২ মোট রেকর্ডের মধ্যে ৩৮,৫১০ জন মুসলিম - ২৩.৬২%। অল্ট নিউজ়ের ক্ষেত্রে ১,৬১,০৮৩-জন ভোটারের মধ্যে ৩৫,২১৬ জন মুসলিম - ২১.৯%। আর, সবর ইনস্টিটিউটের রিপোর্টে পাচ্ছি, বিচারাধীনদের মধ্যে মুসলিম শতাংশ ৫৬.৬৫%, আর শেষ সেন্সাস অনুযায়ী মুসলিম ভোটার-ভিত্তি ২০%।
সব মিলিয়ে চিত্রটা এই, যে, মুসলমান ভোটাররা মোট ভোটারের মাত্র ২৩.৬২% হলেও, বিচারাধীন তালিকায় মুসলমানের অংশ ৫৫.৭৯%। এটা পদ্ধতিগত একটা পক্ষপাতকে সূচিত করে বলে মনে করা যায়। এবং ৫৫.৭৯% সংখ্যাটা রক্ষণশীল হিসেবে। বহু নামকে নিখুঁতভাবে মুসলমান নাম হিসেবে চিহ্নিত না করা গেলে আমরা সেগুলোকে হিন্দু নাম ধরে নিয়েছি। ফলে সংখ্যাটা আরও কিছুটা বাড়া উচিত। প্রসঙ্গত অল্ট নিউজের প্রতিবেদনে এই শতাংশটা ৫১.৮%। আমাদেরও প্রাথমিক অনুসন্ধানে এইরকমই এসেছিল। পুঙ্খানুপুঙ্খ বিশ্লেষণের পর দেখা গেল শতাংশের বৃদ্ধি হয়েছে ৪%। এই জন্যই, লেখার শুরুতেই বলা হয়েছিল, প্রাথমিক অনুসন্ধানে বিপদটা ঠিকই চিহ্নিত করা গিয়েছিল, কিন্তু যা আন্দাজ করা গিয়েছিল, বিপদটা তার চেয়েও বেশি।

আমরা নাগরিকদের ব্যক্তিগত তথ্য উন্মোচন করার ঝুঁকি নিতে চাই না, তাই পাবলিক ফোরামে নাম, বুথ নম্বর, এপিক নম্বর, বয়স, আত্মীয়-সম্পর্ক অথবা ধর্মের শ্রেণিবিভাগ সংক্রান্ত কোনো তথ্য প্রকাশ না করার সিদ্ধান্ত নিয়েছি।
তবুও কারও কৌতূহল থাকলে, অথবা আমাদের পদ্ধতি সম্পর্কে একাডেমিক আগ্রহ থাকলে, এই ইমেলে যোগাযোগ করুনঃ bgkvoter2026@gmail.com। আমাদের এই যাত্রাপথ অত্যন্ত কঠিন ছিল, কিন্তু শেষ পর্যন্ত আমরা সফল হয়েছি বলেই আমাদের ধারণা। আমাদের জনবল-অর্থবল সবই সীমিত, তাই, কোথাও কোনো খুঁত পেলে বা এই কাজে আমাদের সাহায্য করতে চাইলে জানাতে দ্বিধাবোধ করবেন না।
Debanjan Banerjee | 2401:*:*:*:*:*:*:* | ১১ এপ্রিল ২০২৬ ২২:৫১739858
Raju Paul | 2401:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ০৮:০০739863
হীরক সেনগুপ্ত | 2405:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ০৮:০৮739864
Sumanta Ghosh | 45.*.*.* | ১২ এপ্রিল ২০২৬ ০৮:০৯739865
সব্যসাচী | 49.*.*.* | ১২ এপ্রিল ২০২৬ ০৮:৩৪739866
পলাশ রায় | 117.*.*.* | ১২ এপ্রিল ২০২৬ ০৮:৪১739867
মোয়াল্লেম নাইয়া | | 2409:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ০৮:৪৩739868
সুজয় মজুমদার | 2401:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ০৮:৪৫739869
dc | 2402:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ১০:০৮739870
Arun Das | 2409:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ১০:৩১739872
উত্তান বন্দ্যোপাধ্যায় | 45.*.*.* | ১২ এপ্রিল ২০২৬ ১০:৫৭739875
dc | 2402:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ১১:১৬739876
বিপুল রায় | 115.*.*.* | ১২ এপ্রিল ২০২৬ ১১:২২739877
a | 14.*.*.* | ১২ এপ্রিল ২০২৬ ১৮:১২739891
অমিতাভ | 2405:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ২১:৩৫739897
অমিতাভ ঘোষ, সল্টলেক, বিধান নগর | 2401:*:*:*:*:*:*:* | ১২ এপ্রিল ২০২৬ ২১:৫৬739898
ki bipad | 2a09:*:*:*:*:*:*:* | ১৪ এপ্রিল ২০২৬ ১৩:১২739921
Animesh Tripathy | 2401:*:*:*:*:*:*:* | ১৪ এপ্রিল ২০২৬ ১৩:২৮739922
প্রশ্ন | 2401:*:*:*:*:*:*:* | ২৯ এপ্রিল ২০২৬ ০৭:২২740336
Jayanta Chatterjee | 2409:*:*:*:*:*:*:* | ২৯ এপ্রিল ২০২৬ ১০:৫৪740348