
এটা ভবানীপুর কেন্দ্রে তথাকথিত নির্বাচন কমিশনের অবিশ্বাস্য অনাচারের গল্প। এবং একই সঙ্গে সেই অনাচার খুঁড়ে বার করার অভিযানেরও গল্প। গল্পের শেষে অনুসন্ধানের ফলাফলও থাকবে, কিন্তু তার আগে পুরোটা পড়বেন, কারণ যে পাহাড়গুলো আমাদের ডিঙোতে হয়েছে, সেই পাহাড়গুলো আকাশ থেকে পড়েনি, ইচ্ছে করে তৈরি করা হয়েছে, যাতে টপকানো না যায়। সেটা প্রতিটি মানুষের জানা দরকার।
ভবানীপুর এবং আরও কয়েকটা কেন্দ্র নিয়ে আমরা কাজ শুরু করেছিলাম অনেকদিন আগে। অল্ট নিউজ এবং সবর ইনস্টিটিউট এই কেন্দ্র নিয়ে তাদের প্রাথমিক অনুসন্ধান ইতিমধ্যেই পেশ করেছে। আমাদের প্রাথমিক অনুসন্ধানও তাদের সঙ্গে মেলে। তার পরেও কেন আলাদা করে প্রকাশ করছি, এবং কেন এত দেরি হল, তার উত্তরও এই লেখাতেই পাবেন। উত্তর একটাই, আমরা শুধু প্রাথমিক অনুসন্ধান নয়, কাজটা সম্পূর্ণ নিখুঁত ভাবে করতে চেয়েছিলাম। এখন মোটামুটি ৯৯% নিখুঁতভাবে শেষ হয়েছে এই কাজ। এবং সেই কারণেই অল্ট নিউজ বা সবরের থেকে এর ফলাফল খানিকটা আলাদা। বিপদ ওঁরা বা আমাদের প্রাথমিক অনুসন্ধান যা আঁচ করেছিল, তার চেয়েও বেশি, লেখাটা পড়লেই বুঝতে পারবেন। কিন্তু তার আগে আমাদের পাহাড় ডিঙোনোর যাত্রাপথের গল্প।
প্রথম পাহাড়
সবাই জানেন, যে সারা দেশে কোথাও সিএসভি ফরম্যাটে মেশিন রিডেবল ভোটার-তালিকা দেওয়া হচ্ছেনা। দেওয়া হচ্ছে পিডিএফ, এবং তাও বুথ ভিত্তিক। কেন, তার কোনো ব্যাখ্যা নেই। এই পাহাড়টার কথা আমাদের জানাই ছিল। কিন্তু যেটা জানা ছিলনা, সেটা হল পিডিএফ নামানোই একটা পাহাড়। সারা পশ্চিমবঙ্গ এবং ভবানীপুরের সব পিডিএফ নামিয়ে নেব ঠিক করেছিলাম, নির্বাচন কমিশনের সরকারি ওয়েবসাইট ব্যবহার করে। আশা ছিল এক ক্লিকেই সব ডাউনলোড হবে। কিন্তু অজ্ঞাত কারণে দেখা গেল, একবারে মাত্র ১০টির বেশি ফাইল নামানো যায়না না। এমনকি প্রতিবার নতুন ক্যাপচা টাইপ করতে হয়। শুধু তাই নয়, আমাদের আন্দাজ, ওয়েবসাইটের ভেতরে এমন কিছু লুকানো কোড আছে যা নজর রাখে কেউ বেশি ফাইল ডাউনলোড করছে কি না। সেই কোডটি গোপনে ব্রাউজারকে ব্লক করে দেয় এবং ক্র্যাশ করিয়ে দেয়। অন্তত তিনটি উইন্ডোজ পিসি (ক্রোম এবং এজ ব্রাউজার চলাকালীন) এমনভাবে ক্র্যাশ করে যে নতুন করে উইন্ডোজ ইনস্টল করতে হয়েছিল। প্রোফাইল বদলানো বা ব্রাউজার ডেটা এডিট করেও কোনো কাজ হয়নি। তার পরেও আমরা পিডিএফ নামাই। কী করে আর লিখলাম না, বলে দিলে সেই রাস্তাও হয়তো বন্ধ করে দেওয়া হবে।
দ্বিতীয় পাহাড়
পিডিএফ তো নামানো হল। কিন্তু দেখা গেল, সেগুলোর অবস্থা মোটেই সুবিধের নয়। সরাসরি স্ক্যান করে টেক্সট-ফাইলে রূপান্তর করা তো একেবারেই অসম্ভব। ভোটার তথ্যগুলো চৌকো চৌকো বাক্সের ভেতর সাজানো ছিল, যেখানে একেকজন ভোটারের জন্য কয়েক লাইনের তথ্য। সোজা লাইন, কোথাও ছিলনা। এরও কোনো কারণ নেই। তাই আমাদের এমন একটি ওসিআর (OCR) টুল ব্যবহার করতে হয়েছে যা প্রতিটি পিডিএফ-কে ওই ছোট ছোট ব্লকে টুকরো করবে এবং তথ্যগুলোকে টেক্সটে টুকরো করবে। ২-৩ লক্ষ এন্ট্রির জন্য মানুষের পক্ষে এই কাজ করা অসম্ভব, তাই একটি প্রোগ্রামের প্রয়োজন ছিল। সেই প্রোগ্রামটা আমাদের ধরে বসে লিখতে হয়েছে, অনেকবার চেষ্টার পর জিনিসটায় সাফল্য আসে। এই কুস্তির কোনো কারণ ছিলনা, কিন্তু নির্বাচন কমিশন, ইচ্ছে করেই ফরম্যাটটা এমন বানিয়েছে, যাতে কাজটা কঠিন হয়।
তৃতীয় পাহাড়
ওসিআর করা হল আর সব মিটে গেল এমন না। অক্ষরগুলো দেখ গেল এমন করে সাজানো, যাতে প্রোগ্রাম চট করে চিনতে না পারে। রেজোলিউশন এবং ওসিআর সেটিংস নিয়ে অনেক নাড়াচাড়া করার পরেও দেখ গেল এলোমেলোভাবে ভুল স্ক্যান আসছিল, অদ্ভুত সব চিহ্ন চলে আসছিল, অথবা অক্ষর ও সংখ্যা বাদ যাচ্ছিল। ভোটার কার্ড নম্বর (EPIC), নাম, সম্পর্কের নাম, বয়স ইত্যাদি অন্তত ৯৫% নির্ভুলতায় আনার জন্য আমাদের একটি 'হিউরিস্টিক প্যাটার্ন ম্যাচিং', সংশোধন এবং প্রেডিকশন অ্যালগরিদম তৈরি করতে হয়েছিল।
চতুর্থ পাহাড়
শুধু ভবানীপুর না, সারা পশ্চিমবঙ্গের প্রাথমিক খসড় ভোটার তালিকা আমরা এইভাবে স্ক্যান করে ফেলি। তার ফলাফলও প্রকাশ করি। অন্য কেউ পড়ুক বা না পড়ুক, আমাদের আন্দাজ, নির্বাচন কমিশন ঠিকই পড়েছিল সেসব, এবং তারা অ্যাডজুডিকেশন তালিকা প্রকাশ করার সময় এবার নতুন একটা চাল চালল। নতুন তালিকায় এল নামের উপর অ্যাডজুডিকেশন এবং ডিলিট স্ট্যাম্প। এই স্ট্যাম্পগুলো নামের ওপর এমনভাবে পড়েছিল যে আসল নাম বোঝাই যাচ্ছিল না। চোখেই অনেক সময় বোঝা যাচ্ছিলনা, প্রোগ্রাম পড়বে কীকরে। অনেক প্রচেষ্টার পরেও প্রচুর নাম একেবারে অস্পষ্ট বা 'গার্বেজ' হিসেবে আসছিল। এর উপরেই আমাদের প্রাথমিক অনুসন্ধান হয়, তবে সেটা নিখুঁত হবার ধারেকাছেও ছিলনা। আড়াল থেকে নিশ্চয়ই কমিশন হাসছিল। তালিকা থেকে যদি নামই বার না করতে পারি, পরবর্তী বিশ্লেষণ হবে কীকরে?
তবে বেহুলার এই বাসরঘরেও ছিদ্র ছিল। কপালজোরে এপিক (EPIC) নম্বরগুলো অক্ষত ছিল। ওটার উপর স্ট্যাম্প মারার কথা কমিশন ভাবেনি। এইটা কাজে লাগিয়ে আমাদের যে কায়দাটা করতে হয়, তা একটু টেকনিকাল, কিন্তু বলা দরকার। কাজটার দুটো ধাপঃ
১। সংক্ষেপে বলতে গেলে—প্রথমে পিডিএফ গুলোতে কালার সেপারেশন করতে হয়েছে, ব্যাকগ্রাউন্ডের সব পিক্সেল মুছতে হয়েছে এবং একটি কোনাকুনি স্ট্যাম্প চিহ্নিত করতে হয়েছে। এরপর সেটিকে বারবার ঘুরিয়ে (Rotate) এমন একটি কোণে আনতে হয়েছে যাতে ওসিআর সেটি পড়তে পারে। কাজটা কঠিন, কিন্তু শেষ পর্যন্ত করতে পারা গেছে। ভবানীপুরের জন্য আমরা প্রায় ১৪,৩৭০টি অ্যাডজুডিকেশন রেকর্ড করেছি, যা দেশের অন্যান্য গবেষকদের তথ্যের সাথে মিলে যায়।
২। এতেও সব নাম নিখুঁতভাবে পড়া যাচ্ছিল, তা নয়।। কিন্তু আগেই বললাম, এপিক নম্বর গুলো অক্ষত ছিল। সেটা থেকে নামগুলো খুঁজে বার করার দরকার। এর জন্য আমরা সাহায্য নিলাম খসড়া তালিকার। পুরো খসড়া তালিকার পিডিএফ নামিয়ে আমাদের সিএসভি বানাতে হল। আমাদের প্রোগ্রাম অ্যাডজুডিকেশন তালিকা থেকে পড়ল এপিক। সেই এপিককে মিলিয়ে দেখল খসড়া-তালিকার সঙ্গে। তারপর মিলে যাওয়া এপিক দিয়ে খসড়া তালিকা থেকে বার করল নাম। এইভাবে চতুর্থ পাহাড়টা আমরা ডিঙোতে পারলাম, কয়েকদিন আগে।
পঞ্চম পাহাড়।
এ তো শুধু নামের তালিকা বার করা। কিন্তু আমাদের মূল উদ্দেশ্য ছিল ডেমোগ্রাফিক বিশ্লেষণ, যা থেকে বোঝা যায়, পুরো এসআইআর প্রক্রিয়ায় কোনো পক্ষপাত আছে কিনা। যেহেতু, তালিকায় শুধু নাম আছে, ধর্ম বা ভাষা নেই, ফলে কোনো প্রোগ্রামের পক্ষে নাম পড়ে এই বিশ্লেষণ করা সম্ভব না। আমরা প্রাথমিক ভাবে হিন্দু-মুসলিম জনসংখ্যার বিশ্লেষণই করব ঠিক করেছিলাম। এটা হয়ে দাঁড়াল বিরাট চ্যালেঞ্জ। অ-মুসলিম নাম যেহেতু অগণিত, তাই আমরা পরিচিত সকল মুসলিম নামের একটি লাইব্রেরি তৈরির চেষ্টা করলাম। এর জন্য আমরা জেমিনি (Gemini), চ্যাটজিপিটি (ChatGPT) এবং পশ্চিমবঙ্গ ও মুসলিম নাম সম্পর্কে অভিজ্ঞ সমাজকর্মীদের সাহায্য নিলাম। কিন্তু এটিও সম্পূর্ণ ছিল না। তাই আমরা ৪-৫টি নির্বাচনী এলাকার সিএসভি ফাইল ম্যানুয়ালি স্ক্যান করে সব মুসলিম নাম সংগ্রহ করে একটি পূর্ণাঙ্গ তালিকা তৈরি করলাম। তবে সমস্যা সেখানেই শেষ হয়নি। এমন অনেক নাম আছে যা মুসলিম এবং অ-মুসলিম ভারতীয়দের মধ্যে সাধারণ (Common), যেমন—সাহিল, পারভীন ইত্যাদি। আমাদের লিস্ট ব্যবহার করেও আমরা দ্বিধায় পড়ছিলাম যে কোন নামটিকে কোন শ্রেণিতে রাখব। এর একমাত্র সমাধান ছিল ডেটার ভেতরেই তথ্য খোঁজা। সেখানে নাম, পদবি এবং সাথে 'রিলেশন নেম' (পিতা/স্বামীর নাম) ও পদবি ছিল। আমরা এই সব তথ্য একত্রিত করলাম এবং একটি 'ডুয়াল নেম' লাইব্রেরি তৈরি করলাম। যদি কোনো নামে এমন শব্দ পাওয়া যায় যা উভয় সম্প্রদায়ের হতে পারে, তখন আমরা সেই ব্যক্তির নামের অন্যান্য অংশ এবং সম্পর্কের নাম ও পদবি মিলিয়ে দেখি। এই অ্যালগরিদমটি এখন ভবানীপুরের মতো এলাকায় ৯৯%-এর বেশি নির্ভুল ফলাফল দিচ্ছে।
এই হল আমাদের পাহাড় ডিঙোনোর যাত্রাপথ। যাত্রার শেষে আমরা কী পেলাম? সেই বিশ্লেষণ নিচে দেওয়া হলঃ
আমাদের ফলাফলের সঙ্গে অল্ট নিউজ ও সবর ইনস্টিটিউটের ফলাফল মোটের উপর একমত হলেও কিছু উল্লেখযোগ্য পার্থক্য আছে, যদিও, তিনটি বিশ্লেষণের মূল বার্তা মোটের উপর একই দিকে ইঙ্গিত করে, এবং, সেটি এই যে, বিচারাধীন তালিকায় মুসলিম ভোটারদের অনুপাত তাদের মোট জনসংখ্যার মুসলিম ভিত্তির তুলনায় অস্বাভাবিক রকম বেশি। এই তফাতের কারণ পদ্ধতিগত। শুধু স্ক্যানিং বা ওসিআরের টেকনোলজি নয়, নামভিত্তিক শ্রেণিবিভাগের পদ্ধতিতেও তিন দলের মধ্যে কিছু মূলগত পার্থক্য আছে। অল্ট নিউজ়ের প্রতিবেদন অনুযায়ী ওঁরা এআই-ভিত্তিক শ্রেণিবিভাগ ব্যবহার করেছেন, যেখানে প্রথম নাম ও পদবি একসঙ্গে বিশ্লেষণ করা হয়েছে, এর সম্ভাব্য কারণ বাংলায় হিন্দু প্রথম নামের সঙ্গে মুসলিম পদবি বা উল্টোটা থাকা অস্বাভাবিক নয়। ওঁদের রিপোর্ট করা কনফিডেন্স স্কোর অনুযায়ী, গোটা অ্যাডজুডিকেটেড তালিকা দেখলে তার ৯৩.৯% “হাই-কনফিডেন্স”, এবং শুধু মুসলিম সাবসেটের ক্ষেত্রে সেটা ৯৭.৩%। আমাদের পদ্ধতির সাথে অল্ট-নিউজ়ের মূল পার্থক্য দুটি, এক, আমাদের শ্রেণিবিভাগের পদ্ধতিতে এ-আই টুলস ব্যবহার করা হয়নি - যেটা অবশ্য এই প্রতিবেদনের প্রথম অংশ পড়লেই পরিষ্কার হয়ে যায়। এ-আই টুলস সর্বগ্রাসী এবং জনপ্রিয় এ নিয়ে সন্দেহ নেই, কিন্তু এ-আই ঠিক কী উপায়ে কাকে কোন শ্রেণিভুক্ত করেছে সেই অ্যালগোরিদম স্বচ্ছ হয় না, যাকে বলে “ব্ল্যাক-বক্স” বা “ক্লোজ়ড বক্স”, নিজের ইচ্ছেমতন রদবদল করা অসাধ্য না হলেও দুঃসাধ্য, এবং, সে কোথাও ভুল করলেও কেন ভুল বোঝার উপায় নেই, কারণ এ-আই ব্যাখ্যাতীত, এক্সপ্লেইনেবল নয়। আমাদের পদ্ধতি নিতান্ত গায়ে-গতরে খেটে, তালিকার পর তালিকা ধরে দুইদিকের ভ্রান্তি বারংবার ঠিক করে, একাধিক মানুষের অমানুষিক শ্রমের ফসল, এবং, এই পদ্ধতি “ওপেন বক্স”। আর, দুই, এটি অপেক্ষাকৃত ছোটো তফাত, দ্ব্যর্থক নামের ক্ষেত্রে আমরা শুধু সেই নামের উপর নির্ভর না করে ভোটার তালিকার মধ্যে থাকা সেই ব্যক্তির আত্মীয় বা সম্পর্কের নাম ও পদবিও একসঙ্গে বিবেচনা করেছি।
ফলাফল মোটের উপর এই - আমাদের বিশ্লেষণে ১৪,৩৭৪টি এন্ট্রির মধ্যে ৮,০১৯ জন মুসলিম, অর্থাৎ ৫৫.৭৯%। আর, অল্ট নিউজ ভবানীপুরের অ্যাডজুডিকেশন তালিকায় ১৫,৬১৮টি এন্ট্রি পেয়েছে এবং তাদের মধ্যে মুসলিম ভোটারের সংখ্যা - ৮,০৮৩, অর্থাৎ অনুপাত ৫১.৮%।
মুসলিম ভোটার ভিত্তির পরিমাপ-ও কিছু আলাদা। আমাদের বিশ্লেষণে মোট ১,৬৩,০৩২ মোট রেকর্ডের মধ্যে ৩৮,৫১০ জন মুসলিম - ২৩.৬২%। অল্ট নিউজ়ের ক্ষেত্রে ১,৬১,০৮৩-জন ভোটারের মধ্যে ৩৫,২১৬ জন মুসলিম - ২১.৯%। আর, সবর ইনস্টিটিউটের রিপোর্টে পাচ্ছি, বিচারাধীনদের মধ্যে মুসলিম শতাংশ ৫৬.৬৫%, আর শেষ সেন্সাস অনুযায়ী মুসলিম ভোটার-ভিত্তি ২০%।
সব মিলিয়ে চিত্রটা এই, যে, মুসলমান ভোটাররা মোট ভোটারের মাত্র ২৩.৬২% হলেও, বিচারাধীন তালিকায় মুসলমানের অংশ ৫৫.৭৯% । এটা পদ্ধতিগত একটা পক্ষপাতকে সূচিত করে বলে মনে করা যায়। এবং ৫৫.৭৯% সংখ্যাটা রক্ষণশীল হিসেবে। বহু নামকে নিখুঁতভাবে মুসলমান নাম হিসেবে চিহ্নিত না করা গেলে আমরা সেগুলোকে হিন্দু নাম ধরে নিয়েছি। ফলে সংখ্যাটা আরও কিছুটা বাড়া উচিত। প্রসঙ্গত অল্ট নিউজের প্রতিবেদনে এই শতাংশটা ৫১.৮% । আমাদেরও প্রাথমিক অনুসন্ধানে এইরকমই এসেছিল। পুঙ্খানুপুঙ্খ বিশ্লেষণের পর দেখা গেল শতাংশের বৃদ্ধি হয়েছে ৪%। এই জন্যই, লেখার শুরুতেই বলা হয়েছিল, প্রাথমিক অনুসন্ধানে বিপদটা ঠিকই চিহ্নিত করা গিয়েছিল, কিন্তু যা আন্দাজ করা গিয়েছিল, বিপদটা তার চেয়েও বেশি।

আমরা নাগরিকদের ব্যক্তিগত তথ্য উন্মোচন করার ঝুঁকি নিতে চাই না, তাই পাবলিক ফোরামে নাম, বুথ নম্বর, এপিক নম্বর, বয়স, আত্মীয়-সম্পর্ক অথবা ধর্মের শ্রেণিবিভাগ সংক্রান্ত কোনো তথ্য প্রকাশ না করার সিদ্ধান্ত নিয়েছি।
তবুও কারও কৌতূহল থাকলে, অথবা আমাদের পদ্ধতি সম্পর্কে একাডেমিক আগ্রহ থাকলে, এই ইমেলে যোগাযোগ করুনঃ bgkvoter2026@gmail.com। আমাদের এই যাত্রাপথ অত্যন্ত কঠিন ছিল, কিন্তু শেষ পর্যন্ত আমরা সফল হয়েছি বলেই আমাদের ধারণা। আমাদের জনবল-অর্থবল সবই সীমিত, তাই, কোথাও কোনো খুঁত পেলে বা এই কাজে আমাদের সাহায্য করতে চাইলে জানাতে দ্বিধাবোধ করবেন না।