যে কারণে যান্ত্রিক তুরকীর প্রসঙ্গটি ঊঠল, ডিপ লার্নিং, ছবি, কম্পিউটারকে ছবি চেনানো, এবং সেই সূত্রে প্রচুর ছবির ও তাকে লেবেলিং এর কারণে ফাই ফাই লি আমাজনের শরণাপন্ন হয়েছিলেন। আমাজন কোমপানি নিজে অবশ্য নিজেদের ব্যবসার কারণে যান্ত্রিক তুর্কীর ব্যবসা খুলেছিল, এবং চটজলদি কিছু অর্থ উপার্জনের আশায় বহু মানুষ নিজে থেকে যেচে যান্ত্রিক তুরকী হয়েছিলেন সে আমলে।
কি বলতে চাইছি বোঝানোর জন্য একটি মামুলি উদাহরণই দিই না হয়।
মনে করুন আপনার কাছে একটা থারমোমিটার আছে, সে থারমোমিটারটিতে শুধু ফারেনহাইট স্কেলে তাপমান পড়তে পারা যায় অথচ আপনি সেলসিয়াস স্কেলে তাপমান মাপতে চান | আপনার থারমোমিটারটির তাপমান মেপে আপনি আপনার কমপিউটারে একটি ফাংশান লিখতে পারেন,
def fahr2celsius(x):
celsius = ((x - 32)/9 ) * 5
return celsius
থারমোমিটারে তাপমান দেখাচ্ছে ১০৪ ডিগ্রী, আপনি আপনার লেখার সৌজন্যে অঙ্ক কষে কমপিউটারে দেখলেন ৪০ ডিগ্রী সেলসিয়াস। এইরকম। এখন আপনি জিজ্ঞাসা করতে পারেন জানা গেল কি করে যে একস থেকে ৩২ বিয়োগ করে নয় দিয়ে ভাগ করে পাঁচ দিয়ে গুণ করতে হবে। আমরা মানুষ, আমাদের প্রারব্ধ অভিজ্ঞতা, পড়াশোনা এরকম নানা সূত্রে আমাদের লব্ধ জ্ঞানের সূত্রে আমরা “মেশিন”কে নির্দেশ করি কি করতে হবে, মেশিন আমাদের “আদেশ” পালন করে। এছাড়াও রাশিবিজ্ঞানের সূত্রেও আমরা স্থির করতে পারি যে কত ফারেনহাইটে কত সেলসিয়াস। কাজের কথা, আমরা যন্ত্রকে নির্দেশ দিই, যন্ত্র সে নির্দেশ পালন করে।
এই যে নির্দেশ দেবার নিয়মবদ্ধতা, এই যে একের পর এক নির্দেশিকা দিয়ে রাখা, কি কি করতে হবে, কিভাবে করতে হবে রান্নার নিয়ম শেখানোর মতন, আমরা যন্ত্রের এই ব্যবহারেই অভ্যস্ত, এ এক ব্যাপার। এতে অবশ্য যন্ত্রের শেখা টেখা কিছু হল না, সে শুধু নির্দেশ পালন করতে লাগল। যন্ত্রকে যদি শেখাতে হয়, তাহলে ব্যাপারটি দাঁড়াবে নীচে যেমন দেখানো আছে, সেই রকম,
যন্ত্রকে শেখানো অন্যরকম। যন্ত্র শিখবে মানে তাকে শেখার মতন তথ্য দিতেও হবে, আর কোনটা ঠিক, কোনটা ভুল সেইটাও জানিয়ে দিতে হবে, তবেই সে শিখবে কিভাবে (অন্তত এক্ষেত্রে) কোন ফর্মুলা যাতে ইনপুট আর আউপুট ফরমুলার সূত্রে মিলে যায়। এখন এটা যেহেতু শেখার এবং শেখানোর পালা, এবং নানারকমের ইনপুট আউটপুট জোড়ায় জোড়ায় শিখে যন্ত্রের ফরমুলা তৈরীর ব্যাপার, এ অনেকটা আমাদের শৈশবে অঙ্ক শেখার মতন | এক জোড়া মাত্র সংখ্যা দিলে হবে না, অজস্র সংখ্যার জোড় দিয়ে শেখাতে হবে তাকে। যত বেশী সংখ্যার জোড় দেবেন, তত “ভালভাবে” সে শিখবে।
এই একই ব্যাপার যন্ত্রকে ছবি চেনানো বা ছবি শেখানোর ক্ষেত্রেও প্রযোজ্য | যন্ত্র ছবি কে আমরা মানুষরা যেভাবে ছবি রূপে দেখি, সে তো ঠিক সেভাবে দেখে না, সে দেখে ছবিকে অঙ্কের হিসেবে। যেমন ধরুন নীচের ছবিটি,
ছবিটা তাজ মহলের, আমাদের, মানুষের পক্ষে চিনতে অসুবিধে হবার কথা নয়, এই তাজমহলই, মেশিনকে চেনাতে গেলে ছবিটিকে টুকরো করে অজস্র ছোট অংশে ভাগ করে ফেলতে হবে এবং প্রতিটি অংশকে ০ থেকে ২৫৫ র মধ্যে একটি সংখ্যা দিয়ে চিহ্নিত করে মেশিনকে দিয়ে অঙ্ক করা শেখানো হবে। শেখাতে গেলে মেশিনকে জানিয়ে দিতে হবে যে এ ছবি তাজ মহলের | মেশিন আন্দাজ করবে, মেশিনের ভুল হবে, শোধরাবে, এবং বারবার এই প্রক্রিয়ার মধ্যে দিয়ে শেখার এক সময় মেশিন স্থির করবে এ ছবি কত শতাংশ তাজমহল হবার কথা। তবে মেশিনকে শেখাতে গেলে একটি মাত্র ছবি দিয়ে দেখালে তো চলবে না, হাজার খানেক ছবি, তার কয়েকটি “ট্রেনিং” বা শেখানোর জন্য রাখা, কয়েকটিকে দিয়ে আলাদা করে যাচাই করানো, আর কয়েকটিকে দিয়ে পরীক্ষা করিয়ে নেয়া যে মেশিন শিখল কি না।
এত কথা লেখার উদ্দেশ্য এইটাই যে মেশিনকে ছবি চেনা, বা অন্য কিছু “শেখাতে” গেলে অল্প কয়েকটি ছবি বা কম ডাটা দিলে চলবে না। এতে উল্টো বিপত্তি, আপাত ভাবে দেখে মনে হবে সে শিখেছে, আসলে সে “মুখস্ত” করছে। কিন্তু শেখা আর মুখস্ত করা এক নয় তো, ফলে নতুন ছবি দেখালে সে আর শনাক্ত করে উঠতে পারে না।
সে কি? নীচের ছবিটি লক্ষ করুন
ওপরে যে চিত্রটি দেখানো হয়েছে, তাতে মেশিনের শেখা না শেখার প্লট | X-axis বরাবর নজর করে দেখুন, প্রক্রিয়া বা epoch দেখানো হয়েছে। মনে করা যাক ১০০ টি ছবি মেশিনকে দেখানো হল এবং সে একবার শিখছে, দুবার শিখছে, এই করে করে ১০০ বার তাকে দিযে শেখানো হচ্ছে। প্রতিবার, সে ভুল করছে, তার পরের বার শুধরে নিচ্ছে | শুধু তাই নয়, এই ১০০ বারের প্রতিবার মেশিন কতটা শিখল, আমরা যাচাই করে নিচ্ছি। কত শতাংশ সে ভুল করছে, সেইটা Y-axis এ দেখানো হয়েছে। যেমন ধরুন, প্রথমবার যখন মেশিনকে শেখানো হল, মেশিন ৯০% ভুল করে বসল (বুঝতেই পারল না এ ছবি তাজমহলের কি না)। কিন্তু সে শেখে দ্রুত, তাই তার ভুলের পরিমাণ ক্রমশ কমতে থাকল। ১০ বার পর্যন্ত দেখুন মেশিনের ট্রেনিং আর যাচাই করার ছবি দিয়ে পরীক্ষা করতে গিয়ে দেখা গেল তারা মোটামুটি একই রকমভাবে ভুল করছে, এবং ভুল শোধরাচ্ছে। ১০ রাউণ্ড শেখানোর পর একটা অদ্ভুত ব্যাপার দেখা গেল। মেশিন ট্রেনিং এর যে ডাটা, তাতে তার ভুলচুক অনেকটা কমে গেল বটে, কিন্তু তাকে যখন যাচাই করা হল, তখন দেখা গেল, তার ভুল করার পরিমাণ শতাংশের হিসেবে বাড়তে লাগল। এই ব্যাপারটি থেকে একটা ব্যাপার বোঝা যাচ্ছে যে মেশিন চেনা ডাটা দিব্য আত্মস্থ করেছে বটে, কিন্তু শেখে নি।
ব্যাপারটি কিরকম জানেন? এ আমাদের ছোটবেলায় নামতা মুখস্থ করার মতন। ১০ এর নামতা ১ থেকে ১০ দিব্য মুখস্থ হয়েছে, অথচ শিক্ষক যেই ১১ দশে কত হয় জিজ্ঞাসা করলেন, তার আর উত্তর নেই | কয়েকজন ছাত্র অবশ্য ইতিমধ্যে দেখেছে, ১০ দিয়ে গুণ করলে সংখ্যাটির পাশে একটি শূণ্য বসালেই উত্তর পাওয়া যায়, এইটে তাদের নামতা “শেখা”, বাকীরা স্রেফ মুখস্থ বিদ্যার ওপর নির্ভর করেছে । এ সমস্ত ক্ষেত্রে শিক্ষক সচরাচর যা করেন, পুনরায় নামতা আত্মস্থ করান, তারপর অন্যান্য সংখ্যা দিয়ে গুণ করিয়ে নামতার “রহস্য” ছাত্রদের “শেখান”। মেশিনের ক্ষেত্রেও অনেকটা একই রকম কাজ হয়।
এত কথা লেখার উদ্দেশ্য এই যে, মেশিনকে যদি “শেখাতে” হয়, তাহলে প্রচুর ডাটা আর তার সংলগ্ন “লেবেল”এর প্রয়োজন হয়। এখন সত্যি বলতে কি, ডাটা লেবেল করার কাজটি খুবই সহজ, যেমন তাজমহলের ছবি দেখে সে যে তাজমহল, এইটা কোথাও লিখে রাখা | এ কাজে যে খুব দক্ষতার প্রয়োজন তা নয়, কিন্তু যেহেতু কৃবু’র কাজে লক্ষ লক্ষ ছবির প্রয়োজন, একজন দুজনের পক্ষে তো এ কাজ সম্ভব নয়।
কাজটি সামান্য, কিন্তু প্রচুর মানুষের প্রয়োজন, এবং এ সমস্ত ক্ষেত্রে সচরাচর যা হয়, যারা এ কাজ করবেন, তাদের কাজ পিছু খুব সামান্য মজুরি দিলেও চলে। ফাই ফাই লি যেমন গবেষণার কাজ করতে গিয়ে এই অদ্ভুত সমস্যার সম্মুখীন হয়েছিলেন, আমাজন কোমপানী তেমনি নিজেদের ব্যবসার কাজ করতে গিয়ে অন্য রকমের “লেবেলিং” এর সমস্যায় পড়েছিল, কাজেই তাদেরও ঐ এক দশা | এই মানুষগুলো লেবেলিং এর কাজ না করে দিলে, এবং সময়মত না করে দিলে আজকের আরটিফিশিয়াল ইনটেলিজেনসের যে ঝাঁ চকচকে অগ্রগতি, তার কিছুই দাঁড়ায় না।
আমরা শুরু করেছিলাম এই বলে যে যান্ত্রিক তুরকী সেযুগে যেমন একটি মানুষের চোখে ধুলো দেওয়ার খেলা বই কিছু ছিল না, যেখান কাজ করত মানুষ আর নাম হত যন্ত্রের, আমাদের এই আমলের আমাজনের যান্ত্রিক তুরকীও প্রকারান্তরে তাই | আমাজন ঠিক কি কারণে বা কি বিবেচনা করে এই নাম স্থির করেছিলেন কে জানে, যদিও কার্যক্ষেত্রে কৃত্রিম বুদ্ধিমত্তা জনিত ব্যবসার যে প্রায় বিস্ফোরণ ঘটছে আমাদের প্রাত্যহিক জীবনে, সেখানে যন্ত্রের যাবতীয় আশ্চর্য কার্যকুশলতার ভিত রয়ে গেছে অগণিত অচেনা, হয়তবা উপেক্ষিত মানুষের কায়িক শ্রমলব্ধ তথ্য অন্বেষণ আর কুশলতায়, যেটুকু না হলে এর কিছুমাত্র হত না। যান্ত্রিক তুরকীর মেশিনের মধ্যে অবস্থিত মানুষটির মতন এঁরাও আমাদের সাধারণ চোখে অদৃশ্য, “অশরীরি” রয়ে গেলেন | প্রায় বেগার খাটছেন প্রতিনিয়ত, এদের নিয়েই আমাদের ভূতের বেগারের গল্প।
পাঠক, এইখানে এই ধরণের কাজের প্রেক্ষিতে, শ্রমিকের অধিকার, তাদের শারীরিক মানসিক স্বাস্থ্যের বিষয়গুলো বিবেচনা করার সময় এসেছে। বিশেষ করে যেভাবে এ আই (কৃবু) এবং তৎসংলগ্ন ব্যবসা-বাণিজ্যের যাকে বলে বিস্ফোরণ ঘটছে প্রতিদিন। সে প্রসঙ্গে আসছি।
(ক্রমশ )