পোকেমন গো গেমের ৩ হাজার কোটি ছবি দিয়ে কী শেখানো হচ্ছে এআই রোবটদের

আচ্ছা, তুমি কি কখনো পোকেমন গো (Pokémon GO) গেমটি খেলেছ? কিংবা রাস্তায় মোবাইল দিয়ে পিকাচু বা চিজার্ডকে ধরার চেষ্টা করেছ? ২০১৬ সালে যখন এই গেম বাজারে আসে, তখন বিশ্বজুড়ে সাড়া পড়ে গিয়েছিল। ভার্চ্যুয়াল দুনিয়ার পোকেমনদের বাস্তব দুনিয়ায় ধরার এই গেম অল্প দিনেই ব্যাপক সাড়া ফেলে সারা বিশ্বে। কিন্তু গেমারদের তোলা এই পোকেমন ধরার কোটি কোটি ছবি এখন এআইদের প্রশিক্ষণে ব্যবহার করা হচ্ছে।

১০ বছর ধরে বিশ্বজুড়ে পোকেমন গো গেমের খেলোয়াড়েরা মনের আনন্দে এই কাজ করেছেন। গেমটি খেলার সময় তাঁরা স্বেচ্ছায় বিভিন্ন ঐতিহাসিক স্থাপনা, চেনা রাস্তার মোড়, এমনকি নিজেদের পাড়ার দোকানেরও কোটি কোটি ছবি আর ছোট ছোট ভিডিও করেছেন। গেমারদের তোলা এই বিপুল পরিমাণ ছবি এক জায়গায় হয়ে এখন ৩০ বিলিয়ন বা ৩ হাজার কোটি ছবির এক বিশাল তথ্যের ভান্ডারে পরিণত হয়েছে।

গেমটির নির্মাতা প্রতিষ্ঠান নিয়ানটিকের কৃত্রিম বুদ্ধিমত্তা (এআই) বিভাগ এই ছবিগুলো দিয়ে ডিজিটাল মডেল তৈরি করেছে। এই মডেল আসলে রোবট ও কম্পিউটারের জন্য তৈরি করা পৃথিবীর এক নিখুঁত মানচিত্র। তবে এটি আমাদের মোবাইলের সাধারণ গুগল ম্যাপের মতো নয়। এটি রাস্তার প্রতিটি মোড় আর অলিগলির একদম থ্রিডি ম্যাপ।

আরও পড়ুন

বর্তমানে এই ডিজিটাল মানচিত্র ব্যবহার করে পরিচালনা করা হচ্ছে কোকো রোবোটিকসের প্রায় এক হাজার ডেলিভারি রোবট। কোকো রোবোটিকস হলো বিশ্বের বৃহত্তম আরবান বা শহুরকেন্দ্রিক রোবোটিকস ডেলিভারি প্ল্যাটফর্ম। লস অ্যাঞ্জেলেস, মায়ামি থেকে শুরু করে ফিনল্যান্ডের হেলসিঙ্কির মতো শহরগুলোতে এই রোবট এখন নির্ভুলভাবে পিৎজা বা অন্যান্য জিনিস পৌঁছে দিচ্ছে।

গুগল আর্থের অন্যতম কারিগর এবং নিয়ানটিকের প্রধান প্রযুক্তি কর্মকর্তা ব্রায়ান ম্যাকক্লেনডন এই প্রযুক্তির সাফল্য দেখে রীতিমতো মুগ্ধ। সাধারণ মানুষের খেলার ছলে তোলা ছবিগুলোই আজ রোবটদের স্বয়ংক্রিয়ভাবে চলাচলের প্রধান মাধ্যম হয়ে দাঁড়িয়েছে।

পোকেমন গো খেলোয়াড়দের তোলা ছবিগুলোর তথ্য সাধারণ মানের নয়। এগুলো কৃত্রিম বুদ্ধিমত্তাকে উন্নত করার জন্য সবচেয়ে উচ্চমানের ডেটা। নিয়ানটিকের দীর্ঘমেয়াদি লক্ষ্য হলো, গেমারদের পাঠানো নিখুঁত ছবিগুলো ব্যবহার করে প্রথমে নির্দিষ্ট কিছু জায়গাকে খুব ভালো করে চেনা। এই বিশাল তথ্যকে কাজে লাগিয়ে একটি কঠিন সমস্যার সমাধান করা হয়েছে। এখন যেকোনো ঝাপসা বা কম রেজোল্যুশনের ছবি দেখেই রোবট চট করে যেকোনো জায়গার অবস্থান, দৃশ্য আর চারপাশের পরিবেশ একদম নির্ভুলভাবে বুঝে নিতে পারে।

নিয়ানটিকের এই নতুন প্রযুক্তির নাম ভিজ্যুয়াল পজিশনিং সিস্টেম বা ভিপিএস (VPS)। এটি স্বয়ংক্রিয় ডেলিভারি রোবটদের একটি বড় সমস্যার সমাধান করে দিয়েছে। আমরা সাধারণত পথ চেনার জন্য মোবাইলে যে জিপিএস ব্যবহার করি, তা শহরের বড় বড় বিল্ডিং এর কারণে প্রায়ই ভুল সংকেত দেয়। কিন্তু রোবট যখন পিৎজা বা বার্গার পৌঁছে দিতে বের হয়, তখন সামান্য কয়েক ফুটের ভুলও কিন্তু বড় গোলমাল পাকিয়ে ফেলতে পারে। হয়তো দেখা গেল বার্গারটি ভুল করে পাশের বাসার কেউ পেয়ে গেল।

আরও পড়ুন

এই সমস্যা কাটাতে ভিপিএস প্রযুক্তি সরাসরি আকাশের স্যাটেলাইটের ওপর নির্ভর না করে রোবটের নিজের ক্যামেরার সাহায্য নেয়। রোবট যখন রাস্তা দিয়ে চলে, তখন এর লাইভ ক্যামেরার দৃশ্যগুলোকে আগে থেকে জমা থাকা ওই কোটি কোটি ছবির ডেটাবেজের সঙ্গে মিলিয়ে নেয়। ফলে স্যাটেলাইট সিগন্যাল না থাকলেও রোবটটি একদম নিখুঁতভাবে বুঝতে পারে, সে ঠিক কোন জায়গায় আছে এবং কার দরজায় খাবারটি পৌঁছাতে হবে।

এটি অনেকটা মানুষের বুদ্ধিমত্তার মতোই কাজ করে। বিশেষ করে শহরের ঘিঞ্জি অলিগলি, যেখানে উচুঁ দালানের জন্য আকাশ দেখা যায় না বলে জিপিএস কাজ করে না, সেখানে এই প্রযুক্তি সবচেয়ে দারুণ কাজ করে।

এই বিশাল মানচিত্রটি তৈরির মূল চালিকাশক্তি একটি বিশেষ এআই ইঞ্জিন। যাকে বলা হয় লার্জ জিওস্পেশিয়াল মডেল (LGM)। এটি শতকোটি ছবি বিশ্লেষণ করে প্রধানত তিনটি কাজ করে। যেকোনো জায়গাকে থ্রি–ডি মডেলে রূপ দেওয়া, সেখানে রোবটের সঠিক অবস্থান খুঁজে বের করা এবং পরিবেশের খুঁটিনাটি চেনা। বর্তমানে বড় বড় কোম্পানিগুলোও তাদের নিজস্ব তথ্য দিয়ে এই মডেলকে আরও শক্তিশালী করছে।

আরও পড়ুন

একজন মানুষ যেমন জিপিএস কাজ না করলেও চারপাশের দোকান বা চেনা গাছপালা দেখে গন্তব্য চিনে নিতে পারে। রোবট তা পারে না। উঁচু দালানের নিচে জিপিএস সিগন্যাল হারিয়ে ফেললে রোবট পুরোপুরি দিশাহারা হয়ে যায়।

ডেলিভারি রোবটের ক্ষেত্রে এই সমস্যা আরও বিপজ্জনক। যদি রোবটটি ভুল ঠিকানায় গিয়ে খাবারের বাক্স নিয়ে দাঁড়িয়ে থাকে, তবে গ্রাহকের মেজাজটাই খারাপ হয়ে যাবে। ঠিক এই জায়গাতেই নিয়ানটিকের এই প্রযুক্তি কাজে আসবে। এটি রোবটকে একদম নিখুঁতভাবে গ্রাহকের দরজায় পৌঁছে দেবে।

সূত্র: ফরচুন ডটকম, পপুলার সায়েন্স

আরও পড়ুন