গুগল ম্যাপসের ভয়েস আর্টিস্ট কে
মাঝেমধ্যে রাস্তা খুঁজতে গিয়ে মাথা খারাপ হয়ে যায়। ডানে না বাঁয়ে যাব, তা নিয়ে দ্বিধায় পড়ে না, এমন মানুষ কম। গুগলের কাছে পথের হদিস জানতে চাইলে মোবাইলের স্পিকার থেকে ভেসে আসে এক পরিচিত কণ্ঠস্বর, ‘সামনে ১২ মিটার গিয়ে ডানদিকে মোড় নিন’। আর সবাই যেন নিশ্চিন্তে সেই নির্দেশ মেনে চলেন। কিন্তু কখনো কি ভেবে দেখেছ, এই কণ্ঠস্বরের পেছনের মানুষটি কে? আর কীভাবে একটি ভয়েস-রেকর্ডিং কিছু মুহূর্তের মধ্যে পৃথিবীর যেকোনো স্থানের পথ দেখাতে পারে?
অজানা রাস্তায় যে কণ্ঠস্বর প্রতিদিন সঠিক পথ দেখায়, তার পেছনের মানুষটি হলেন অস্ট্রেলিয়ার শিল্পী কারেন জ্যাকবসেন। ছোটবেলায় কারেন জ্যাকবসেনের স্বপ্ন ছিল বড় হয়ে একজন গায়িকা হবেন। এই স্বপ্নকে সত্যি করতে তিনি নিজ দেশ অস্ট্রেলিয়ার ম্যাকে শহর থেকে পাড়ি জমান যুক্তরাষ্ট্রের নিউইয়র্কে।
সালটা ছিল ২০০২। নিউইয়র্কে আসার কিছুদিনের মধ্যেই হঠাৎ তিনি একটি অডিশনের খবর পেলেন। সেখানে একজন ক্লায়েন্ট মার্কিন যুক্তরাষ্ট্রে বসবাসকারী একজন অস্ট্রেলিয়ান নারী ভয়েসওভারের জন্য শিল্পী খুঁজছিলেন। ভাগ্যের কী খেলা। কারেন সব শর্ত পূরণ করায় চাকরিটি সহজেই পেয়ে গেলেন।
এর পরের গল্পটা কিছুটা সিনেমার মতো। যেই কণ্ঠস্বরের মাধ্যমে তিনি গায়িকা হতে চেয়েছিলেন, সেই কণ্ঠস্বরই তাঁকে এনে দিয়েছে বিশ্বজোড়া পরিচিতি। এখন তাঁর কণ্ঠস্বর গুগল ম্যাপসসহ এক বিলিয়নের বেশি জিপিএস ডিভাইসে শোনা যায়। এই মজার ব্যাপারটি নিয়ে তিনি নিজেই মজা করে বলেন, ‘জানেন, আমি নাকি পৃথিবীর একমাত্র নারী, যার কথা পুরুষরা কোনো প্রশ্ন না করেই মেনে চলে।’ তিনি আরও বলেন, ‘পুরো পৃথিবীতে এক বিলিয়নের বেশি মোবাইল ও জিপিএস ডিভাইসে আমার কণ্ঠ শোনা যায়। আর মজার ব্যাপার হলো, “আপনার গন্তব্যে পৌঁছেছেন” এই কথাটাও আমিই বলি।’
অস্ট্রেলিয়ান ভয়েসওভার শিল্পী কারেন জ্যাকবসেনের কণ্ঠস্বর ছিল তাঁর সবচেয়ে বড় সম্পদ। অস্ট্রেলিয়ান উচ্চারণকে ভয়েসওভারের জগতে সবচেয়ে শ্রুতিমধুর ও স্পষ্ট বলে মনে করা হয়। যা দীর্ঘ সময় ধরে শুনতে আরামদায়ক। আর এই গুণের কারণেই তিনি অন্য প্রতিযোগীদের চেয়ে অনেক এগিয়ে ছিলেন। সেখান থেকেই এই কাজের জন্য তিনি বিশেষভাবে নির্বাচিত হন।
তাঁর কণ্ঠস্বর এখন অ্যাপলের ভার্চুয়াল অ্যাসিস্ট্যান্ট সিরিতেও ব্যবহৃত হয়। কিন্তু এখানে এক অদ্ভুত মজার ঘটনা ঘটে তাঁর সঙ্গে। সিরি তাঁর নিজের কণ্ঠের স্রষ্টাকেই চিনতে পারে না। জ্যাকবসেন বলেন, ‘আমার স্বামী কিংবা ছেলে সিরিকে প্রশ্ন করলে উত্তর পায়। কিন্তু আমি প্রশ্ন করলে সে আমাকে বুঝতে পারে না।’ এই কণ্ঠশিল্পীর আরেকটি পরিচয় আছে। তিনি একজন পেশাদার গায়িকা হিসেবেও কাজ করেছেন। তিনি জানান, ‘আমার কণ্ঠ চিরকাল থেকে যাবে, যা আমার কাছে গর্বের বিষয়।’
এবার আসা যাক কীভাবে একটি ভয়েস-রেকর্ডিং দিয়ে কোটি কোটি পথের নির্দেশনা দেওয়া সম্ভব? এর পেছনের মূল রহস্য হলো ভয়েস সিন্থেসিস বা টেক্সট-টু-স্পিচ প্রযুক্তি। এই প্রযুক্তিতে প্রথমে একজন কণ্ঠশিল্পীর ভয়েস রেকর্ড করা হয়। এরপর সেই কণ্ঠ থেকে প্রতিটি সম্ভাব্য অক্ষর, শব্দ ও বাক্যের অংশ আলাদাভাবে রেকর্ড করা হয়। এই প্রক্রিয়ায় ইঞ্জিনিয়াররা একটি বিশাল স্ক্রিপ্ট তৈরি করেন। যেখানে একটি শব্দের সম্ভাব্য সব ধরনের উচ্চারণ থাকে। যেমন, নিখুঁত কণ্ঠস্বর পাওয়ার জন্য কারেনকে ‘প্রায়’ শব্দটি একটানা ১৬৮ বার উচ্চারণ করতে হয়েছিল।
রেকর্ডিং শেষ হওয়ার পর, এই ক্ষুদ্র ক্ষুদ্র অংশের শব্দগুলো দিয়ে কম্পিউটার স্বয়ংক্রিয়ভাবে যেকোনো নতুন বাক্য তৈরি করে। যখন গুগল ম্যাপে কোনো ঠিকানা দেওয়া হয়, তখন এটি সেই গন্তব্যের রাস্তা ও মোড়গুলোর নাম টেক্সট হিসেবে নিয়ে নেয় এবং ভয়েস সিন্থেসিস প্রযুক্তির মাধ্যমে কারেনের কণ্ঠস্বর ব্যবহার করে নির্দেশনা তৈরি করে। এভাবেই একজন গায়িকার কণ্ঠস্বর পরিণত হয়েছে পৃথিবীর সবচেয়ে পরিচিত কণ্ঠস্বরগুলোর একটিতে।
সূত্র: গ্রেট বিগ স্টোরি, ডেকান ক্রনিকল