ভিডিও কলে শনাক্ত করা যাবে সাইন ল্যাঙ্গুয়েজও, অভিনব প্রযুক্তি গুগলের

কোভিড-১৯ পরিস্থিতির কারণে এখন শিক্ষা কিংবা কর্মক্ষেত্রে যোগাযোগের মাধ্যম হয়ে উঠেছে ভিডিও কনফারেন্স। কিন্তু যাঁরা কথা বলতে পারেন না? তাঁরা কীভাবে মানিয়ে নিচ্ছেন এই পরিস্থিতিকে? অঙ্গভঙ্গির মাধ্যমে ‘সাইন ল্যাঙ্গুয়েজ’-এ কথা বললেও, ভিডিও কলে বক্তাদের ভিড়ে অনেক সময়ই উপেক্ষিত থেকে যাচ্ছেন তাঁরা। তবে এই সমস্যারই সমাধান খুঁজে বার করল গুগল। গুগলের কৃত্রিম বুদ্ধিমত্তাই এবার শনাক্ত করবে সাইন ল্যাঙ্গুয়েজ ব্যবহারকারীদের।

ভিডিও কল চলাকালীন কোনো ব্যক্তি অঙ্গভঙ্গির মাধ্যমে যোগাযোগ করতে চাইলে গুগল তাঁকে চিহ্নিত করবে অ্যাক্টিভ ইউজার হিসাবে। স্ক্রিনে ভেসে উঠবে সেই চিহ্ন। ফলে বাকিরা সহজেই বুঝতে পারবেন, কথা বলতে চাইছেন সেই ব্যক্তি। গুগল মিট কিংবা ডুও ছাড়াও যে কোনো ভিডিও কনফারেন্সিং অ্যাপ্লিকেশনের সঙ্গেই প্লাগ-ইন হিসাবে যুক্ত করা যেতে পারে এই প্রযুক্তি।

অঙ্গভঙ্গি অনুমান করার জন্য প্রথমে পসনেট নামে একটি মডেলের ওপর ভিত্তি করেই পরীক্ষা চালায় গুগল। এই মডেল ভিডিওকে ভেঙে নেয় ছোটো ছোটো ফ্রেমের স্থিরচিত্রে। তারপর ব্যবহারকারীর চোখ, নাক, মুখ, হাতের অবস্থানকে বিশ্লেষণ করে ফ্রেম ধরে। নির্বাচন করে ওই ব্যক্তি সত্যিই কোনো ভাব প্রকাশ করতে চাইছেন কিনা, সে ব্যাপারে।

কিন্তু কীভাবে কাজ করে এই প্রযুক্তি? ২০ কিলো হার্জের বেশি কম্পাঙ্কের শব্দতরঙ্গের ব্যবহারে বক্তা নির্ধারণ করছে গুগল। ভিডিও কল চলাকালীন অবিরাম এই তরঙ্গের শব্দ নির্গত হবে ডিভাইস থেকে। বক্তা অঙ্গভঙ্গি করলে সেই শব্দ প্রতিফলিত হয়েই নির্ধারণ করবে তাঁকে। তবে আল্ট্রাসোনিক হওয়ায় অন্যদের বক্তব্যের ক্ষেত্রে কোনো প্রভাব ফেলবে না এই শব্দতরঙ্গ।

গুগলের এই প্রযুক্তি ৮০ শতাংশ ক্ষেত্রেই সফল হয়েছে এখনও অবধি। কিছুদিনের মধ্যেই এই সফলতার হার পৌঁছবে ৯১ শতাংশে। এমনই ইঙ্গিত দিয়েছেন গুগলের গবেষকরা। বর্তমানে গবেষণার স্তরে থাকলেও খুব শীঘ্রই যে এই প্রযুক্তির সংযোজন হতে চলেছে ভিডিও কনফারেন্স অ্যাপগুলিতে, তা বলাই বাহুল্য...

আরও পড়ুন
গুগলের ডুডলে ভারতীয় নৃত্যশিল্পীর মুখ, অভিনয়েও জিতেছেন অজস্র মানুষের মন

ভিডিও কলে শনাক্ত করা যাবে সাইন ল্যাঙ্গুয়েজও, অভিনব প্রযুক্তি গুগলের

Related News

Banglasphere

More From Author See More

Latest News See More