তথ্য খোঁজার চিরাচরিত পদ্ধতিতে আমূল পরিবর্তন এনে বিশ্বজুড়ে ‘সার্চ লাইভ’ সুবিধা চালু করেছে টেক জায়ান্ট গুগল। এখন থেকে কোনো কিছু জানতে হলে কিবোর্ডে টাইপ করার প্রয়োজন পড়বে না; বরং স্মার্টফোনের ক্যামেরা এবং ভয়েস কমান্ডের মাধ্যমে সরাসরি গুগলের সঙ্গে মানুষের মতো কথোপকথন চালিয়ে কাঙ্ক্ষিত তথ্য পাওয়া যাবে। কৃত্রিম বুদ্ধিমত্তার (AI) এই নতুন দিগন্ত উন্মোচিত হয়েছে গুগলের সর্বাধুনিক ‘জেমিনাই ৩.১ ফ্ল্যাশ লাইভ’ মডেলের হাত ধরে।
গত শুক্রবার এক আনুষ্ঠানিক সংবাদ বিজ্ঞপ্তিতে গুগল জানিয়েছে, বিশ্বের ২০০টিরও বেশি দেশ ও অঞ্চলে এই সুবিধাটি পর্যায়ক্রমে চালু করা হয়েছে। এর মাধ্যমে ব্যবহারকারীরা কেবল একটি প্রশ্ন করেই থেমে থাকবেন না, বরং একই বিষয়ের ওপর ধারাবাহিকভাবে একাধিক প্রশ্ন করে বিস্তারিত জেনে নিতে পারবেন। অনেকটা একজন রক্ত-মাংসের বিশেষজ্ঞের সঙ্গে কথা বলার মতোই সহজ হবে এই অভিজ্ঞতা।
যেভাবে কাজ করবে ‘সার্চ লাইভ’
গুগলের এই নতুন ফিচারের মূল ভিত্তি হলো মাল্টিমোডাল ইন্টারেকশন। অর্থাৎ, এটি একই সঙ্গে শব্দ এবং দৃশ্য বুঝতে সক্ষম। অ্যান্ড্রয়েড বা আইওএস (iOS) ডিভাইসে গুগল অ্যাপটি ওপেন করলে সার্চ বারের নিচেই একটি নতুন ‘লাইভ’ আইকন দেখা যাবে। সেখানে ট্যাপ করলেই সক্রিয় হবে ভয়েস মোড। ব্যবহারকারী কোনো প্রশ্ন করলে গুগল কেবল উত্তরই দেবে না, বরং ব্যবহারকারীর কণ্ঠস্বরের ভঙ্গি বা আবেগ বুঝে সেই অনুযায়ী সাড়া দেবে।
সবচেয়ে চমকপ্রদ বিষয় হলো এর ক্যামেরা ইন্টিগ্রেশন। ধরুন, আপনি একটি নতুন আসবাবপত্র কিনলেন কিন্তু সেটি কীভাবে জুড়তে হবে বুঝতে পারছেন না। আপনি কেবল ফোনের ক্যামেরাটি সেই আসবাবের দিকে তাক করে প্রশ্ন করলেই গুগল রিয়েল-টাইমে ভিডিও বিশ্লেষণ করে আপনাকে ধাপে ধাপে নির্দেশনা দেবে। এমনকি যারা গুগলের ‘লেন্স’ ব্যবহার করেন, তারাও লেন্স মোড থেকেই সরাসরি লাইভ কথোপকথনে যুক্ত হতে পারবেন।
‘জেমিনাই ৩.১ ফ্ল্যাশ লাইভ’-এর জাদু
পুরো প্রক্রিয়াটি পরিচালিত হচ্ছে গুগলের শক্তিশালী এআই মডেল ‘জেমিনাই ৩.১ ফ্ল্যাশ লাইভ’ দ্বারা। এটি আগের মডেলগুলোর তুলনায় অনেক দ্রুত এবং প্রায় ৯০টিরও বেশি ভাষা বুঝতে ও প্রতিক্রিয়া জানাতে সক্ষম। এর বিশেষ বৈশিষ্ট্যগুলো হলো:
স্বাভাবিক কথোপকথন: এটি মানুষের কথার স্বর (Pitch), গতি এবং আবেগ বুঝতে পারে। এমনকি পাশে যদি ট্রাফিক বা টেলিভিশনের শব্দ থাকে, তা এড়িয়ে ব্যবহারকারীর কথা শনাক্ত করতে এটি দক্ষ।
স্মৃতিশক্তি: কথোপকথন চলাকালীন আগের কথাগুলো মনে রাখার ক্ষমতা দ্বিগুণ করা হয়েছে, ফলে দীর্ঘ আলোচনায় খেই হারাবে না এআই।
বাংলা ভাষার প্রাধান্য: দক্ষিণ এশিয়ার বাজারের কথা মাথায় রেখে গুগলের এই মডেলে বাংলাসহ ভারতের প্রধান প্রধান আঞ্চলিক ভাষাগুলো যুক্ত করা হয়েছে। ফলে বাঙালি ব্যবহারকারীরা একদম নিজের ভাষাতেই গুগলের সঙ্গে আড্ডা দিতে দিতে তথ্য সংগ্রহ করতে পারবেন।
বিশেষজ্ঞের অভিমত ও ভবিষ্যৎ সম্ভাবনা
প্রযুক্তি বিশ্লেষকদের মতে, গুগলের এই পদক্ষেপ মূলত ওপেনএআই-এর চ্যাটজিপিটি বা অন্যান্য এআই চ্যাটবটের সঙ্গে প্রতিযোগিতায় নিজেদের অবস্থান আরও সুসংহত করার চেষ্টা। এটি কেবল একটি সার্চ ইঞ্জিন নয়, বরং একটি ব্যক্তিগত সহকারীতে পরিণত হচ্ছে।
গুগলের প্রোডাক্ট ম্যানেজমেন্ট ডিরেক্টর লিজা মা জানান, “সার্চ লাইভ এমনভাবে ডিজাইন করা হয়েছে যাতে ব্যবহারকারীরা কোনো জটিল বিষয়ে শিখতে বা নতুন কিছু অন্বেষণ করতে টাইপ করার ঝামেলা ছাড়াই তাৎক্ষণিক সাহায্য পান।”

