লেখকঃ মোহাম্মদ ইব্রাহিম
বিশ্বজুড়ে ভয়েস টেকনোলজি (Voice Technology) দিন দিন জনপ্রিয় হয়ে উঠছে। Amazon-এর Alexa, Google এর Assistant সবই আমাদের দৈনন্দিন কাজকে সহজ করতে ভয়েস কমান্ড ব্যবহার করছে। এই বৈপ্লবিক পরিবর্তনের ছোঁয়া এখন বাংলাদেশও লেগেছে। বাংলা ভাষাভাষী মানুষের সংখ্যা ৩০ কোটির বেশি, কিন্তু বহুদিন ধরেই বাংলা ভাষার জন্য ভয়েস AI-এর পর্যাপ্ত সমাধান ছিল না। বর্তমানে বাংলাদেশি ও ভারতীয় স্টার্টআপগুলো এ খাতের দিকে নজর দিয়েছে। ফলে Bangla Voice AI এখন ব্যবসা, শিক্ষা, স্বাস্থ্য এবং গ্রাহক সেবায় নতুন দিগন্ত খুলে দিচ্ছে।
কেন এখন বাংলা ভয়েস AI-এর ডিমান্ড বেড়েছে?
- লোকাল ভাষার ব্যবহার: বাংলাদেশের প্রায় ৯৫% মানুষ মাতৃভাষা বাংলা ব্যবহার করে। ইংরেজি অ্যাপ বা ভয়েস অ্যাসিস্ট্যান্ট অনেকের কাছে জটিল।
- ইন্টারনেট ইউজারের বৃদ্ধি: BTRC-এর তথ্যমতে, ২০২৪ সালের শেষ নাগাদ দেশে ইন্টারনেট ব্যবহারকারী ১৩ কোটির বেশি হয়েছে। এর মধ্যে গ্রামীণ এলাকাতেও স্মার্টফোনের প্রসার ঘটছে, যেখানে ভয়েস কমান্ড বেশি কার্যকর।
- ব্যবসায়িক সুবিধা: ই-কমার্স, হেলথটেক বা এডটেক কোম্পানিগুলো ভয়েস-ভিত্তিক কাস্টমার সার্ভিস যুক্ত করছে যাতে গ্রাহকরা সহজে সেবা পেতে পারে।
- অ্যাক্সেসিবিলিটি: অশিক্ষিত ও গ্রামীণ জনগোষ্ঠীর জন্য ভয়েস টেক অ্যাপ্লিকেশন ব্যবহার করা অনেক সহজ।
Bangla Voice AI-এর ব্যবহারের ক্ষেত্রসমূহ
- ব্যাংকিং ও আর্থিক সেবা
ব্যাংক এশিয়া ২০২১ সালে বাংলাদেশের প্রথম ভয়েস ব্যাংকিং সেবা চালু করে। গ্রাহকরা এখন ইন্টারনেট সংযোগ ছাড়াই কথার মাধ্যমে ব্যালেন্স চেক, মানি ট্রান্সফার ও বিল পেমেন্ট করতে পারেন।
- কাস্টমার সাপোর্ট ও কল সেন্টার
বিভিন্ন প্রতিষ্ঠান এখন AI-চালিত কল সেন্টার ব্যবহার করছে। Speaklar বাংলাদেশের প্রথম AI-চালিত বাংলা কল সেন্টার সেবা। এই প্রযুক্তি ২৪/৭ গ্রাহক সেবা প্রদান করতে পারে।
- শিক্ষা ও প্রশিক্ষণ
বাংলা স্পিচ টু টেক্সট প্রযুক্তি শিক্ষাক্ষেত্রে বিপ্লব এনেছে। শিক্ষার্থীরা এখন ভয়েসের মাধ্যমে নোট নিতে এবং লেকচার ট্রান্সক্রাইব করতে পারে।
- স্বাস্থ্যসেবা
চিকিৎসকরা এখন বাংলা ভয়েস AI ব্যবহার করে দ্রুত রোগীর তথ্য রেকর্ড করতে পারেন। টেলিমেডিসিনে এই প্রযুক্তি বিশেষ গুরুত্বপূর্ণ ভূমিকা পালন করছে।
বর্তমান মার্কেট পরিস্থিতি ও ডিমান্ড
বাংলাদেশের স্পিচ রিকগনিশন মার্কেট ২০২৫ সালে ৩৯.২১ মিলিয়ন ডলার হবে এবং ২০৩১ সালের মধ্যে ১০৩.৮৯ মিলিয়ন ডলারে পৌঁছানোর সম্ভাবনা রয়েছে, যার বার্ষিক বৃদ্ধির হার ১৭.৬ৣ%।
স্পিচ-বেসড NLP মার্কেট ২০২৫ সালে ১৪৩ মিলিয়ন ডলার এবং ২০৩১ সালের মধ্যে ৫৮৯.৯৭ মিলিয়ন ডলার, বার্ষিক বৃদ্ধির হার ২৬.৬৪%।
সরকারি উদ্যোগ
বাংলাদেশ সরকার তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের পক্ষ থেকে ২০২৪ সালে তিনটি AI-ভিত্তিক বাংলা সফটওয়্যার চালু করেছে:
- বাংলা টেক্সট টু স্পিচ ‘উচ্চারণ’
- বাংলা স্পিচ টু টেক্সট ‘কথা’
- বাংলা OCR ‘বর্ণ’
প্রচলিত পদ্ধতির সাথে বাংলা ভয়েস এআই-এর তুলনা
| বৈশিষ্ট্য (Feature) | প্রচলিত পদ্ধতি (Traditional Method) | বাংলা ভয়েস এআই (Bangla Voice AI) |
| নির্দেশনা প্রদান | কি-বোর্ডে টাইপ করা বা স্ক্রিনে ট্যাপ করা | মুখে কথা বলে নির্দেশ দেওয়া |
| গতি | তুলনামূলকভাবে ধীর এবং সময়সাপেক্ষ | অত্যন্ত দ্রুত এবং তাৎক্ষণিক |
| সহজলভ্যতা | টাইপিং বা ডিজিটাল জ্ঞান প্রয়োজন | অক্ষরজ্ঞানহীন বা স্বল্পশিক্ষিত ব্যক্তিরাও ব্যবহার করতে পারেন |
| অন্তর্ভুক্তি | দৃষ্টি প্রতিবন্ধী বা শারীরিকভাবে অক্ষমদের জন্য কঠিন | সকলের জন্য ব্যবহারযোগ্য এবং অন্তর্ভুক্তিমূলক |
আরও পড়ুনঃ AI ব্যবহার করে রিসার্চ শেখা: মিড-লার্নারদের জন্য প্র্যাকটিক্যাল টিপস
বাংলাদেশী স্টার্টআপ ও কোম্পানিগুলোর উদাহরণ
Hishab/Verbex.ai
বাংলাদেশের সবচেয়ে সফল ভয়েস AI কোম্পানি Hishab (বর্তমানে Verbex.ai নামে পরিচিত) ২৩টি দেশে ৩০টিরও বেশি প্যাটেন্ট অর্জন করেছে। কোম্পানিটি Startup Bangladesh থেকে ২ কোটি টাকা বিনিয়োগ পেয়েছে এবং জাপানে ২.২ কোটি TEPCO গ্রাহকদের সেবা প্রদান করছে।
তাদের বাংলা ASR প্রযুক্তি মাত্র ৪% Word Error Rate অর্জন করেছে, যা Microsoft Azure এবং Google ASR-কে ছাড়িয়ে গেছে।
Intelsense AI
ইন্টেলসেন্স AI বাংলাদেশের প্রথম বাংলা Large Language Model ‘Ekush LLM’ তৈরি করেছে। তারা ৩ কোটি টাকা প্রি-সিড ফান্ডিং পেয়েছে এবং SenseVoice, SenseSpeech সহ বিভিন্ন প্রোডাক্ট অফার করে।
বেলা (বেলা AI)
ড্যাফোডিল ইন্টারন্যাশনাল ইউনিভার্সিটির একটি প্রজেক্ট বেলা বাংলাদেশের প্রথম টাস্ক এক্সিকিউশন AI অ্যাসিস্ট্যান্ট। এটি শুধু কথা বলে না বরং বিভিন্ন কাজ সম্পাদন করতে পারে।
ব্যবসায়িক প্রয়োগ ও সেক্টর
- কল সেন্টার এবং গ্রাহক সেবা: স্পিকলারের মতো সেবা বাংলা ভাষায় গ্রাহকদের সাথে যোগাযোগ করতে সাহায্য করছে।
- ই-কমার্স: বাংলা ভয়েস AI-চালিত শপিং অ্যাসিস্ট্যান্ট গ্রাহকদের কেনাকাটা করতে সাহায্য করছে।
- ব্যাংকিং এবং ফাইন্যান্স: বাংলা ভয়েস AI-চালিত ব্যাংকিং সেবা গ্রাহকদের জন্য আরও সহজ এবং অ্যাক্সেসযোগ্য করে তুলছে।
- গভর্নমেন্ট সার্ভিসেস: বাংলা ভয়েস AI সরকারি তথ্য প্রচারে এবং জনসাধারণের সাথে যোগাযোগে ব্যবহৃত হচ্ছে।
চ্যালেঞ্জ এবং করণীয়
প্রযুক্তিগত চ্যালেঞ্জ
বাংলা ভাষার আঞ্চলিক উচ্চারণ, ব্যাকরণের জটিলতা এবং কন্টেক্সট বোঝা এখনো বড় চ্যালেঞ্জ। সরকারের ‘তথ্যপ্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ প্রকল্প’ এর কাজ ধীরগতিতে এগিয়ে চলেছে।
দক্ষতার ঘাটতি
বিশেষজ্ঞ পর্যায়ের জনবলের ঘাটতি রয়েছে। এই প্রযুক্তিতে কাজ করার মতো দক্ষ ইঞ্জিনিয়ারের সংখ্যা খুবই কম।
ডেটার অভাব
মানসম্পন্ন বাংলা ভয়েস ডেটাসেটের অভাব রয়েছে। Bengali.AI এর মতো উদ্যোগ ২০,০০০ ঘন্টার ডেটাসেট তৈরি করলেও আরও প্রয়োজন।
সমাধানের দিক
- দক্ষতা উন্নয়ন: বিশ্ববিদ্যালয়ে বিশেষায়িত কোর্স চালু করা প্রয়োজন
- গবেষণায় বিনিয়োগ: সরকারি ও বেসরকারি পর্যায়ে আরও গবেষণা তহবিল বরাদ্দ
- ডেটা সংগ্রহ: বৃহৎ পরিসরে বাংলা ভয়েস ডেটা সংগ্রহ ও প্রক্রিয়াকরণ
ভবিষ্যৎ সম্ভাবনা
বাংলা ভয়েস AI এর ভবিষ্যৎ অত্যন্ত উজ্জ্বল। আগামী পাঁচ বছরে এই খাতে বিনিয়োগ ১০০০% বৃদ্ধি পাবে বলে বিশেষজ্ঞরা মনে করছেন। গ্রামীণ এলাকায় ইন্টারনেট পৌঁছানোর সাথে সাথে বাংলা ভয়েস AI এর চাহিদা আরো বাড়বে। স্মার্ট সিটি প্রকল্পে বাংলা ভয়েস AI একটি গুরুত্বপূর্ণ ভূমিকা পালন করবে। ট্রাফিক সিগন্যাল থেকে শুরু করে পাবলিক ট্রান্সপোর্ট সব জায়গায় বাংলা ভয়েস গাইড থাকবে।
পরিশেষে বলা যায়, বাংলা ভয়েস এআই শুধু একটি প্রযুক্তিগত উদ্ভাবনই নয়, এটি বাংলাদেশের আর্থ-সামাজিক প্রেক্ষাপটে একটি বড় পরিবর্তনের সূচনা করছে। ভাষাগত বাধা দূর করে ডিজিটাল সেবা সকলের জন্য সহজলভ্য করার মাধ্যমে এটি একটি অন্তর্ভুক্তিমূলক সমাজ গঠনে সহায়তা করছে। তাই বলাই বাহুল্য, বাংলা ভয়েস এআই-এর চাহিদা এখন তুঙ্গে এবং অদূর ভবিষ্যতে এর গুরুত্ব আরও বাড়বে।
আরও পড়ুনঃ জব মার্কেট ২০২৫ – বাংলাদেশের কোন সেক্টরে চাকরির চাহিদা সবচেয়ে বেশি থাকবে?
প্রশ্ন ও উত্তর (FAQ)
প্রশ্ন ১: বাংলা ভয়েস AI কতটা নির্ভুল?
উত্তর: বর্তমানে উন্নত বাংলা ভয়েস AI সিস্টেমগুলো ৯৫-৯৬% নির্ভুলতা অর্জন করেছে। Hishab-এর বাংলা ASR প্রযুক্তি মাত্র ৪% Word Error Rate দেখিয়েছে, যা আন্তর্জাতিক মানের।
প্রশ্ন ২: আঞ্চলিক উচ্চারণ কি বোঝে?
উত্তর: আধুনিক সিস্টেমগুলো ঢাকাইয়া, চট্টগ্রামী, সিলেটি, নোয়াখালী সহ বিভিন্ন আঞ্চলিক উচ্চারণ বুঝতে পারে। তবে এখনো উন্নতির সুযোগ রয়েছে।
প্রশ্ন ২: বাংলা ভয়েস AI ব্যবহারে কত খরচ হয়?
উত্তর: খরচ সেবাভেদে আলাদা। সাধারণ ব্যবহারের জন্য মাসিক ৫০০-২০০০ টাকা, এন্টারপ্রাইজ সলিউশনের জন্য মাসিক ১০,০০০-৫০,০০০ টাকা পর্যন্ত হতে পারে।
তথ্যসূত্র:
১.https://www.statista.com/outlook/tmo/artificial-intelligence/computer-vision/speech-recognition/bangladesh
২.https://thefinancialexpress.com.bd/national/three-ai-based-bangla-software-launched-on-international-mother-language-day
৩.https://www.tbsnews.net/features/panorama/voice-possibility-how-verbexai-giving-ai-bangladeshi-accent-1138101




