شناسایی ۴۰۰۰ زبان گویشی با هوش مصنوعی
6 خرداد 1402 ساعت 11:28
گروه علمی: فناوری هوش مصنوعی در حوزه زبان شناسی هم توانسته به شناسایی ابعاد مختلف زبان ها و حتی شناسایی زبان ها کمک می کند.به گزارش سیناپرس، کمپانی «متا» نوعی مدل زبانی هوش مصنوعی خلق کرده است که شباهتی به نرم افزار ChatGPT ندارد. پروژه «گفتار انبوه چند زبانه» (MMS) قادر است بیش از 4000 زبان گویش شده در جهان را شناسایی کرده و متن را به بیش از 1100 زبان گفتار تبدیل کند.
«متا» هم مانند سایر پروژه های هوش مصنوعی امروز به صورت open-source عمل می کند تا به حفظ تنوع زبانی و ایجاد انگیزه در محققان برای ساخت زبان براین اساس کمک کند. کمپانی «متا» معتقد است که امروزه مدل های خود را به طور عمومی به اشتراک گذاشته و کدگذاری می کنیم تا به این واسطه، سایر محققان بتوانند پروژه های تحقیقاتی خود را پیش ببرند. به این ترتیب، امیدواریم سهم کوچکی در حفاظت از تنوع زبانی در دنیا داشته باشیم.
تشخیص گفتار و مدل های تبدیل متن به گفتار مستلزم آموزش هزاران ساعت صدا همراه با برچسب های رونویسی شده است. این برچسب ها برای یادگیری ماشینی اهمیت بالایی برخوردارند و به الگوریتم ها اجازه می دهد داده ها را به درستی دسته بندی کنند.
«متا» از رویکردی غیرمتعارف برای جمع آوری داده های صوتی استفاده می کند که شامل بهره برداری از ضبط صوت های متون مذهبی ترجمه شده می شود.به گزارش سیناپرس، این کمپانی از رویکرد طبقه بندی زمانی پیوندگرا (CTC) استفاده می کنند که در مقایسه با مدل های زربانی بزرگ (LLM) یا مدل های متوالی، برای تشخیص گفتار بسیار محدودتر است.بعد از آموزش مدلی که داده های آن قابل استفاده تر باشد، «متا» از مدل «یادگیری ارائه گفتار خودنظارتی» استفاده می کند که می تواند روی داده های بدون برچسب آموزش ارائه دهد.
به گزارش سیناپرس، نتایج به دست آمده نشان می دهد: مدل های گفتار چندزبانه در مقایسه با مدل های موجود عملکرد خوبی دارند و 10 برابر بیشتر زبان ها را پوشش می دهند. به طور خاص، «متا» MMS را با سیستم whisper کمپانی OpenAI مقایسه کرد که فراتر از انتظارات بود.
یافته ها نشان می دهد: مدلی هایی که روی داده های MMS آموزش داده می شوند، به نصف میزان خطای کلمه می رسند با این تفاوت که MMS حدودا 11 برابر بیشتر زبان ها را پوشش می دهد. به گزارش سیناپرس، «متا» هشدار داده است که مدل های جدید دقیق نیستند و به عنوان مثال، این خطر وجود دارد که در مدل تبدیل گفتار به متن، کلمات و عبارت های انتخابی را اشتباه بنویسد.
کد مطلب: 406060