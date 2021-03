اگر صاحب گربه هستید، احتمالا با اپلیکیشن‌هایی که مدعی ترجمه‌ی صدای گربه هستند، روبرو شده‌اید. اما آیا واقعا این اپلیکیشن‌های مترجم صدای گربه کارایی دارند؟ در پاسخ به این پرسش باید بگوییم که این ادعا تا حدی صحت دارد. بخشی از پیچیدگی قضیه به منحصر به فرد بودن زبان هر گربه برمی‌گردد اما به لطف فناوری‌های جدید، در این زمینه پیشرفت‌های قابل توجهی صورت گرفته که در ادامه به این موضوع می‌پردازیم.

تشخیص گفتار و یادگیری ماشینی

تشخیص گفتار به زبان ساده مبتنی بر ضبط گفتار موردنظر و تبدیل آن به یک فایل دیجیتالی است. سپس نرم‌افزار بخش‌هایی از این فایل را کدگذاری و تحلیل می‌کند تا بتواند منظور فرد را متوجه شود. این کدگذاری‌ها با توجه به صدای پس‌زمینه و نحوه‌ی صحبت کردن فرد بسیار متفاوت محسوب می‌شود.

ما گاهی اوقات تکنولوژی تشخیص صدا را یک امر بدیهی در نظر می‌گیریم اما باید بگوییم که یک شاهکار در حوزه‌ی تکنولوژی به حساب می‌آید. روی هم رفته هر کلمه شامل طیف گسترده‌ای از صداها یا آواها است که با یکدیگر ترکیب می‌شوند و در نتیجه کامپیوتر برای تشخیص و درک گفتار انسان باید فرایند بسیار پیچیده‌ای را پشت سر بگذارد. از طرف دیگر، تشخیص صدای گربه از این هم سخت‌تر به نظر می‌رسد.

اپلیکیشن‌های فعال در حوزه‌ی تشخیص گفتار از مجموعه داده یا دیتاست استفاده می‌کنند که از میلیون‌ها کلمه تشکیل شده است. سپس این اپلیکیشن تلاش می‌کند گفتار شما را با نزدیک‌ترین کلمات ذخیره شده در بانک اطلاعاتی خود تطبیق دهد. زمانی که مرتکب اشتباه می‌شود و شما آن را اصلاح می‌کنید، داده‌های جدید را برای دفعه‌ی بعدی ذخیره می‌کند. این فرایند بخشی از یادگیری ماشینی محسوب می‌شود.

سیستم‌های تشخیص صدا هنوز مشکلات مختلفی دارد که این مشکلات برای افراد دچار اختلال گفتاری و لهجه بیشتر است. با این حال، سیستم‌های تشخیص گفتار روزبه‌روز بهتر می‌شوند. اما در نهایت سوالی که مطرح می‌شود این است که آیا این رویکرد برای اپلیکیشن‌های مترجم صدای گربه هم جواب می‌دهد؟

تشخیص گفتار انسان در برابر تشخیص صدای گربه

اول از همه باید درک کنیم چرا ترجمه‌ی نوع خاصی از صدای گربه به «من گرسنه هستم» با تجزیه و تحلیل گفتار انسان تفاوت دارد. از طرف دیگر، مشکل بزرگ‌تر این است که گربه‌ها تا حد زیادی با نشانه‌های غیرکلامی مانند حالت بدن خود، پیام را منتقل می‌کنند. همچنین باید به فقدان زبان بین‌المللی گربه‌ها هم اشاره کنیم.

روی هم رفته، کارشناسان می‌گویند که صدای گربه باید به همراه حالت بدن و شرایط موردنظر بررسی شود. در ضمن هر گربه‌ای زبان خاص خود را دارد. طبق بررسی‌های صورت گرفته، گربه‌ها زبان شخصی‌سازی شده برای صاحبان خود را ایجاد می‌کنند. بنابراین با توجه به این محدودیت‌ها، اپلیکیشن‌های مترجم صدای گربه چگونه می‌توانند برای تمام گربه‌ها انجام وظیفه کنند؟

یادگیری ماشینی انعطاف‌پذیر برای گربه‌ها

اگرچه چند دستیار مجازی مانند Oto برای درک لحن و احساس ارائه شده‌اند، اما سیستم‌های تشخیص گفتار در زمینه‌ی سیگنال‌های غیرکلامی هنوز عملکرد خوبی ندارند. اما این موضوع به معنای غیرممکن بودن تفسیر این اطلاعات نیست.

یکی از اپلیکیشن‌های مترجم صدای گربه MeowTalk نام دارد که که برای غلبه بر این مشکلات، از نوعی یادگیری ماشینی انعطاف‌پذیر بهره می‌برد. این اپلیکیشن توسط خاویر سانچز توسعه پیدا کرده که یکی از اعضای تیم دستیار هوشمند الکسا از شرکت آمازون بوده است. به نظر او، این اپلیکیشن یک گام در راستای حرکت به سمت قلاده‌های هوشمند به حساب می‌آید. این قلاده‌ها قرار است با بهره‌گیری از الگوریتم‌های بسیار پیشرفته، به انسان‌ها برای درک بهتر گربه‌های خود کمک کنند.

در این اپلیکیشن، برای هر گربه باید پروفایل جداگانه‌ای ایجاد کنید. طبق پژوهش‌های صورت گرفته، صدای یک بچه گربه با صدای گربه‌ی بزرگسال تفاوت دارد و به همین خاطر اپلیکیشن از شما می‌خواهد که تاریخ تولد گربه‌ی موردنظر را هم وارد کنید. هر پروفایل یک شبکه‌ی داده منحصر به فرد برای گربه ایجاد می‌کند.

در ابتدا، این اپلیکیشن کار خود را با ۱۰ پروفایل صدا آغاز می‌کند که هرکدام نشان‌دهنده‌ی معناهای مختلف مانند «شاد بودن» یا «حالت شکار» هستند. زمانی که اپلیکیشن صدایی را می‌شنود و اشتباه تشخیص می‌دهد، می‌توانید آن را اصلاح کنید یا اینکه پروفایل جدیدی برای صدای موردنظر ایجاد کنید.

سیستم‌های یادگیری ماشینی مربوط به اپلیکیشن‌های تشخیص گفتار معمولا در برابر این اصلاحات مقاومت می‌کنند. اما یادگیری ماشینی انعطاف‌پذیر این اپلیکیشن به کاربران اجازه می‌دهد که به راحتی اصلاحات زیادی را اعمال کنند. به مرور زمان و با اصلاح و اضافه کردن صداهای مختلف، می‌توانید یک پروفایل شخصی‌سازی شده برای گربه‌ی خود را ایجاد کنید.

آیا اپلیکیشن‌های مترجم صدای گربه واقعا کار می‌کنند؟

در نهایت، عملکرد این نوع اپلیکیشن‌ها تا حد زیادی به خود کاربر بستگی دارند زیرا باید نحوه‌ی صحبت کردن گربه‌ی خود را به اپلیکیشن آموزش دهند. با توجه به اینکه گربه‌ها زبان یکسانی ندارند، این رویکرد تغییر چندانی نخواهد داشت.

اما این واقعیت که یادگیری ماشینی تا این حد پیشرفت کرده و می‌تواند حتی تا حدی در این زمینه موفق باشد، باورنکردنی است. یادگیری ماشینی و دیگر حوزه‌های هوش مصنوعی با سرعت فوق‌العاده‌ای روزبه‌روز بهتر می‌شوند و طی سال‌های آینده، پیشرفت‌های هیجان‌انگیزی را امکان‌پذیر می‌کنند.

هوش مصنوعی در ۲۰ سال آینده چه شغل‌هایی را نابود می‌کند؟

منبع: MakeUseOf

The post اپلیکیشن‌های مترجم صدای گربه چگونه کار می‌کنند؟ appeared first on دیجی‌کالا مگ.

منبع متن: digikala