جهت یابی گوینده در محیط های نویزی؛ یک سیستم شنوایی ربات به نام "آوا"

 


 پژوهشگر: احسان صفاری

اساتید راهنما: دکتر علی مقداری، دکتر بهرام وزیرنژاد، دکتر مینو عالمی

ربات­های اجتماعی برای زندگی در جامعه­ی انسان­ها طراحی می­شوند، لذا قابلیت برقراری ارتباط با انسان­ها از مهمترین مسائل در طراحی آنها خواهد بود. برای آنکه یک ربات اجتماعی بتواند از نظر درک شنوایی قابلیت­هایی شبیه به یک انسان داشته باشد، جهت­یابی منبع صوتی قابلیتی پایه برای آن به حساب می­آید. یک ربات اجتماعی در حین برقراری تعامل گفتاری با انسان می­بایست موقعیت سر خود را به نحوی تغییر دهد که بتواند صوت دریافتی را بهتر بشنود و گفتار را بهتر بازشناسی کند. همچنین این کار می­تواند در راستای تعامل طبیعی ربات با انسان باشد. در نتیجه جهت­یابی منبع صوتی در ربات­های اجتماعی و به طور دقیق­تر جهت­یابی گوینده از مهمترین مسائل در برقراری تعامل گفتاری ربات با انسان به شمار می­آید.

ربات "آوا"، یک سیستم شنوایی ربات است که قادر خواهد بود پس از شناسایی مقاطع گفتار در یک محیط نویزی، گوینده را در فضای اتاق جهت­یابی کند. همچنین این ربات ساخته شده می­تواند به منظور ایجاد تعامل طبیعی با شخص و بازشناسی بهتر گفتار، به سمت گوینده جهت­گیری نماید. این سیستم مجهز به دو میکروفن­ می­باشد که به طور دقیق بر روی فرم گوش مصنوعی قرار گرفته است. همچنین با استخراج زوایای مورد نظر، یک ربات دو درجه آزادی فعال دورانی، جهت­گیری فضایی را امکان­پذیر می­کند.

ربات "آوا" می­تواند، یک گوینده­ی فعال را در فضای نویزی اتاق جهت­یابی کند. مسایلی که در این ربات مورد بررسی قرار گرفته است، عبارت است از:

  • شناسایی و تفکیک مقاطع گفتار در یک محیط نویزی، به این مفهوم که الگوریتم گفتار انسان را از صداهای دیگر موجود در زمینه تفکیک و به شناسایی جهت گفتار بپردازد.
  • بررسی الگوریتم­های جهت­یابی منبع صوتی به منظور پوشش فضایی و فرکانسی گفتار، به گونه­ای که عملکرد سیستم در شرایط محیطی متفاوت با کمترین خطا همراه باشد.
  • بررسی اثرات چرخش ربات و نویز موتور­ها بر روی جهت­یابی گوینده.
  • طراحی مسیر چرخش ربات و کنترل موقعیت دورانی آن به منظور تعامل طبیعی با گوینده.

هدف اصلی این ربات، بررسی قابلیت پایه در سیستم شنوایی؛ یعنی جهت­یابی گوینده، برای ربات­های انسان­نمای اجتماعی بوده است. لذا چنانچه الگوریتم­های نوشته شده برای این ربات، بر روی برد­های الکترونیکی بارگذاری شود، می­تواند بخش مهمی از یک ربات انسان­نمای اجتماعی را فراهم سازد.

همچنین با اضافه کردن یک دوربین به جای سر ربات، می­توان از این ربات به عنوان یک دوربین متحرک و هوشمند در یک جلسه و یا ویدئوکنفرانس استفاده کرد. بدین صورت که این دوربین قادر خواهد بود تا به طور خودکار به سمت هر گوینده­ای که در حال صحبت کردن باشد، جهت گیری کرده و وی را نشان دهد. 

دعوت به همکاری

شرکت رباتیک اجتماعی آوا و نیما (دکتر ربات)، از همه ی علاقه مندان به فعالیت در زمینه ی رباتیک اجتماعی و شناختی تحت عنوان کارآموز، همکار پاره وقت و همکاری پروژه ای، دعوت به همکاری می نماید.

تماس با ما

  • تلفن: ۳۳۷۱۷۵۹۱-۰۲۱
  • موبایل: ۰۹۱۲۱۴۶۵۶۱۱ (مهندس سلطانی)
  • ایمیل: info@DrRobot.ir
  • نشانی: تهران، پیروزی، خیابان مخبر شمالی، خیابان شهید تاجیک، پلاک ۱۲۸، واحد ۱.
  • کد پستی: ۹۷۳۶۱-۱۷۶۹۸

درباره ما

 

شرکت دانش بنیان رباتیک اجتماعی آوا و نیما (سهامی خاص)

با پشتوانه علمی و تخصصی گروهی از اساتید و فارغ

التحصیلان دانشگاه صنعتی شریف و دیگر دانشگاه های

برتر کشور، فعالیت خود را در زمینه رباتیک اجتماعی و

شناختی در سال ۱۳۹۴ آغاز نموده است.

 

بالا