گروهی از پژوهشگران دانشگاههای راجرز، کارولینای شمالی، لیهای و دانشگاه هنگ کنگ موفق به ابداع تکنیکی شدند که به شبکههای عصبی اجازه میدهد تنها از طریق توضیحات متنی که در اختیارش قرار میگیرد تصاویری با تفکیکپذیری بالا را ایجاد کند. ساخت تصاویری واقعگرایانه از توضیحات متنی کاربردهای فراوانی دارد.
ها نژانگ در این ارتباط گفته است: «روشهایی که در گذشته برای ساخت تصاویری با وضوح بالا مورد استفاده قرار میگرفت با مشکلات مختلفی روبرو بود. به طور مثال، تصاویر فاقد جزییات بودند و همچنین امکان ترکیب تصاویر در بیشتر موارد به دلیل فقدان جزییات به سختی امکانپذیر بود. اما الگوریتم یادگیری عمیق ما موسوم به StackGAN برای اولین بار موفق شد یک تصویر 256 در 256 پیکسل را با جزییات واقعی ایجاد کند.» این گروه همچنین ویدیویی از بخشی از فعالیتهای خود را منتشر کردهاند که نشان میدهد الگوریتم فوق به بهترین شکل ممکن موفق شده است این کار را انجام دهد.
سولنی فهر، از پژوهشگران این تیم تحقیقاتی در این ارتباط گفته است: «برای سالهای مستمر، ما شبکههای عصبی را به منظور انجام وظایفی همچون تشخیص چهره، تشخیص علایم ترافیکی و تشخیص دستخط آموزش دادیم. در حالت کلی، از میلیونها نمونه آموزشی استفاده کردیم تا به شبکههای عصبی نشان دهیم چگونه باید اینکار را انجام دهند، چگونه از کاری که موفق به انجام آن شدهاند نکاتی را یاد بگیرند و از تجاربی که به دست آوردهاند در کارهای مشابه آینده استفاده کنند. اما رویکرد ما در ارتباط با این پروژه به طور کامل متفاوت بود. در این پروژه ما به دنبال آن هستیم تا به شبکههای عمیق نکات ویژهای را آموزش دهیم. همچنین، انتظار داریم که آنها پس از آنکه آموزشهای لازم را فرا گرفتند این توانایی را داشته باشند تا یکسری فعالیتهای ترکیبی نوین همچون ساخت تصاویر از روی یک قطعه متن را به شکل قابل اعتمادی مدیریت کنند. این شبکههای عمیق باید این پتانسیل را داشته باشند تا توضیحاتی که برای آنها مینویسیم را به یک تصویر تبدیل کنند. این رویکرد عصر نوینی را در ارتباط با ظرفیتهای هوش مصنوعی در اختیار ما قرار خواهد داد. من هیجان زده هستم که مشاهده میکنم، پژوهشگران این تیم در حال کار روی مفهومی هستند که به آینده تعلق دارد و من نیز جزیی از این گروه هستم.»
در حالی که در گذشته نیز نمونههای کاملا تاثیرگذاری در این ارتباط همچون ماشین کابوس شبانه موسسه فناوری ماساچوست (MIT’s Nightmare Machine) یا الگوریتمهایی که با نگاه کردن به یک تصویر از یک ویدیو قادر به پیشبینی فیلم بودند را مشاهده کرده بودیم، اما بدون شک خلاقیتهای محاسباتی به کار رفته در پروژه اخیر نیز به همان اندازه جذاب و کاربردی است. جذاب بودن این پروژه به این دلیل است که از دو مرحله کشیدن و ساخت تصویر استفاده میکند. درست شبیه به الگویی که هنرمندان طراح از آن استفاده کرده و تصاویر خود را در دو مرحله رسم میکنند. به طوری که جزییات مربوط به رسم خود را در مرحله دوم به طرح اضافه میکنند.
البته اینگونه به نظر میرسد که هنوز هم راه طولانی را به منظور جایگزین کردن روباتها به جای طراحان انسانی پیش رو داریم. اما بدون شک دستاورد اخیر یک گام مهم در این زمینه برداشته است.
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟