تجربه زبانی در مقابل دستور زبان
هوش مصنوعی درک ما از یادگیری زبان را تغییر می‌دهد
برخلاف گفت‌وگوها و مکالماتی که در بیشتر کتاب‌ها و فیلم‌ها به‌دقت نوشته شده‌اند، زبان محاوره‌ای روزمره ما معمولا غیرساخت‌یافته و ناقص، مملو از جمله‌‌هایی با شروع‌ نادرست و وقفه‌های غیرضروری هستند. این موضوع هر نوع گفت‌گویی از گپ‌های معمولی بین دوستان، مشاجره بین خواهر و برادر، بحث‌های رسمی در اتاق هیئت‌مدیره و صحبت‌های همزمان را شامل می‌شود. با توجه به ماهیت تصادفی و تجربی زبان، معجزه‌آسا به نظر می‌رسید که برخی افراد، به‌ویژه کودکان در سنین پایین تنها به‌شکل تجربی صحبت کردن را یاد می‌گیرند. به همین دلیل، بسیاری از دانشمندان حوزه زبان‌شناسی از جمله نوام چامسکی، بنیان‌گذار زبان‌شناسی مدرن معتقدند که زبان‌آموزان برای مهار ماهیت سرکش زبان روزمره، به نوعی اتصال‌‌دهنده نیاز دارند و آن اتصال‌دهنده، دستور زبان است که سیستمی از قوانین برای ساخت جملات دستوری ساخت‌یافته است. GPT-3 یکی از داغ‌ترین بحث‌های روز دنیای فناوری است، زیرا این الگوریتم هوشمند نه‌تنها به کاربران در انجام کارهای‌شان کمک می‌کند، بلکه در حال تغییر برخی از مفاهیم زیربنایی است که در طول سال‌های گذشته تصور می‌کردیم درست مطلق هستند.

فرآیند یادگیری صحبت کردن به زبان‌های مختلف به‌شیوه‌ای متفاوت از آن چیزی که ما زبان را یاد می‌گیریم، یکی از مباحث جذاب و داغ پیرامون GPT-3 است. به بیان دقیق‌تر، الگوریتم فوق بر مبنای صحبت‌های محاوره‌ای، یاد گرفته است که چگونه به زبان‌های مختلف صحبت کند. اگر به آموزشگاه‌های یادگیری زبان یا به دوران مدرسه بازگردید، به‌خوبی از این نکته اطلاع دارید که فرآیند یادگیری زبان و قواعد دستور زبان چارچوب مشخصی داشتند و ما یاد می‌گرفتیم که فاعل، مفهوم، فعل و سایر ارکان جملات را به چه صورتی در کنار یک‌دیگر قرار دهیم. با این‌حال، GPT-3 زبان‌آموزی را به‌شیوه دیگری انجام داده است و کارشناسان را غافل‌گیر کرده است. به‌طوری که دانشمندان نحوه یادگیری زبان توسط این الگوریتم را با الگویی که انسان‌ها مورد استفاده قرار می‌دهند مقایسه کرده‌اند و در ارزیابی‌های اولیه به این نتیجه‌گیری کلی رسیده‌اند که ممکن است رویکرد ساده‌تر و دقیق‌تری در زمینه یادگیری زبان وجود داشته باشد. 

از منظر این دیدگاه، احتمالا کودکان هم باید یک الگوی دستور زبان در مغز خود داشته باشند که به آن‌ها کمک می‌کند بر محدودیت‌های تجربه زبانی خود غلبه کنند. به‌عنوان مثال، این الگو ممکن است حاوی یک ابرقانون خاص باشد که نحوه افزودن بخش‌های جدید به عبارات موجود را دیکته می‌کند. پس از آن مغز کودک بررسی می‌کند که آیا زبان مادری او با چیزی که ساخته مطابقت دارد یا خیر؟

‌ به این شکل که مثلا کودک انگلیسی‌زبان با توجه به الگوی اصلی می‌داند که فعل قبل از مفعول قرار می‌گیرد، مثل I eat sushi در حالی که همان کودک اگر ملیت ژاپنی داشته باشد، طبق ابرقانون خود می‌داند که فعل بعد از مفعول در ژاپنی قرار می‌گیرد، به‌طوری‌که ساختار این جمله در ژاپنی می‌شود، I Sushi eat.

مطلب پیشنهادی

هوش مصنوعی از طریق کاوش در جهان‌های مجازی آموزش می‌بیند
محیط‌های شبیه‌سازی در خدمت الگوریتم‌های هوشمند

اما بینش جدید در مورد چگونگی یادگیری زبان از یک منبع خاص که احتمالا به ذهن‌تان هم خطور نکرده ناشی می‌شود و آن چیزی به‌جز هوش مصنوعی نیست. در حقیقت، نسل جدیدی از مدل‌های هوش مصنوعی می‌توانند مقالات روزنامه‌‌ها، اشعار و کدهای کامپیوتری را پس از قرار گرفتن در معرض حجم زیادی از داده‌های زبانی به‌عنوان ورودی یاد گرفته و بر مبنای آن‌ها بنویسند. بخش شگفت‌آورتر ماجرا این است که تمامی این کارها برای هوش مصنوعی بدون کمک گرفتن از دستور زبان انجام می‌شود.

جملات صحیح و ساختاری بدون استفاده از دستور زبان

اگر انتخاب کلمات از سوی هوش مصنوعی گاهی عجیب، بی‌معنا یا شامل سوگیری‌های نژادپرستانه، جنسیتی و موارد دیگر باشد، یک موضوع بسیار واضح است؛ اکثریت قریب به اتفاق خروجی این مدل‌های زبان هوش مصنوعی از نظر ساختاری و دستور زبان درست هستند. در حالی که هیچ الگوی دستوری یا قاعده‌ زبانی به آن‌ها داده نشده و آن‌ها تنها به تجربه زبانی تکیه می‌کنند تا عبارات صحیحی را به‌عنوان خروجی ارائه دهند. 

 یکی از شناخته‌شده‌ترین و جدیدترین مدل‌های‌ هوش مصنوعی که حسابی سروصدا کرده، GPT- 3 است که یک شبکه عصبی یادگیری عمیق عظیم است که بیش از 175 میلیارد پارامتر دارد. متخصصان و پژوهش‌گران در روند آموزش این هوش مصنوعی صدها میلیارد کلمه از اینترنت، کتاب و ویکی‌پدیا را به‌عنوان ورودی در اختیار او قرار دادند و از هوش مصنوعی درخواست کردند از آن‌چه یاد گرفته برای پیش‌بینی کلمه بعدی در یک جمله استفاده کند. در همین راستا هنگامی که هوش مصنوعی پیش‌بینی اشتباهی انجام می‌داد، پارامترهای آن با استفاده از یک الگوریتم یادگیری خودکار تنظیم می‌شدند تا بتوانند با خطای کمتر کلمه‌ بعدی را پیش‌بینی کند.

نکته قابل توجه این است که GPT-3 می‌تواند متن قابل باوری را در واکنش به جملاتی مانند «خلاصه‌ای از آخرین فیلم سریع و خشن» یا «یک شعر به سبک امیلی دیکنسون» تولید کند. همچنین،GPT-3  توانایی انجام مقایسه در سطح SAT  (آزمون صلاحیت تحصلی)، پرسش‌های درک مطلب و حتا انجام مسائل ساده‌ ریاضی را دارد که تمامی آن‌ها را بر مبنای رویکرد یادگیری به‌شیوه‌ پیش‌بینی کلمه بعدی آموخته است.

مقایسه مدل‌های هوش مصنوعی و مغز انسان

با این حال، شباهت عبارات تولیدشده توسط هوش مصنوعی با زبان انسان به همین‌جا ختم نمی‌شود. تحقیقات منتشرشده در مجله Nature Neuroscience نشان می‌دهد که شبکه‌های مصنوعی یادگیری عمیق مثل GPT-3 از اصول محاسباتی یکسان با مغز انسان استفاده می‌کنند. ابتدا، یک گروه تحقیقاتی به سرپرستی عصب‌شناس معروف اوری هاسون (Uri Hasson)، کلمه بعدی پیش‌بینی‌شده توسط هوش مصنوعی GPT-2 (برادر کوچک GPT-3) و انسان‌ها را در یک داستان برگرفته از پادکست «این زندگی آمریکایی» مورد مقایسه قرار دادند. نتیجه این شد که مغز انسان و هوش مصنوعی تقریبا در 50 درصد مواقع دقیقا همان کلمه را پیش‌بینی کردند.

محققان، فعالیت مغزی داوطلبان را در حین گوش دادن به این داستان ثبت کردند. بهترین توضیح آن‌ها در مورد الگوهای فعال‌سازی که مشاهده کردند، این بود که مغز افراد همانند GPT-2 در هنگام پیش‌بینی فقط از یک یا دو کلمه قبلی استفاده نمی‌کند، بلکه به بسترمعنایی 100 کلمه قبلی متکی است. در مجموع، نویسندگان مقاله این‌گونه نتیجه‌گیری کردند که یافته‌های آن‌ها در خصوص سیگنال‌های عصبی پیش‌بینی‌کننده و فی‌البداهه در زمانی که شرکت‌کنندگان به صحبت‌های معمولی گوش می‌دهند، نشان می‌دهد پیش‌بینی فعال می‌تواند زمینه یادگیری مادام‌العمر زبان در انسان را فراهم کند.

موضوع جالب توجه دیگری در مورد مدل‌های زبانی جدید هوش مصنوعی که مبتنی بر ورودی‌های زیاد هستند و از داده‌ها برای تغذیه آن‌ها استفاده می‌شود، وجود دارد؛ GPT-3 با تجربه زبانی معادل 20000 هزار سال آموزش دیده است. اما یک مطالعه اولیه که هنوز به‌طور کامل قابل استناد نیست، نشان می‌دهد که GPT-2 می‌تواند پیش‌بینی‌های کلمه بعدی و فعال‌سازی نورون‌های عصبی را حتا زمانی که تنها با 100 میلیون کلمه آموزش دیده، مدل‌سازی کند. این مقدار ورودی زبانی معادل با میانگین کلماتی است که یک کودک در طول 10 سال اول زندگی خود می‌شنود.

البته، ما ادعا نمی‌کنیم که GPT-3 یا GPT-2، زبان را دقیقا مانند کودکان یاد می‌گیرند، زیرا به‌نظر می‌رسد این مدل‌های هوش مصنوعی چیز زیادی از آن‌چه می‌گویند درک نمی‌کنند، در حالی که ادارک یکی از ارکان اصلی در صحبت‌های انسان‌ها است. با این حال، موضوع مهمی که این مدل‌ها ثابت می‌کنند این است که یک زبان‌آموز ماشینی که زیربنای آن صفرها و یک‌ها هستند، این توانایی را دارد تا از طریق دریافت جملات اولیه‌ای که برای صحبت کردن مورد نیاز است، صحبت کردن را یاد بگیرد و جملات گرامری کاملا خوبی تولید کند و این کار را به روشی شبیه پردازش کلمات در مغز انسان انجام دهد.

بازنگری در یادگیری زبان

سال‌ها زبان‌شناسان بر این باور بودند که یادگیری زبان بدون یک الگوی دستور زبان ذاتی غیرممکن است، اما مدل‌های جدید هوش مصنوعی خلاف آن را ثابت می‌کنند. این مدل‌ها نشان می‌دهند که ساخت جملاتی را که به‌لحاظ دستور زبانی صحیح باشند می‌توان تنها با استفاده از تجربه‌ زبانی آموخت. به همین دلیل می‌توان مدعی شد که کودکان برای یادگیری زبان نیازی به دستور زبان ذاتی ندارند. در مقابل، کودکان باید تا آن‌جایی که ممکن است در معرض مکالمات ردوبدل‌شده میان افراد باشند تا به آن‌ها کمک کند مهارت‌های زبانی خود را توسعه دهند. اکنون، پژوهشگران این فرضیه را مطرح می‌کنند که ممکن است تجربه زبانی و نه دستور زبان، کلید تبدیل شدن به فردی باشد که قادر است زبان را به‌درستی یاد بگیرد.

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه     
ثبت اشتراک نسخه آنلاین

 

کتاب الکترونیک +Network راهنمای شبکه‌ها

  • برای دانلود تنها کتاب کامل ترجمه فارسی +Network  اینجا  کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

  • اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

ایسوس

نظر شما چیست؟