فرآیند یادگیری صحبت کردن به زبانهای مختلف بهشیوهای متفاوت از آن چیزی که ما زبان را یاد میگیریم، یکی از مباحث جذاب و داغ پیرامون GPT-3 است. به بیان دقیقتر، الگوریتم فوق بر مبنای صحبتهای محاورهای، یاد گرفته است که چگونه به زبانهای مختلف صحبت کند. اگر به آموزشگاههای یادگیری زبان یا به دوران مدرسه بازگردید، بهخوبی از این نکته اطلاع دارید که فرآیند یادگیری زبان و قواعد دستور زبان چارچوب مشخصی داشتند و ما یاد میگرفتیم که فاعل، مفهوم، فعل و سایر ارکان جملات را به چه صورتی در کنار یکدیگر قرار دهیم. با اینحال، GPT-3 زبانآموزی را بهشیوه دیگری انجام داده است و کارشناسان را غافلگیر کرده است. بهطوری که دانشمندان نحوه یادگیری زبان توسط این الگوریتم را با الگویی که انسانها مورد استفاده قرار میدهند مقایسه کردهاند و در ارزیابیهای اولیه به این نتیجهگیری کلی رسیدهاند که ممکن است رویکرد سادهتر و دقیقتری در زمینه یادگیری زبان وجود داشته باشد.
از منظر این دیدگاه، احتمالا کودکان هم باید یک الگوی دستور زبان در مغز خود داشته باشند که به آنها کمک میکند بر محدودیتهای تجربه زبانی خود غلبه کنند. بهعنوان مثال، این الگو ممکن است حاوی یک ابرقانون خاص باشد که نحوه افزودن بخشهای جدید به عبارات موجود را دیکته میکند. پس از آن مغز کودک بررسی میکند که آیا زبان مادری او با چیزی که ساخته مطابقت دارد یا خیر؟
به این شکل که مثلا کودک انگلیسیزبان با توجه به الگوی اصلی میداند که فعل قبل از مفعول قرار میگیرد، مثل I eat sushi در حالی که همان کودک اگر ملیت ژاپنی داشته باشد، طبق ابرقانون خود میداند که فعل بعد از مفعول در ژاپنی قرار میگیرد، بهطوریکه ساختار این جمله در ژاپنی میشود، I Sushi eat.
اما بینش جدید در مورد چگونگی یادگیری زبان از یک منبع خاص که احتمالا به ذهنتان هم خطور نکرده ناشی میشود و آن چیزی بهجز هوش مصنوعی نیست. در حقیقت، نسل جدیدی از مدلهای هوش مصنوعی میتوانند مقالات روزنامهها، اشعار و کدهای کامپیوتری را پس از قرار گرفتن در معرض حجم زیادی از دادههای زبانی بهعنوان ورودی یاد گرفته و بر مبنای آنها بنویسند. بخش شگفتآورتر ماجرا این است که تمامی این کارها برای هوش مصنوعی بدون کمک گرفتن از دستور زبان انجام میشود.
جملات صحیح و ساختاری بدون استفاده از دستور زبان
اگر انتخاب کلمات از سوی هوش مصنوعی گاهی عجیب، بیمعنا یا شامل سوگیریهای نژادپرستانه، جنسیتی و موارد دیگر باشد، یک موضوع بسیار واضح است؛ اکثریت قریب به اتفاق خروجی این مدلهای زبان هوش مصنوعی از نظر ساختاری و دستور زبان درست هستند. در حالی که هیچ الگوی دستوری یا قاعده زبانی به آنها داده نشده و آنها تنها به تجربه زبانی تکیه میکنند تا عبارات صحیحی را بهعنوان خروجی ارائه دهند.
یکی از شناختهشدهترین و جدیدترین مدلهای هوش مصنوعی که حسابی سروصدا کرده، GPT- 3 است که یک شبکه عصبی یادگیری عمیق عظیم است که بیش از 175 میلیارد پارامتر دارد. متخصصان و پژوهشگران در روند آموزش این هوش مصنوعی صدها میلیارد کلمه از اینترنت، کتاب و ویکیپدیا را بهعنوان ورودی در اختیار او قرار دادند و از هوش مصنوعی درخواست کردند از آنچه یاد گرفته برای پیشبینی کلمه بعدی در یک جمله استفاده کند. در همین راستا هنگامی که هوش مصنوعی پیشبینی اشتباهی انجام میداد، پارامترهای آن با استفاده از یک الگوریتم یادگیری خودکار تنظیم میشدند تا بتوانند با خطای کمتر کلمه بعدی را پیشبینی کند.
نکته قابل توجه این است که GPT-3 میتواند متن قابل باوری را در واکنش به جملاتی مانند «خلاصهای از آخرین فیلم سریع و خشن» یا «یک شعر به سبک امیلی دیکنسون» تولید کند. همچنین،GPT-3 توانایی انجام مقایسه در سطح SAT (آزمون صلاحیت تحصلی)، پرسشهای درک مطلب و حتا انجام مسائل ساده ریاضی را دارد که تمامی آنها را بر مبنای رویکرد یادگیری بهشیوه پیشبینی کلمه بعدی آموخته است.
مقایسه مدلهای هوش مصنوعی و مغز انسان
با این حال، شباهت عبارات تولیدشده توسط هوش مصنوعی با زبان انسان به همینجا ختم نمیشود. تحقیقات منتشرشده در مجله Nature Neuroscience نشان میدهد که شبکههای مصنوعی یادگیری عمیق مثل GPT-3 از اصول محاسباتی یکسان با مغز انسان استفاده میکنند. ابتدا، یک گروه تحقیقاتی به سرپرستی عصبشناس معروف اوری هاسون (Uri Hasson)، کلمه بعدی پیشبینیشده توسط هوش مصنوعی GPT-2 (برادر کوچک GPT-3) و انسانها را در یک داستان برگرفته از پادکست «این زندگی آمریکایی» مورد مقایسه قرار دادند. نتیجه این شد که مغز انسان و هوش مصنوعی تقریبا در 50 درصد مواقع دقیقا همان کلمه را پیشبینی کردند.
محققان، فعالیت مغزی داوطلبان را در حین گوش دادن به این داستان ثبت کردند. بهترین توضیح آنها در مورد الگوهای فعالسازی که مشاهده کردند، این بود که مغز افراد همانند GPT-2 در هنگام پیشبینی فقط از یک یا دو کلمه قبلی استفاده نمیکند، بلکه به بسترمعنایی 100 کلمه قبلی متکی است. در مجموع، نویسندگان مقاله اینگونه نتیجهگیری کردند که یافتههای آنها در خصوص سیگنالهای عصبی پیشبینیکننده و فیالبداهه در زمانی که شرکتکنندگان به صحبتهای معمولی گوش میدهند، نشان میدهد پیشبینی فعال میتواند زمینه یادگیری مادامالعمر زبان در انسان را فراهم کند.
موضوع جالب توجه دیگری در مورد مدلهای زبانی جدید هوش مصنوعی که مبتنی بر ورودیهای زیاد هستند و از دادهها برای تغذیه آنها استفاده میشود، وجود دارد؛ GPT-3 با تجربه زبانی معادل 20000 هزار سال آموزش دیده است. اما یک مطالعه اولیه که هنوز بهطور کامل قابل استناد نیست، نشان میدهد که GPT-2 میتواند پیشبینیهای کلمه بعدی و فعالسازی نورونهای عصبی را حتا زمانی که تنها با 100 میلیون کلمه آموزش دیده، مدلسازی کند. این مقدار ورودی زبانی معادل با میانگین کلماتی است که یک کودک در طول 10 سال اول زندگی خود میشنود.
البته، ما ادعا نمیکنیم که GPT-3 یا GPT-2، زبان را دقیقا مانند کودکان یاد میگیرند، زیرا بهنظر میرسد این مدلهای هوش مصنوعی چیز زیادی از آنچه میگویند درک نمیکنند، در حالی که ادارک یکی از ارکان اصلی در صحبتهای انسانها است. با این حال، موضوع مهمی که این مدلها ثابت میکنند این است که یک زبانآموز ماشینی که زیربنای آن صفرها و یکها هستند، این توانایی را دارد تا از طریق دریافت جملات اولیهای که برای صحبت کردن مورد نیاز است، صحبت کردن را یاد بگیرد و جملات گرامری کاملا خوبی تولید کند و این کار را به روشی شبیه پردازش کلمات در مغز انسان انجام دهد.
بازنگری در یادگیری زبان
سالها زبانشناسان بر این باور بودند که یادگیری زبان بدون یک الگوی دستور زبان ذاتی غیرممکن است، اما مدلهای جدید هوش مصنوعی خلاف آن را ثابت میکنند. این مدلها نشان میدهند که ساخت جملاتی را که بهلحاظ دستور زبانی صحیح باشند میتوان تنها با استفاده از تجربه زبانی آموخت. به همین دلیل میتوان مدعی شد که کودکان برای یادگیری زبان نیازی به دستور زبان ذاتی ندارند. در مقابل، کودکان باید تا آنجایی که ممکن است در معرض مکالمات ردوبدلشده میان افراد باشند تا به آنها کمک کند مهارتهای زبانی خود را توسعه دهند. اکنون، پژوهشگران این فرضیه را مطرح میکنند که ممکن است تجربه زبانی و نه دستور زبان، کلید تبدیل شدن به فردی باشد که قادر است زبان را بهدرستی یاد بگیرد.
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟