آخرین مطالب

تفاوت میان حرف زدن و فکر کردن

شاید بتوان با بررسی عملکرد مغز انسان توضیح داد که چرا نرم‌افزارهای هوش مصنوعی در نوشتن متون بی‌معنا از نظر گرامری مهارت زیادی دارند.

معمولاً از زبان به عنوان “وسیله” تفکر یاد می‌شود و می‌گوییم انسان افکارش را به زبان می‌آورد و یا رشته افکارش را دنبال می‌کند. از برخی از برترین ساخته‌های انسان – موزیک، هندسه، برنامه نویسی کامپیوتری – به عنوان زبان یاد می‌شود. فرض بر این است که مغز، دنیا و تجربیاتی که از آن به دست می‌آورد را از طریق تسلسل کلمات پردازش می‌کند. و این ارتباط فرضی بین زبان و تفکر، یکی از مهم‌ترین دلایلی است که ChatGPT و نرم‌افزارهای مشابه را از نظر ما بسیار عجیب کرده‌اند: ممکن است توانایی هوش مصنوعی به پاسخ دادن به هر پرس و جویی که با زبان انسانی انجام می‌شود، باعث ایجاد این تصور شود که این ماشین‌ها منظور و حتی احساس دارند.

اما بعداً این نرم‌افزار ادعای عجیبی مطرح کرد – اینکه کلمه nineteen دارای 12 حرف است یا اینکه بادبان‌ماهی‌ها پستاندار هستند – و همه چیز آشکار شد. با اینکه ChatGPT توانایی تولید نثر روان و گاهی موزون را داشت و به راحتی می‌توان تست تورینگ را که برای بیش از 70 سال، عرصه هوش مصنوعی را درگیر کرده بود، پشت سر بگذارد، باز هم روزبروز کم هوشی و حتی خطرناکی آن آشکارتر می‌شد. این هوش مصنوعی در درک ریاضیات دچار اشتباه می‌شد، توانایی ارایه دستور پخت ساده‌ترین شیرینی‌ها را نداشت و حتی سوگیری‌های بسیار شگفت آوری از خود نشان می‌داد. در یک مقاله جدید، محققان علوم شناختی و زبان شناسان، با تفکیک ارتباط از طریق زبان و عمل فکر کردن، به این ناهنجاری پرداختند. به گفته آنها داشتن یکی از این دو قابلیت، دلیلی بر داشتن دیگری نیست. در شرایطی که محققان متمرکز بر قابلیت‌های هوش مصنوعی مولد برای ایجاد تحول در همه جنبه‌های زندگی و کار ما شده‌اند، با این استدلال، باید محدودیت‌ها و پیچیدگی‌های هوش مصنوعی و هوش انسانی را یک بار دیگر ارزیابی کنند.

محققان توضیح دادند که ممکن است کلمات نتوانند به خوبی افکار را توصیف کنند. به هر حال انسان‌ها خودشان را به صورت تداوم انتقال از تفکر بصری به شفاهی می‌شناسند؛ ناتوانی در بیان یک ایده در قالب افکار، تجربه‌ای ملموس است. به گفته آنا ایوانووا عصب شناس شناختی در دانشگاه MIT که یکی از دو نویسنده ارشد این مطالعه بوده تحقیقات معاصر روی مغز انسان هم نشان می‌دهند که “زبان از تفکر مجزا است.” اسکن مغزی افرادی از ده‌ها زبان مختلف وجود شبکه‌ای خاص از نرون‌ها را نشان داد که مستقل از نوع زبان مورد استفاده (از جمله زبان‌های ساختگی مثل ناوی و دوتراکی)، فعال می‌شوند.

به طور کلی، شبکه نرون‌ها در فعالیت‌های فکری مختلف از جمله محاسبات، موزیک و کدنویسی شرکت ندارند. بعلاوه، خیلی از افراد مبتلا به آفازی یا زبان پریشی (از دست دادن قدرت درک زبان یا تکلم در اثر آسیب رسیدن به مغز) – همچنان توانایی انجام محاسبات و سایر کارهای ذهنی غیرزبانی را حفظ می‌کنند. این شواهد در ترکیب با هم نشان می‌دهند که زبان، وسیله تفکر نیست بلکه بیشتر حکم یک پیام‌رسان را دارد. استفاده از گرامر و یک مجموعه واژه برای برقراری ارتباط با عملکردهایی که سایر بخش‌های مغز را درگیر می‌کنند مثل منطق و ارتباط اجتماعی، همان چیزی است که زبان انسانی را متمایز کرده است.

ChatGPT و نرم‌افزارهایی مشابه آن، توانایی بسیار زیادی در سرهم کردن واژگان دارند اما قابلیت انجام بسیاری از کارهای دیگر را ندارند. اگر از این هوش مصنوعی بخواهید نامه‌ای برای یک کودک بنویسد و در آن توضیح دهد که بابانوئل واقعی نیست، یک پیام متحرک با امضای خود نیکلاس قدیس[1] تولید خواهد کرد. این مدل‌های زبانی بزرگ (به اختصار LLM) با پیش بینی متن بعدی در یک جمله بر اساس کلمات پیش از آن، کار می‌کنند (مثلاً بعد برخلاف عبارت باور رایج می‌آید). اما اگر از ChatGPT بخواهید که کارهای محاسباتی یا املایی انجام دهد یا شما را برای پختن تخم مرغ راهنمایی کند، با توضیحاتی نامعقول روبرو می‌شوید “اگر هنگام چرخاندن تخم مرغ فشار زیادی وارد کنید، پوسته تخم مرغ ترک خورده و می‌شکند.”

این نواقص نشان دهنده وجود یک تمایز هستند که بی شباهت به تمایزی که مغز انسان برای سرهم کردن کلمات و سرهم کردن ایده‌ها قائل است، نیست – نویسندگان این مقاله به این دو قابلیت به ترتیب توانایی‌های زبانی رسمی و عملکردی می‌گویند. کایل ماهووالد، زبان شناس دانشگاه تگزاس در آستین و یکی دیگر از نویسنده‌های اصلی این مقاله می‌گوید “اما این به آن معنا نیست که لزوماً چیزی که قابلیت ایجاد زبان گرامری را دارد، توانایی انجام محاسبات، تفکر، استدلال منطقی یا پیمایش زمینه‌های اجتماعی را هم دارد.”

اگر شبکه زبان مغز انسان مسئول ریاضیات، موزیک یا برنامه نویسی نیست – یعنی مسئول تفکر – پس دلیلی وجود ندارد که یک “شبکه عصبی” مصنوعی که بر اساس چندین ترابایت متن آموزش داده شده هم در انجام این کارها مهارت داشته باشد. نویسندگان مقاله مورد نظر می‌گویند “مثل شواهد به دست آمده از علوم اعصاب شناختی، رفتار LLMها هم تفاوت بین مهارت زبان و مهارت تفکر را نشان می‌دهد.” در نتیجه، توانایی ChatGPT برای کسب نمرات متوسط در آزمون‌های مدرسه حقوق و کسب و کار، بیشتر یک سراب است تا نشانه داشتن قدرت ادراک.

باز هم هیاهوی زیادی درباره دور جدید مدل‌های زبانی وجود دارد که با کلمات بسیار بیشتری آموزش داده می‌شوند و از قدرت پردازش بسیار کمتری استفاده می‌کنند. OpenAI سازنده ChatGPT ادعا می‌کند که نرم‌افزارهای این شرکت در حال نزدیک شدن به هوش عمومی هستند که ماشین‌ها را هم تراز انسان‌ها می‌کند. اما اگر مقایسه آنها با مغز انسان درست باشد، اینکه مدل‌ها فقط در پیش بینی کلمات توانایی بیشتری پیدا کنند، آنها را به این هدف نزدیک‌تر نمی‌کند. به زبان دیگر، می‌توان این ایده را که نرم‌افزارهای هوش مصنوعی مثل ChatGPT روح دارند یا در نهایت شرایطی مثل تهاجم فرازمینی‌ها به زمین ایجاد می‌کنند، رد کرد.

ایوانووا و ماهووالد معتقدند که برای افزایش پیشرفت‌های هوش مصنوعی، نیاز به روش‌های آموزشی متفاوتی وجود دارد – مثلاً روش‌هایی که مخصوص استدلال اجتماعی یا منطقی هستند نه صرفاً پیش بینی کلمات. شاید ChatGPT یک مرحله در این مسیر پیشرفت کرده باشد چون علاوه بر خواندن مقادیر عظیمی متن، از بازخوردهای انسانی هم استفاده می‌کند یعنی ناظران می‌توانند درباره خوب یا بد بودن پاسخ‌های آن اظهار نظر کنند. اما با توجه به اینکه اطلاعات چندان زیادی درباره آموزش ChatGPT در دست نیست، مشخص نیست که این ورودی‌های انسانی، چه هدفی دارند؛ در حال حاضر این نرم‌افزار تصور می‌کند که عدد 1000 همزمان بزرگتر از 1062 و کوچکتر از آن است (OpenAI دیروز آپدیتی برای ChatGPT منتشر کرد که قابلیت‌های محاسباتی این هوش مصنوعی را بهبود می‌بخشد اما ظاهراً هنوز ChatGPT برای حل مسائل ساده مرتبط با کلمات، با چالش روبروست).

همانطور که ایوانووا و ماهووالد می‌نویسند، افرادی هستند که باور دارند مدل‌های زبانی بزرگ، مهارت‌های زبانی خیلی خوبی ندارند – بلکه صرفاً یکسری تکمیل کننده خودکار هستند که بیش از حد از توانایی‌های آنها تمجید می‌شود و با افزایش قدرت‌شان، نقایص‌شان هم آشکارتر می‌شود. به گفته گری مارکوس، محقق برجسته هوش مصنوعی و دانشمند علوم شناختی “زبان، فراتر از دانش نحو[2] است. همچنین زبان صرفاً مربوط به مفاهیم نیست.” این طور نیست که ربات‌های هوش مصنوعی ریاضیات را درک نمی‌کنند یا نحوه پختن تخم مرغ را نمی‌دانند بلکه به گفته او، آنها در درک اینکه معنای یک جمله چگونه بر اساس ساختار اجزای مختلف آن به دست می‌آید هم مشکل دارند.

برای مثال، سه توپ پلاستیکی پشت سرهم را تصور کنید به رنگ‌های سبز، آبی، آبی. یک نفر از شما می‌خواهد که توپ آبی دوم را بگیرید: شما درک می‌کنید که منظور این فرد، آخرین توپ آبی در این دنباله است اما ممکن است یک چت‌بات به این نتیجه برسد که منظور دومین توپ است که اتفاقاً این توپ هم آبی است. مارکوس می‌گوید “اگر بگوییم یک مدل زبانی بزرگ، در زمینه درک زبان هم خوب است، غلو کرده‌ایم.” اما از نظر ایوانووا مسئله‌ای مانند مثال توپ آبی علاوه بر گردآوری کلمات نیاز به تجسم یک صحنه دارد در نتیجه فقط مربوط به درک زبان نیست بلکه به مهارت استفاده از آن هم ارتباط دارد.

و صرف نظر از اینکه این مدل‌ها چقدر خوب از زبان استفاده می‌کنند باز هم می‌توان درباره اینکه نرم‌افزارهایی مثل ChatGPT صرفاً با دریافت داده‌ها از کتاب‌ها و منابع ویکی پدیا، چقدر جهان را درک می‌کنند، بحث و گفتگو کرد. رکسانا گیرجو، زبان شناس محاسباتی در دانشگاه ایلینوی می‌گوید “با این کار، نمی‌توان معنا و مفهوم را منتقل کرد. مفهوم در گفتگوها و تعاملات ما نه تنها با دیگر انسان‌ها بلکه با جهان، [به ما] منتقل می‌شود. ما در فرایند تعامل، با استفاده از زبان به این هدف می‌رسیم.” اگر این دیدگاه درست باشد، ساختن یک ماشین واقعاً هوشمند نیاز به روش متفاوتی برای ترکیب زبان و فکر دارد – نه فقط لایه بندی الگوریتم‌های مختلف بلکه طراحی نرم‌افزاری که می‌تواند مثلاً همزمان زبان و نحوه پیمایش روابط اجتماعی را یاد بگیرد.

ایوانووا و ماهووالد این دیدگاه را که زبان می‌تواند مظهر هوش انسانی باشد رد نمی‌کنند اما به پیچیدگی‌های آن اشاره می‌کنند. به نظر آنها، انسان‌ها دقیقاً به این دلیل در درک زبان مهارت دارند که فکر را با بیان آن ترکیب می‌کنند. کامپیوتری که در زمینه قواعد زبان مهارت داشته و بتواند از آنها استفاده کند، هوشمند خواهد بود – در مقابل، تقلید محدود از نحوه بیان انسان، همان چیزیست که مانع پیشرفت ماشین‌ها می‌شود. اما برای اینکه بتوانیم از مغزهای طبیعی خودمان برای درک هر چه بیشتر مغزهای سیلیکونی و مصنوعی استفاده کنیم، نیاز به ایده‌های جدید و کلمات جدید داریم تا اهمیت خود زبان را بهتر درک کنیم.


[1]  نیکلاس قدیس یا سن نیکلاس در حدود سال ۲۷۰ میلادی در آناتولی متولد شد. وی را منشأ اصلی شخصیت بابا نوئل می‌دانند.

[2]  چگونگی ترکیب کلمات و تکواژها برای تشکیل واحدهای بزرگتر مانند عبارات و جملات

مطالب مشابه