مدل ChatGPT را با رسم شکل توضیح دهید. «۲ نمره»
چون صحبت در مورد #ChatGPT زیاد شده و ماسک هم منو از توییتر انداخته بیرون و وقت آزاد دارم، خواستم برای دوستایی که کارشون NLP یا Machine Learning نیست ولی کنجکاون که چطوری کار میکنه یه رشته توییت (بدون پرداختن به جزییات فنی) بنویسم.
چون صحبت در مورد #ChatGPT زیاد شده و ماسک هم منو از توییتر انداخته بیرون و وقت آزاد دارم، خواستم برای دوستایی که کارشون NLP یا Machine Learning نیست ولی کنجکاون که چطوری کار میکنه یه رشته توییت (بدون پرداختن به جزییات فنی) بنویسم.
چطوری این سیستم بلده که هم کد پایتون بنویسه، هم جُک براتون بگه، و هم حرف فلسفی بزنه؟ متاسفانه بعضی از جزییات این سیستم واضح نیست چون OpenAI برخلاف اسمش اونقدا هم open نیست. ولی به طور کلی ساخت یه همچین مدلی بنا به گفته خودشون ۳ مرحله کلی داشته.
مرحله ۱)
یکی از پایهای ترین مسائلی که ما (چون مرض داریم) در NLP روش کار میکنیم اینه: «بیاین یه مدلی بسازیم که با دیدن یک متن بتونه لغت بعدی رو حدس بزنه». مثلا مدلی که با دیدن «کوکب خانوم زن پاکیزه و» حدس بزنه که لغلاتی مثل «باسلیقه» و «جوان» در ادامه محتمل هستن ولی «بنفش» نیست
یکی از پایهای ترین مسائلی که ما (چون مرض داریم) در NLP روش کار میکنیم اینه: «بیاین یه مدلی بسازیم که با دیدن یک متن بتونه لغت بعدی رو حدس بزنه». مثلا مدلی که با دیدن «کوکب خانوم زن پاکیزه و» حدس بزنه که لغلاتی مثل «باسلیقه» و «جوان» در ادامه محتمل هستن ولی «بنفش» نیست
اولین مرحله ساخت ChatGPT دقیقا همینه - ساختن مدلی که لغت بعدیِ یک رشته از لغات رو حدس بزنه. این مدل با دیدن حجم زیادی از متون موجود در وِب ساخته میشه (به عنوان مثلا ویکیپدیا و متن میلیونها کتاب و غیره). این مدل چیزیه که شاید به اسم GPT3 یا ورژنهای قبلیش به گوشتون خورده باشه.
این مدل (با اینکه هدف سادهای داره) اکثرتواناییهای عجیب و غریب ChatGPT رو در خودش داره. مثلا اگه شما به این مدل بگین متن ورودی اینه که «آنچه در ادامه خواهید دید غزلی در مورد گرانی گوجه است …» مدل (فقط با پیشبینی لغت بعدی و بعدییش و …) شروع به نوشتن شعری در مورد 🍅خواهد کرد!
اما من برای اینکه بتونم شعری در مورد 🍅 از مدل بکشم بیرون، مجبور شدم یه متن الکی وارد کنم که مدل رو مجبور کنه که شعر بگه. به متنی که من به عنوان ورودی دادم میگن prompt و خیلیها شروع کردن به مطالعهی اینکه چطوری prompt خوبی مثل «متنی که در …» بنویسیم که نتیجه مطلوب رو بگیریم.
مرحله ۲ و ۳ ساخت ChatGPT سعی دارن که این مشکل رو حل کنن. به جای اینکه من بخوام به زور یه prompt خوب پیدا کنم، طراحان مدل گفتن بیاین طوری تغییرش بدیم که شما اکثر خواستههاتون رو بتونین با چت کردن به سیستم وارد کنید. در این صورت کافییه که بگین «یک غزل در مورد گرانی گوجه بگو» و خلاص
مرحله ۲)
این مرحله کمتر جذابه. تنها کاری که انجام شده اینه که مدل قبلی رو بگیریم و فرآیند یادگیریِ لغت بعدی (که روی متون وِب انجام شده بود) رو روی متنهای چَت انجام بدیم. متنهایی که نفر اول توش گفته «آقا یه جُک راجع به تونس بگو» و دومی میگه «یه بار یکی رفت تونس یکی رفت نتونس»!
این مرحله کمتر جذابه. تنها کاری که انجام شده اینه که مدل قبلی رو بگیریم و فرآیند یادگیریِ لغت بعدی (که روی متون وِب انجام شده بود) رو روی متنهای چَت انجام بدیم. متنهایی که نفر اول توش گفته «آقا یه جُک راجع به تونس بگو» و دومی میگه «یه بار یکی رفت تونس یکی رفت نتونس»!
با دیدن این چتها، مدل یاد میگیره که ورودی ها رو به صورت گفتگو ببینه و خروجیهاش رو به صورت پاسخ به گفتگو تولید کنه. اکثر زحمتی که کمپانی OpenAI در این مرحله کشیده اینه که به یه سری آدم پول بده که متن به حالت چَت بنویسن. هم از طرف کاربر و هم از طرف سرویسی که قراره پاسخ بده.
مرحله ۳)
حالا که شما یک مدل دارید که باهاتون چت میکنه. اگر بهش بگید که «یک غزل در مورد گرونی 🍅 بگو» میتونه چندین جواب مختلف بهتون بده، مثلا چندین غزل مختلف یا حتی جواب بده «آقا، من شاعر خوبی نیستم! بیخیال من شو!». همه این جوابها کاملا منطقی هستن.
حالا که شما یک مدل دارید که باهاتون چت میکنه. اگر بهش بگید که «یک غزل در مورد گرونی 🍅 بگو» میتونه چندین جواب مختلف بهتون بده، مثلا چندین غزل مختلف یا حتی جواب بده «آقا، من شاعر خوبی نیستم! بیخیال من شو!». همه این جوابها کاملا منطقی هستن.
توی همه جوابها مدل به درستی لغتهای بعدی رو یکی بعد از دیگری پیشبینی کرده، ولی ما غزلها رو به جواب آخر ترجیح میدیم. مرحله ۳ سعی میکنه که مدل رو به سمت خروجی دلخواه ما (یعنی غزلی در مورد گوجه) هُل بده.
برای انجام این کار، بچهها توی OpenAI، خروجیهای مختلفی از مدل گرفتن و به یه سری آدم گفتن این جوابها رو بر اساس کیفیت (از خوب به بد) مرتب کنن. قاعدتا اونها غزلهای درست حسابی رو بالاتر از پاسخ «آقا، بیخیال من شو» قرار دادن.
من اینجا دیگه به شدت جزییات رو حذف میکنم ولی بر اساس لیست مرتب شده پاسخها (با استفاده از Reinforcement Learning) میشه مدل رو بهتر کرد و سوق داد به سمت جوابهایی که ما بیشتر میپسندیم. ولی فراموش نکنیم که در نهایت #ChatGPT مدلیست که فقط لغت بعدی رو حدس میزنه.
حقیقتا شگفت انگیزترین چیز اینه که همچین صورت مسالهی سادهای (لغت بعدی رو حدس زدن) توانایی این رو پیدا میکنه که جُک و غزل بگه و کد پایتون بزنه.
الان انرژیم تموم شد ولی ایشالا بعدا مینویسم چرا همین سادگی صورت مساله باعث میشه بشه ChatGPT رو بازی داد و خروجی نامناسب ازش گرفت.
الان انرژیم تموم شد ولی ایشالا بعدا مینویسم چرا همین سادگی صورت مساله باعث میشه بشه ChatGPT رو بازی داد و خروجی نامناسب ازش گرفت.
جاري تحميل الاقتراحات...