أهم معضلات استخدام النماذج الضخمة لتوفير نتائج البحث هو أن المواقع التي قدمت مواد تدريب النموذج لن تحظى بأي عائد إعلانات أو زيارة.
ردة فعل مجتمع الفنانين مع نماذج الصور المولدة يعطينا فكرة عن ردة فعل صناع المحتوى بعد نضوب الزيارات ودخل الإعلانات.
نتيجة المعركة ستحدد المستقبل.
ردة فعل مجتمع الفنانين مع نماذج الصور المولدة يعطينا فكرة عن ردة فعل صناع المحتوى بعد نضوب الزيارات ودخل الإعلانات.
نتيجة المعركة ستحدد المستقبل.
أعتقد أن هناك حاجة ملحة لتأسيس العلاقة السببية بين بيانات التدريب والصور/النصوص المولدة. وهذا تقنياً ممكن ولكن مكلف وليس في صالح الراكبين فوق الموجة. مثلاً تعطيه صورة يعطيك صور/نصوص التدريب التي ساهمت فيها (سببيا وليس فقط تشابه). يسهل مهمة المحامين في إثبات الإيعاز.
هذا مهم جداً في مجال توليد الصور وتوليد الأكواد لأن البيانات معرفة ومحدودة بشكل معقول. هناك مبادرات رائعة لإنشاء بيانات تدريب فقط من الاكواد التي يسمح ترخيصها بإعادة الاستخدام ولكن ستحتاج إلى وقت طويل حتى تصل للحجم المطلوب لتدريب نموذج جيد.
وطبعا هذا النقاش يفتح باب كبير لا يؤخذ بعين الاعتبار وسط هذا الضجيج وهو المخاطر القانونية لاستخدام هذه النماذج بشكل واسع. حاليا هناك عدة قضايا في أمريكا وبريطانيا ومتابعة نتائجها قد يعطي سابقة قد تقتل مستقبل هذه النماذج أو تعطيه الضوء الأخضر.
بدأت الحملة تجاه استخدام المحتوى في تدريب الGPT وهذه المرة تقودها كبريات وسائل الإعلام (ولا اعتقد ان بينهم ادنى خلاف في هذه النقطة)
bloomberg.com
bloomberg.com
جاري تحميل الاقتراحات...