@AlWaily777 فهمت قصدك. هذه مشكلة حقيقية إن كان الهدف هو تصنيف المشاعر (sentiment analysis).لكن الهدف هنا مرتكز على حساب ذكر الموضوعات بغض النظر عن الرأي
@AlWaily777 والافتراض القائم هنا أنه لما نلاقي كلمة ما x ، فإن المستند (أو الورقة) يتحدث عن x كموضوع. لما يقول مثلا "x هذا ماله علاقة" فهذه من الحالات=
@AlWaily777 النادرة التي تشوش النتيجة (زي مثالك) لكننا نعول على أن هذه الإيرادات أساسا نادرة، وأغلب الإيرادات يعني منهجية وسليمة.
@AlWaily777 النقطة الأهم: لما يكون عندك عدد ضخم من الملفات أو النصوص فهذه المشاكل يخف/ينعدم أثرها (حتى لو كان الهدف تحليل المشاعر) نظرا لحجم البيانات.
جاري تحميل الاقتراحات...