يعد التنقيب عن النص (ويشار إليه أيضًا باسم تحليلات النص) تقنية من تقنيات الذكاء الإصطناعي (AI) تستخدم معالجة اللغة الطبيعية (NLP) لتحويل النص الحر (غير المنظم) في المستندات وقواعد البيانات إلى بيانات منظمة ومهيكلة مناسبة للتحليل أو للتعامل مع خوارزميات التعلم الآلي (ML)
يقدم هذا الفيديو مقدمة لهذه التقنيات ، ويسلط الضوء على بعض الميزات التي تساهم في إيجاد حل فعال
فعل الترجمة من داخل الفيديو للعربي في متصفح كروم كي تحقق أقصي استفادة .
youtube.com
فعل الترجمة من داخل الفيديو للعربي في متصفح كروم كي تحقق أقصي استفادة .
youtube.com
ما هو التنقيب عن النص Text Mining ؟
تستخدم على نطاق واسع في المنظمات التي تعتمد على المعرفة ، التنقيب عن النصوص هو عملية فحص مجموعات كبيرة من الوثائق لاكتشاف معلومات جديدة أو المساعدة في الإجابة على أسئلة بحثية محددة يحدد التنقيب عن النص الحقائق والعلاقات >
تستخدم على نطاق واسع في المنظمات التي تعتمد على المعرفة ، التنقيب عن النصوص هو عملية فحص مجموعات كبيرة من الوثائق لاكتشاف معلومات جديدة أو المساعدة في الإجابة على أسئلة بحثية محددة يحدد التنقيب عن النص الحقائق والعلاقات >
التي كانت ستبقى مدفونة في كتلة البيانات الضخمة النصية بمجرد استخراج هذه المعلومات يتم تحويلها إلى نموذج منظم يمكن تحليله بشكل أكبر أو تقديمه مباشرة باستخدام جداول HTML المجمعة والخرائط الذهنية والمخططات وما إلى ذلك يستخدم التنقيب عن النص مجموعة متنوعة من المنهجيات لمعالجة النص
وهي واحدة من أهمها معالجة اللغة الطبيعية (NLP) يمكن دمج البيانات المنظمة التي تم إنشاؤها عن طريق التنقيب عن النص في قواعد البيانات أو مخازن البيانات أو لوحات معلومات الأعمال واستخدامها في التحليلات الوصفية أو الوصفية التنبؤية.
ما هي معالجة اللغة الطبيعية (NLP)؟
يساعد فهم اللغة الطبيعية الآلات على "قراءة" النص (أو إدخال آخر مثل الكلام) من خلال محاكاة قدرة الإنسان على فهم لغة طبيعية مثل الإنجليزية أو الإسبانية أو الصينية تتضمن معالجة اللغة الطبيعية كلاً من فهم اللغة الطبيعية وتوليد اللغة الطبيعية ،
يساعد فهم اللغة الطبيعية الآلات على "قراءة" النص (أو إدخال آخر مثل الكلام) من خلال محاكاة قدرة الإنسان على فهم لغة طبيعية مثل الإنجليزية أو الإسبانية أو الصينية تتضمن معالجة اللغة الطبيعية كلاً من فهم اللغة الطبيعية وتوليد اللغة الطبيعية ،
مما يحاكي قدرة الإنسان على إنشاء نص بلغة طبيعية على سبيل المثال لتلخيص المعلومات أو المشاركة في حوار تطورت معالجة اللغة الطبيعية على مدى السنوات العشر الماضية ، حيث تستخدم منتجات مثل Siri و Alexa والبحث الصوتي من Google
البرمجة اللغوية العصبية لفهم طلبات المستخدم والرد عليها كما تم تطوير تطبيقات تعدين النصوص المتطورة في مجالات متنوعة مثل البحث الطبي وإدارة المخاطر وخدمة العملاء والتأمين (كشف الاحتيال) والإعلانات السياقية
يمكن لأنظمة معالجة اللغة الطبيعية اليوم تحليل كميات غير محدودة من البيانات المستندة إلى النصوص دون تعب وبشكل متسق ، بطريقة غير منحازة يمكنهم فهم المفاهيم ضمن السياقات المعقدة ، وفك غموض اللغة لاستخراج الحقائق والعلاقات الأساسية ،
أو تقديم ملخصات نظرًا للكم الهائل من البيانات غير المهيكلة التي يتم إنتاجها يوميًا ، بدءًا من السجلات الصحية الإلكترونية (EHRs) وحتى منشورات وسائل التواصل الاجتماعي ، فقد أصبح هذا الشكل من الأتمتة أمرًا بالغ الأهمية لتحليل البيانات المستندة إلى النصوص بكفاءة.
تعلم الآلة ومعالجة اللغة الطبيعية.
التعلم الآلي هو تقنية ذكاء اصطناعي (AI) توفر للأنظمة القدرة على التعلم تلقائيًا من التجربة دون الحاجة إلى برمجة واضحة ويمكن أن تساعد في حل المشكلات المعقدة بدقة يمكن أن تنافس البشر أو تتجاوزهم أحيانًا ومع ذلك ، يتطلب التعلم الآلي مدخلات منظمة
التعلم الآلي هو تقنية ذكاء اصطناعي (AI) توفر للأنظمة القدرة على التعلم تلقائيًا من التجربة دون الحاجة إلى برمجة واضحة ويمكن أن تساعد في حل المشكلات المعقدة بدقة يمكن أن تنافس البشر أو تتجاوزهم أحيانًا ومع ذلك ، يتطلب التعلم الآلي مدخلات منظمة
جيدًا للتدريب ، وهذا غير متاح عادةً من مصادر مثل السجلات الصحية الإلكترونية (EHRs) أو الأدبيات العلمية حيث تكون معظم البيانات عبارة عن نصوص غير منظمة عند تطبيقها على السجلات الصحية الإلكترونية أو سجلات التجارب السريرية أو النصوص الكاملة ،
يمكن لمعالجة اللغة الطبيعية استخراج البيانات النظيفة والمنظمة اللازمة لقيادة النماذج التنبؤية المتقدمة المستخدمة في التعلم الآلي ، وبالتالي تقليل الحاجة إلى التعليقات التوضيحية اليدوية باهظة الثمن لبيانات التدريب.
في هذا العرض يناقش ديفيد ميلوارد ، كبير مسؤولي التكنولوجيا في Linguamatics ، الذكاء الاصطناعي بشكل عام ، وتقنيات الذكاء الاصطناعي مثل معالجة اللغة الطبيعية والتعلم الآلي وكيف يمكن الجمع بين البرمجة اللغوية العصبية والتعلم الآلي لإنشاء أنظمة تعلم مختلفة.
youtube.com
youtube.com
البيانات الضخمة وقيود البحث عن الكلمات الرئيسية
بينما تقدم محركات البحث التقليدية مثل Google الآن تحسينات مثل المرادفات والإكمال التلقائي والبحث الدلالي (التاريخ والسياق) ، فإن الغالبية العظمى من نتائج البحث تشير فقط إلى موقع المستندات ،
بينما تقدم محركات البحث التقليدية مثل Google الآن تحسينات مثل المرادفات والإكمال التلقائي والبحث الدلالي (التاريخ والسياق) ، فإن الغالبية العظمى من نتائج البحث تشير فقط إلى موقع المستندات ،
مما يترك للباحثين مشكلة الاضطرار إلى قضاء ساعات يدويًا استخراج البيانات اللازمة من خلال قراءة الوثائق الفردية ، تتفاقم قيود البحث التقليدي بسبب النمو في البيانات الضخمة على مدار العقد الماضي ، مما ساعد في زيادة عدد النتائج التي يتم إرجاعها لاستعلام واحد بواسطة محرك بحث مثل Google
من عشرات الآلاف إلى مئات الملايين قطاعات الرعاية الصحية والطب الحيوي ، وجدت دراسة أجرتها مؤسسة البيانات الدولية (IDC) في ديسمبر 2018 أن حجم البيانات الضخمة من المتوقع أن ينمو بشكل أسرع في مجال الرعاية الصحية مقارنةً بالصناعة أو الخدمات المالية أو وسائل الإعلام
خلال السنوات السبع المقبلة بمعدل نمو سنوي 36% , مع نمو البيانات النصية الضخمة أصبح استخدام تقنيات الذكاء الاصطناعي مثل معالجة اللغة الطبيعية والتعلم الآلي أكثر إلحاحًا.
معالجة اللغة الطبيعية على مستوى المؤسسات
يمثل استخدام التحليلات المتقدمة فرصة حقيقية داخل صناعات الأدوية والرعاية الصحية ، حيث يكمن التحدي في اختيار الحل المناسب ، تتطلب المعالجة الفعالة للغة الطبيعية عددًا من الميزات التي يجب دمجها في أي حل من حلول البرمجة اللغوية العصبية
يمثل استخدام التحليلات المتقدمة فرصة حقيقية داخل صناعات الأدوية والرعاية الصحية ، حيث يكمن التحدي في اختيار الحل المناسب ، تتطلب المعالجة الفعالة للغة الطبيعية عددًا من الميزات التي يجب دمجها في أي حل من حلول البرمجة اللغوية العصبية
هناك تنوع كبير في تكوين الوثيقة والسياق النصي ، بما في ذلك المصادر والشكل واللغة والقواعد يتطلب التعامل مع هذا التنوع مجموعة من المنهجيات مثل
- تحويل تنسيقات المستندات الداخلية والخارجية (مثل HTML و Word و PowerPoint و Excel ، PDF PDF و الصور ) إلى تنسيق موحد قابل للبحث
- تحويل تنسيقات المستندات الداخلية والخارجية (مثل HTML و Word و PowerPoint و Excel ، PDF PDF و الصور ) إلى تنسيق موحد قابل للبحث
- القدرة على تحديد ووضع علامة البحث في أقسام (مناطق) معينة من المستندات ، على سبيل المثال تركيز البحث علي المهمة بالمستندات والوثائق
- المعالجة اللغوية لتحديد الوحدات ذات المعنى داخل النص مثل الجمل ، ومجموعات الأسماء والفعل مع العلاقات فيما بينها
- المعالجة اللغوية لتحديد الوحدات ذات المعنى داخل النص مثل الجمل ، ومجموعات الأسماء والفعل مع العلاقات فيما بينها
- الأدوات الدلالية التي تحدد المفاهيم داخل النص مثل الأدوية والأمراض ، وتطبيع المفاهيم القياسية بالإضافة إلى المهام الأساسية لعلوم الحياة والرعاية الصحية مثل MedDRA و MeSH ، فإن القدرة على إضافة قواميسهم الخاصة هي مطلب للعديد من المنظمات
- التعرف على الأنماط لاكتشاف فئات المعلومات وتحديدها ، والتي لا يسهل تحديدها باستخدام نهج القاموس وتشمل التواريخ والمعلومات الرقمية والمصطلحات الطبية الحيوية (مثل التركيز والحجم والجرعة والطاقة) وطفرات الجينات / البروتين ؛
أفضل مواقع وأدوات التنقيب في النصوص لعام 2020
إذا كنت تعرف كيفية البرمجة ، فقد ترغب في استخدام مكتبات مفتوحة المصدر لبناء نماذج التنقيب عن النصوص الخاصة بك ومع ذلك ، إذا لم يكن لديك الوقت أو الموارد فهناك مواقع وأدوات تساعدك في عمليات التحليل والتنقيب مثل >
إذا كنت تعرف كيفية البرمجة ، فقد ترغب في استخدام مكتبات مفتوحة المصدر لبناء نماذج التنقيب عن النصوص الخاصة بك ومع ذلك ، إذا لم يكن لديك الوقت أو الموارد فهناك مواقع وأدوات تساعدك في عمليات التحليل والتنقيب مثل >
monkeylearn
monkeylearn.com
الأفضل لـ: SaaS أو البرمجيات أو شركات التجارة الإلكترونية الصغيرة والمتوسطة والكبيرة التي ترغب في استخراج معلومات قيمة وتحويلها إلى رؤى قابلة للتنفيذ.
monkeylearn.com
الأفضل لـ: SaaS أو البرمجيات أو شركات التجارة الإلكترونية الصغيرة والمتوسطة والكبيرة التي ترغب في استخراج معلومات قيمة وتحويلها إلى رؤى قابلة للتنفيذ.
الأفضل لـ: المطورين الذين يرغبون في جمع وتحليل وفهم المحتوى من إنشاء الإنسان على نطاق واسع.
aylien.com
aylien.com
الأفضل لـ: الشركات الصغيرة والمتوسطة والشركات الكبيرة التي تريد تحليلات نصية متقدمة لتصنيف المحتوى.
ibm.com
ibm.com
الأفضل لـ: الشركات المتوسطة إلى الكبيرة الحجم التي تتلقى كميات كبيرة من ملاحظات العملاء.
getthematic.com
getthematic.com
Google Cloud NLP
cloud.google.com
الأفضل لـ: الشركات المتوسطة إلى الكبيرة الحجم التي تبحث عن خدمة مدفوعة مقابل ما تستخدمه ، لبناء النماذج والتحليلات التنبؤية.
cloud.google.com
الأفضل لـ: الشركات المتوسطة إلى الكبيرة الحجم التي تبحث عن خدمة مدفوعة مقابل ما تستخدمه ، لبناء النماذج والتحليلات التنبؤية.
ختاما
تعتبر ملاحظات العملاء والتفاعلات عبر الإنترنت مصدرًا ثابتًا للمعلومات وللشركات تكمن المشكلة في أن هذه البيانات تحتاج إلى التحليل ، لاكتساب رؤى ، وتحسين تجارب العملاء يمكنك الاعتماد فقط على البشر لتحليل هذه البيانات يدويًا ، لكنها تستغرق وقتًا طويلاً للغاية ومملة
تعتبر ملاحظات العملاء والتفاعلات عبر الإنترنت مصدرًا ثابتًا للمعلومات وللشركات تكمن المشكلة في أن هذه البيانات تحتاج إلى التحليل ، لاكتساب رؤى ، وتحسين تجارب العملاء يمكنك الاعتماد فقط على البشر لتحليل هذه البيانات يدويًا ، لكنها تستغرق وقتًا طويلاً للغاية ومملة
والحل هو برنامج التنقيب عن النصوص ، المدعوم بمعالجة اللغات الطبيعية (NLP) والتعلم الآلي ، والذي يحول تلقائيًا البيانات النصية إلى معلومات يمكن لأجهزة الكمبيوتر فهمها بدلاً من إنشاء أدوات التنقيب عن النصوص الخاصة بك ،
يكون استخدام إحدى أدوات SaaS العديدة المتاحة عبر الإنترنت أكثر فعالية من حيث التكلفة ، حيث يقدم كل منها نماذج فريدة لاستخراج النص ، من تحليل المشاعر إلى استخراج الكلمات الرئيسية.
لقراءة الموضوع كاملا علي مدونة الشبكة
pglovers.com
pglovers.com
هل كان الموضوع مفيدا ؟
جاري تحميل الاقتراحات...