تصنيف المعلومات النصية باستخدام الشبكات العصبية TEXT INFORMATION CLASSIFICATION USING NEURAL NETWORKS Dr.Hasan Abdullah Ahmed Al-Shaikh* ملخص البحث: تتناول هذه الورقة الأسس النظرية لتصنيف النص المعتمد على الآلة، وهو موضوع حظي باهتمام كبير في الآونة الأخيرة. وهو يوضح المراحل الأولية والتحديات المرتبطة بها في معالجة هذه المشكلات، ويقدم البيانات المستمدة من خوارزمية مباشرة لتصنيف المعلومات النصية. العمليات الأساسية مثل التصفية الأولية للنص، وتكوين ناقلات الميزات، والمناقشة تشمل إطار العمل ومنهجيات التدريب للشبكة العصبية . يتم تقييم نتائج الأداء باستخدام مقياس .F يتم إجراء تحليل مقارن على ثلاث مجموعات نصية مختلفة، لدراسة الاختلافات في معلمات التصفية الأولية، وأعداد الخلايا العصبية للطبقة المخفية، وفترات تدريب الشبكة. ويحقق نموذج المصنف المقترح دقة تتجاوز 80 %، حيث تلعب جودة بيانات التدريب دورًا حاسمًا في هذا النجاح. وتختتم الورقة بتقييم جودة النتائج واقتراح سبل للبحث المستقبلي في هذا المجال. الكلمات الافتتاحية: التشابه الدلالي، الشبكة العصبية، التعلم الآلي، تحليل النص، تصنيف الوثائق. ABSTRACT This paper examines the theoretical underpinnings of machine-based text classification, a topic that has garnered significant interest recently. It outlines the primary stages and associated challenges in addressing these issues, presenting data derived from a straightforward algorithm for classifying text information. Key processes such as preliminary text filtering, feature vector formation, and the discussion encompasses the framework and training methodologies of a neural network. Performance outcomes are assessed utilizing the F-measure . Comparative analysis is conducted on three different text corpora, investigating variations in preliminary filter parameters, hidden layer neuron counts, and network training durations. The proposed classifier model achieves an accuracy exceeding 80%, with the quality of training data playing a crucial role in this success . The paper concludes by evaluating result quality and suggesting avenues for future research in this domain . Keywords: semantic similarity, neural network, machine learning, text analysis, document classification .

تصنيف المعلومات النصية باستخدام الشبكات العصبية Dr.Hasan Abdullah Ahmed Al-Shaikh*

البحث العلمي ابحاث المجلة | الابحاث المنشورة

تصنيف المعلومات النصية باستخدام الشبكات العصبية


TEXT INFORMATION CLASSIFICATION USING NEURAL NETWORKS


المؤلف Dr.Hasan Abdullah Ahmed Al-Shaikh*
محكمة نعم
الدولة اليمن
سنة النشر 2024
الشهر June
المجلد 11
العدد 19
DOI https://aust.uni.ye/
ISSN 2410-1818
نوع المحتوى بحوث ومقالات
اللغة العربية
قواعد المعلومات HumanIndex
رابط المحتوى تحميل PDF

الملخص

ملخص البحث: تتناول هذه الورقة الأسس النظرية لتصنيف النص المعتمد على الآلة، وهو موضوع حظي باهتمام كبير في الآونة الأخيرة. وهو يوضح المراحل الأولية والتحديات المرتبطة بها في معالجة هذه المشكلات، ويقدم البيانات المستمدة من خوارزمية مباشرة لتصنيف المعلومات النصية. العمليات الأساسية مثل التصفية الأولية للنص، وتكوين ناقلات الميزات، والمناقشة تشمل إطار العمل ومنهجيات التدريب للشبكة العصبية . يتم تقييم نتائج الأداء باستخدام مقياس .F يتم إجراء تحليل مقارن على ثلاث مجموعات نصية مختلفة، لدراسة الاختلافات في معلمات التصفية الأولية، وأعداد الخلايا العصبية للطبقة المخفية، وفترات تدريب الشبكة. ويحقق نموذج المصنف المقترح دقة تتجاوز 80 %، حيث تلعب جودة بيانات التدريب دورًا حاسمًا في هذا النجاح. وتختتم الورقة بتقييم جودة النتائج واقتراح سبل للبحث المستقبلي في هذا المجال. الكلمات الافتتاحية: التشابه الدلالي، الشبكة العصبية، التعلم الآلي، تحليل النص، تصنيف الوثائق.


Abstract

ABSTRACT This paper examines the theoretical underpinnings of machine-based text classification, a topic that has garnered significant interest recently. It outlines the primary stages and associated challenges in addressing these issues, presenting data derived from a straightforward algorithm for classifying text information. Key processes such as preliminary text filtering, feature vector formation, and the discussion encompasses the framework and training methodologies of a neural network. Performance outcomes are assessed utilizing the F-measure . Comparative analysis is conducted on three different text corpora, investigating variations in preliminary filter parameters, hidden layer neuron counts, and network training durations. The proposed classifier model achieves an accuracy exceeding 80%, with the quality of training data playing a crucial role in this success . The paper concludes by evaluating result quality and suggesting avenues for future research in this domain . Keywords: semantic similarity, neural network, machine learning, text analysis, document classification .

تحميل البحث (PDF)