SlideShare a Scribd company logo
1 of 10
‫التعلم النشط واستقراء قاعدة المعرفه‬
       ‫د. وجدي سالم بسباس‬                                                     ‫د. محمد ابوالقاسم الرتيمي‬
         ‫قسم علوم الحاسوب‬                                                         ‫قسم هندسة الحاسوب‬
      ‫جامعة السابع من ابريل‬                                                     ‫جامعة السابع من ابريل‬
‫بريد الكتروني ‪act@lttnet.net‬‬                                           ‫بريد الكتروني ‪artemi@yahoo.com‬‬

                                                                                                      ‫مستخلص‬
  ‫تعرض هذه الورقه طرقا لتعزيز دقة انظمة التعل م التستقرائي، وتهت م بمسائل: تعل م قواعد الرثر ‪production‬‬
                               ‫مُ‬
     ‫‪ rules‬في مهام تصنيف متعددة الفئه ‪ multi-class classification tasks‬في مجال ت مشوهشه ، والبقاء‬
                  ‫شّ‬
‫على تعل م مستمر عند مصادفة وضع جديد عقب انتهاء مرحلة التعل م الولى، وتصنيف كائن ما ‪ object‬عندما ل‬
                                                                              ‫يوجد قانون ينطبق على ذلك الكائن.‬
       ‫لقد اوضحنا ان دمج نسق تقيي م الداء والتعل م يعمل على تقدي م تصنيفا ت دقيقه لفئا ت بيانا ت واقعيه. وتعرض‬
‫الورقه النظام أريس ‪ ARIS‬الذي يحقق هذا التسلوب، وقد تبين ان التصنيفا ت الناتجه هي غالبا أدق من تلك التي‬
                                                                  ‫توفر ت عن طريق قواعد المعرفه غير المنقحه.‬
‫يعتمد قرار التصمي م الرئيسي في نظام اريس على ترتيب القوانين ‪ Rules‬طبقا لوزانها، ويت م تعل م وزن القانون‬
      ‫باتستخدام نظرية باييز لحساب اوزان هشروط القانون ودمجها، ويركز هذا النموذج على تحليل قاعدة المعرفه‬
                                                                                      ‫ويساند عملية التنقيح بكفاءة.‬
‫ان هذا النظام )أي اريس ‪ (ARIS‬ليس تفاعليا، ويعتمد على كاهشفا ت ‪ heuristics‬لتركيز عملية التنقيح على تلك‬
‫التجارب التي تبدو اكثر تناغما مع فئة بيانا ت التنقيح. ويتكون الطار التصميمي لنظام ‪ ARIS‬من نموذج جدولي‬
      ‫لتمثيل اوزان القانون والعلقه بين حال ت التنقيح والقوانين التي تفي )او تنطبق على( كل حاله لتركيز عملية‬
    ‫التنقيح، وقد اتستخدم النظام لتنقيح قواعد معرفه صنعها ‪ ARIS‬بنفسه، وكذلك تنقيح قواعد معرفه اختلقها نظام‬
                                                         ‫‪ RIPPER‬ونظام 5.4‪ C‬في عشرة ميادين ت م اختياها.‬

                          ‫الكلمات المفتاحيه: الذكاء الطصطناعي، تعلم الله، تنقيح قاعدة المعرفه، التعلم النشط‬

                                                                                                    ‫1. مقدمه:‬
   ‫لقد ادى التطور في تقنية قواعد البيانا ت واتصال ت الحاتسوب الى انتاج مستودعا ت بيانا ت ضخمه وكفؤه‬
  ‫في كل المجال ت، مثل معامل ت بطاقة العتماد، والصور الطبيه و عمليا ت مسح الفضاء الجوي كلها تخزن في‬
  ‫قواعد بيانا ت ضخمه تتزايد باتستمرار. وتحتاج هذه البيانا ت للتحليل واهشتقاق معلوما ت ذا ت مستوى عال ويمكن‬
  ‫ان تكون مجديه في اتخاذ القرارا ت وفي فه م العملية المنتجه للبيانا ت. ولنظمة من هذا النوع نحتاج الى اتساليب‬
                                                            ‫مؤتمته تمكنها من اكتساب معرفه لصنع القرارا ت.‬
‫يحاول الناس فه م الطبيعه بواتسطة ايجاد تبسيط لهذه الطبيعه )يدعى نموذج(. ويمثل هذا النموذج احداث في البيئه‬
    ‫والتشابها ت بين الكائنا ت . تجمع الكائنا ت المتشابهة في اصناف ‪ classes‬رث م تبنى قوانين ‪ rules‬للتنبؤ بسلوك‬
  ‫كائنا ت ‪ objects‬جديده لذلك الصنف. نحاول في مجال تعل م الله ميكنة هذه العمليه وبناء توصيفا ت او اوصاف‬
‫‪ descriptions‬للصنف )النموذج( باتستخدام اتستراتيجية بحث تكراريه على مكتبه من المثله. ويسمى هذا النوع‬
     ‫تعل م اتستقرائي ‪ . inductive learning‬المشكله في التستنتاج التستقرائي هي ان المعرفة المنتجه اتستقرائيا‬
‫) تسواء كانت مختلقه بواتسطة البشر او الل ت( هي غير مؤكده ‪ uncertain‬حيث ت م تأتسيسها بناء على عينه فقط‬
                                                                                       ‫من كل الحال ت الممكنه.‬
    ‫هناك اتسلوبان هشائعا التستخدام. في التعل م الموجه ‪ supervised learning‬تحدد الصناف ‪ classes‬للنظام‬
    ‫بصحبة امثله من كل صنف. اما في التعل م غيرالموجه ‪) unsupervised learning‬او التعل م من الملحظه‬
  ‫والكتشاف( فيجب على النظام اكتشاف الصناف من تلقاء نفسه معتمدا على خصائص عامه للكائنا ت. وتقتصر‬
                                                                              ‫هذه الورقه على التسلوب الول.‬
 ‫وتعد مسألة تنقيح قاعدة المعرفه غير التامه )الناقصه/ غير الصحيحه( مفهوما مهما لتحسين القدره التنبؤيه لنظام‬
         ‫التعل م على حال ت ل م يت م رؤيتها مسبقا. وقد ظهر ت العديد من التساليب )4،3،2،1(. احد المآخذ على هذه‬
 ‫التساليب هو عدم وجود اتستراتيجيه مناتسبه لتعريض فئة الختبار بكاملها للمزيد من التحليل عندما تصادف حاله‬
‫أخطئء في تصنيفها، بدل من التستعجال لتصحيح الحاله المشخصة خطأ. السبب الشائع في ظاهرة التصنيف‬
   ‫الخاطئ هو ان انتقاء قوانين التستنتاج يت م بطريقه اعتباطيه )عشوائيه( وهذا راجع الى ان القوانين يت م ترتيبها‬
‫حسب اولوية ظهورها او انتاجها. الفائده من ترتيب القوانين طبقا لمعيار اهمية معينه هو ان ذلك ينج م عنه تطبيق‬
                                                              ‫عدد اقل من عوامل التحويل على قاعدة المعرفه.‬
     ‫تصف هذه الورقه منهجيه نظريه وتنفيذ لهذه المنهجيه في نظام تنقيح اتستقرائي يدعى أريس ‪ ،ARIS‬والذي‬
‫يحقق خطوة للمام باتجاه تحسين انظمة تعل م المفاهي م اتستقرائيا. ويستخدم اريس ‪ ARIS‬عدد من التقنيا ت لتركيز‬
                                          ‫عملية التنقيح على الجزاء الكثر اهميه في قاعدة المعرفه واصلحها.‬

                                                               ‫2. المصاعب التي تواجه النظمة الحاليه‬
         ‫تلعب قاعدة المعرفه دورا مهما في امكانيا ت الحل لنظمة التعل م، وهي الوحده الكثر قوة، ولكن جرينر‬
       ‫5( ‪ (Greiner‬اوضح ان بناء قاعدة معرفه كفؤه هي مسألة غاية في الصعوبه ‪ ، NP hard‬وغالبا ما تكون‬
 ‫قاعدة المعرفه التي ت م بناؤها غير متناغمه ‪ inconsistent‬وغير كامله ‪ incomplete‬وقد ل تعمل بكفاءه تامه،‬
         ‫بغض النظر عما اذا كانت قاعدة المعرفه هذه قد انتزعت مباهشرة من الخبراء او من خلل تحليل مكتبة من‬
          ‫الحال ت. لذا، من الضروري تحديث قاعدة المعرفه للحصول على نموذج أع م ومطور واكثر تأرثيرا. وتعد‬
                                                                       ‫العتبارا ت التاليه حوافز دافعه لهذا البحث:‬
‫• تعاني خوارزما ت تعل م المفاهي م التستقرائيه من عيوب تضعها في هشرك ما يعرف بالقمة المحليه ‪local‬‬
                                         ‫‪ maxima‬والتي قد تكون بعيده جدا عن الحل المثل بشكل عام‬
 ‫• يمكن ان تكون انظمة التعل م التستقرائي اكثر ذكاء في حل المسائل اذا دعمت بامكانية دمج تحليل الداء‬
        ‫في عملية التعل م. بالتحديد، السماح لنظام التعل م ان يستعل م عما اذا كان احتواء مثال معين في قاعدة‬
            ‫المعرفه يزيد بشكل ملحوظ من قوة النظام ام ل. السبب هو ان هذه التغذيه الراجعه )العكسيه(‬
     ‫‪ feedback‬تزيد من مقدرة التعل م باتجاها ت مختلفه عن طريق تعمي م ‪ generalize‬قاعدة المعرفه‬
     ‫الصليه لتضمين المثله التي تقع خارج التغطيه واتستثناء المثله المضمنة بقاعدة المعرفه بالخطاء.‬
    ‫ويض م ذلك تعمي م غطاء القانون وإضافة قانون جديد، وإلغاء قوانين زائده وتخصيص بعض القوانين‬
                                                                                    ‫العامه بشكل مفرط.‬
       ‫• تلجأ النظمه الحاليه الى تعيين صنف النسحاب ‪) default class‬صنف الغالبيه( الى حالة يراد‬
‫تصنيفها، اذا ل م يتوفر قانون ينطبق على قي م خصائص الحاله. وعند ازدياد عدد الحال ت لكثر من ارثنين‬
                                 ‫يزداد احتمال الخروج بتنبؤا ت خاطئه. ومن رث م يتطلب المر تقنية بديله‬

                                                                              ‫3. بنية نظام اريس ‪ARIS‬‬
        ‫يعمل نظام اريس مبدئيا على انتاج قاعدة معرفه باتستخدام التستقراء على مجموعه من امثلة التدريب،‬
  ‫ويواصل النظام بعد ذلك اختبار قاعدة المعرفه على مجموعه منفصله من البيانا ت لغراض التنقيح وتسمى هذه‬
  ‫الفئه فئة بيانا ت التنقيح ‪ . refinement data set‬بعد هذا الختبار وفقط في حالة بروز تصنيف خاطئ لبعض‬
     ‫بيانا ت التنقيح يستدعى النظام الفرعي للتنقيح. واخيرا يختبر النظام على فئة منفصلة خاصه بالختبار لتعمي م‬
   ‫عملية التنقيح. يعمل نظام التنقيح على تحديد الخطاء المحتمله في قاعدة المعرفه، ويستدعي مكتبة من العوامل‬
  ‫لكتشاف التنقيح الممكن بمساعدة دالة كاهشفه عامه ‪ ، global heuristic‬ويطبق افضل تنقيح، وتتكرر العمليه‬
                                                                         ‫حتى تنتهي كافة التنقيحا ت الممكنه.‬
      ‫يؤدي نظ م اريس بحثا في فضاء من عوامل التخصيص ‪ specialization‬والتعمي م ‪ generalization‬في‬
 ‫محاولة ليجاد ادنى تنقيح او تعديل لقاعدة المعرفه. ومن حيث المفهوم توجد رثلرثة مراحل رئيسية لنظام التنقيح،‬
       ‫تنفذ ارثنتان منها لكل فرضيه او صنف متوفر بقاعدة المعرفه، بينما يحافظ على ترتيب القوانين ‪ rules‬وفقا‬
                                                                                                    ‫لوزانها‬
                                                                   ‫المرحلة الولى )المركزه ‪(Localization‬‬
    ‫يت م خلل هذه المرحله تحديد كافة الحال ت التي أخطئء في تصنيفها من ضمن فئة التنقيح والتي تنتمي الى‬
   ‫صنف ‪ class‬معين. وتمنح كل حاله وزن ‪ weight‬من خلل القوانين التي تنطبق على الحاله، ويشير هذا الى‬
    ‫التشابك عند هذه النقطه )الحاله( في فضاء الصنف )الفرضيه(. ويت م اختيار الحاله ذا ت العلى وزن من بين‬
                      ‫الحال ت التي أخطىء في تصنيفها، لن هذا يحدد القانون القوى من فئة القوانين الخاطئه.‬
‫المرحلة الثانيه )تنفيذ التنقيح والتحقق والتختبار(‬
                    ‫يحدد في هذه المرحلة القانون ‪ rule‬المسئول عن الخطاء، ويت م تجربة كافة عوامل التنقيح الممكنه، أي يت م‬
                      ‫تخصيص القانون الخاطيء ، ويعم م قانون آخر مشابه يغطي الصنف المقصود، كما يستحدث قانون جديد .‬
                      ‫تجرب كافة العوامل الممكنه وتختبر قاعدة المعرفه ويحتفظ بالداء الناتج. أخيرا يت م اختيار عامل التنقيح او‬
                                 ‫مجموعة العوامل التي تعطي افضل اداء. وتكرر العمليه حتى ل تبقى اية تحسينا ت اخرى ممكنه.‬

                                                                                                                ‫المرحلة الثالثه )التأكد من الكمال وإزالة القوانين الزائده(‬
  ‫أخيرا، تفحص قاعدة المعرفه للتأكد من تمامها . ويجب تغطية كل حاله بقانون واحد على القل. اذا كانت هناك‬
   ‫حال ت غير مشموله بالقوانين المتوفره ، فيمكن اضافة قوانين جديده . إضافة الى ذلك تزال القوانين الزائده عن‬
      ‫الحاجه. المكونا ت التساتسيه لنظام اريس ‪ ARIS‬هي مولد الشجره ‪ tree generator‬و مولد القوانين ‪rule‬‬
                      ‫شّ‬                               ‫شّ‬
   ‫‪ generator‬و مولد التنقيح ونموذج الحك م ‪ judgement module‬و آلية التستنتاج ‪. inference engine‬‬
       ‫مولد التنقيح هو المسئول عن تطبيق كل التنقيحا ت الممكنه لعلج أي خطأ تصنيفي ويمكن ان تتغير القوانين‬‫شّ‬
     ‫بواتسطة تحريرها )ويدعى التمكين ‪ (enabling‬او منعها من التحرر )ويسمى العاقه ‪ . (disabling‬يختار‬
‫نموذج الحك م ‪ judgement module‬عامل التنقيح او مجموعة العوامل التي تنتج افضل تحسين على اداء قاعدة‬
  ‫المعرفه مع ضرورة تصحيح الحال ت المصنفه خطأ في السابق. ويوضح الشكل ادناه بنية نظام اريس ‪. ARIS‬‬

                                                             ‫بيانا ت اختبار‬                            ‫بيانا ت تنقيح‬

                                                                                        ‫المصنف‬
                                                                                         ‫شّ‬
                                        ‫مولد القانون‬
                                                 ‫شّ‬
                                                                                                                            ‫نتيجة التنبؤ‬




                                                                            ‫(آلية التستنتاج‬
  ‫بيانا ت التدريب‬



                          ‫مولد الشجره‬




                                                    ‫قاعدة‬
                                                                      ‫مرتب القوانين‬




                                                                                      ‫القوانين مرتبة‬
                                                                                        ‫بّ‬
                                  ‫شّ‬




                                                  ‫القوانين‬                                              ‫مولد التنقيح‬
                                                                                                                 ‫شّ‬
                                                                                ‫شّ‬




                                                                                                 ‫قائمة القوانين المنقحه‬
                                                                                                   ‫شّ‬


                                                                                                       ‫قاعدة معرفه‬
                                                                                                            ‫منقحه‬
                                                                                                              ‫شّ‬
                         ‫البنيه الساسيه‬                             ‫نموذج التنقيح‬


                                                                                             ‫الشكل 1: بنية النظام أريس‬

                                                                                                                                           ‫4. استقراء قاعدة المعرفه‬
   ‫ت م اتستخدام تمثيل القضايا ‪ propositional representation‬كلغة تمثيل المعرفه، ويستخدم تمثيل القضايا‬
                      ‫صيغ المنطق المحتويه على هشرط وقيمة الخاصيه .‪ attribute-value condition‬فمثل‬
‫‪(colour=red v colour=green) & shape=circle‬‬
                                                         ‫)اللون=احمر او اللون=اخضر( و الشكل=دائره‬
   ‫وتأخذ قاعدة المعرفه هشكل قوانين أرثر )او انتاج( ‪ production rule‬والتي يمكن ان تحتوي على اتستثناءا ت‬
                                                                                     ‫محليه للقانون مثل‬
‫‪IF outlook=sunny & humidity=low THEN class=mild‬‬
‫‪IF outlook=rain & windy=true THEN class=don't play‬‬
    ‫‪UNLESS‬‬
  ‫‪Covered_stadium=true‬‬
    ‫وليت م بناء نماذج تصنيف، يعرض على اريس ‪ ARIS‬ملف يحتوي على اوصاف قيمة-خاصيه -‪attribute‬‬
    ‫‪ value‬لفئة من الحال ت التي ت م تعريف اصنافها، وكل حاله هي وصف لكائن واحد. يحلل نظ م اريس بيانا ت‬
      ‫التدريب ‪ training data‬ويولد فئة من قوانين الرثر في صيغة القضايا التي تصف المفاهي م ‪. concepts‬‬
                                                                         ‫شّ‬
‫تبدأ عملية التأويل بتعل م هشجرة القرار، وترجع الفكره التساتسيه الى عمل كوينلن 6( ‪ (quinlan‬مستغل فكرة "‬
     ‫فرق تسد " واوضحت التجارب ان تحويل هشجرة القرار الى مجموعة من القوانين يؤدي الى قوانين واضحه‬         ‫شّ‬
           ‫ومفهومه وذا ت تنبؤ دقيق على حال ت ل م يسبق مصادفتها. إن إعادة كتابة هشجرة في هشكل مجموعة من‬
     ‫القوانين ،قانون لكل مسار بالشجره لن ينتج تراكيب ابسط لنه ببساطه يوجد قانون واحد لكل وريقه طرفيه.‬
   ‫ولكن بالتفحص الجيد عن قرب في مقدمة القانون قد نتعرف على بعض الشروط التي ليست ذا ت علقه. الغاء‬
                                                   ‫شّ‬
‫الشروط الزائده ينتج قانون جديد بدون التأرثير في دقة القانون الصلي، مما يجعل القانون اكثر قبول. ولفه م الفكره‬
                                                            ‫من وراء إلغاء الشروط نفرض ان القانون ‪ G‬هو‬
‫‪IF A THEN class C‬‬
                                                 ‫حيث ان ‪ A‬هي اتحاد لمجموعة هشروط 3‪.……,a1,a2,a‬‬
                                                                           ‫وقانون آخر اكثر عمومية ‪ 'G‬هو‬
‫‪IF A' THEN class C‬‬
                                           ‫حيث ان ‪ 'A‬يتحصل عليها بالغاء هشرط واحد ‪ ai‬من الشروط ‪. A‬‬
   ‫كل حاله في بيانا ت التدريب التي تشملها المقدمه القصيره ‪ 'A‬اما انها تنتمي او ل تنتمي الى الصنف المعني‬
                                                                   ‫‪ ، C‬وانها ترضي او ل ترضى الشرط ‪ai‬‬
                                                           ‫يمكن تنظي م عدد الحال ت في كل مجموعه كما يلي:‬

                                                              ‫الصنف‬                         ‫اصناف اخرى‬
                                                                 ‫‪C‬‬
     ‫حال ت ترضي الشرط ‪ai‬‬                                        ‫1‪S‬‬                                     ‫1‪E‬‬
    ‫حال ت ل ترضي الشرط ‪ai‬‬                                       ‫2‪S‬‬                                     ‫2‪E‬‬

    ‫يوجد عدد 1‪ S1+E‬حاله من الحال ت التي تغطيها ‪ 'A‬وهي ترضي الشرط ‪) ai‬بمعنى ان القانون ‪ G‬يشملها(‬
 ‫حيث ان منها عدد 1‪ E‬يصنفها القانون ‪ G‬تصنيف غير صحيح. ويوجد عدد 2‪ S2+E‬حاله مغطاة بواتسطة القانون‬
  ‫المعم م ‪ 'G‬ول يغطيها القانون الصلي. يوجد منها عدد 2‪ E‬ت م تضمينها بالخطأ، حيث انها تنتمي الى اصناف‬
‫اخرى. وحيث ان ‪ 'G‬تغطي كل الحال ت التي يغطيها ‪ G‬ايضا، فإن عدد الحال ت المغطاة بواتسطة ‪ 'G‬هي +1‪S‬‬
‫2‪ . S2+E1+E‬اتستخدم اختبار الهميه ‪ test of significance‬على الجدول اعله لتقرير ما اذا كان من الواجب‬
             ‫2 ‪E1 + E‬‬
‫للقانون ‪'G‬‬   ‫2 ‪S1 + S‬‬       ‫الغاء الشرط ‪ .ai‬الفكره هي ان يبقى الشرط ‪ ai‬فقط عندما يكون معدل الخطأ الحقيقي‬

                                                                           ‫1‪E‬‬
 ‫لقانون ‪ . G‬انه من غير المرجح للقانون الذي يرتكب نسبة خطأ مقدارها‬          ‫1‪S‬‬   ‫اكبر من معدل الخطأ الحقيقي‬

                                                      ‫‪E‬‬                                                  ‫‪E‬‬
  ‫على حال ت ل م يسبق رؤيتها، لذا ت م اتستخدام مقياس‬   ‫‪N‬‬   ‫في بيانا ت التدريب ان يكون له خطأ في حدود‬      ‫‪N‬‬

                                         ‫خطأ تقديري يدعى تقدير لبلس للخطأ ‪Laplace error estimate‬‬
                                                                                                     ‫1+ ‪E‬‬
 ‫حيث ان ‪ N‬هو عدد امثلة التدريب وان عدد ‪ E‬منها تنتمي الى اصناف غير الصنف المعني ‪ . C‬لذا‬               ‫2+ ‪N‬‬

   ‫يحتفظ بالشرط ‪ ai‬فقط اذا كان الغاؤه يحدث معدل خطأ حقيقي اكبر من خطأ النسحاب. وبالطبع، يمكن الغاء‬
  ‫اكثر من هشرط في القانون عند تعمي م القانون. ويعمل النظام على تطبيق اتسلوب هشره ‪ greedy approach‬في‬
                                               ‫الغاء الشروط التي تنتج اقل معدل خطأ حقيقي للقانون المعم م.‬
‫لقد ت م تطوير اتسلوب آخر لبناء القوانين، ويوجه هذا التسلوب بواتسطة دالة تقيي م كاهشفه ‪heuristic evaluation‬‬
              ‫‪ function‬لتقيي م جودة القانون بتطبيق خاصيتين مهمتين وهما الكمال ‪ completeness‬والتناغ م‬
                                                     ‫‪ .consistency‬ويت م احتساب قيمة جودة الداله باتستخدام‬

  ‫, ‪Quality ( rule‬‬   ‫‪α‬‬  ‫= )‬
                          ‫(‬‫−1‬‫+‬‫‪α‬‬
                              ‫+ + ‪consistencu ) completeness‬‬
                                                         ‫(‬            ‫‪α‬‬
                                                           ‫‪consistenc y ) consistency‬‬                          ‫)1(‬



                       ‫‪# correctly covered examples‬‬
  ‫= )‪consistency ( rule‬‬
                            ‫‪# covered examples‬‬

                            ‫‪# correctly covered examples‬‬
   ‫= )‪completeness ( rule‬‬
                         ‫‪# of examples of same class as rule‬‬
‫ويسبب الغاء احد هشروط القانون، زيادة غطاء القانون، بينما يعمل اضافة هشرط للقانون على زيادة نقاوة القانون.‬
      ‫يتعل م اريس ‪ ARIS‬القوانين )باتستخدام هذا التسلوب( بحيث تركز بشكل اكبر على التناغ م وبشكل اقل على‬
             ‫التغطيه ‪ ،coverage‬ولكن يمكن تغيير هذا بتعديل قيمة المتغير ‪ .α‬هذه دالة كاهشفه، نتجت من تجارب‬
    ‫وملحظا ت مع ‪ ARIS‬في عدة مجال ت فعليه. يعمل اعتماد جودة القانون على التناغ م كطريقه لبراز بعض‬
     ‫المرونه، والتكيف مع اوضاع متنوعه )مثل القوانين التي تغطي حال ت نادره او القوانين العامه جدا(. لقد ت م‬
‫تثبيت قيمة المتغير ‪ α‬ليساوي 8.0 وتعظي م جودة الداله )1(. ويساعد عامل الكمال او التمام على تفضيل القوانين‬
                                            ‫التي تغطي حال ت اكثر عندما يتساوى التناغ م كما يوضحه المثال ادناه:‬
             ‫بفرض ان لدينا عدد من البيانا ت =)01 حال ت منها 5 موجبه و عدد 5 تسالبه( واذا كان لدينا قانونين:‬
                                                              ‫قانون 1: يغطي 3 حال ت كلها تنتمي الى الصنف +‬
                                                      ‫والقانون 2: يغطي 4 حال ت ، كلها تنتمي الى الصنف + فان‬

                                                   ‫وللقانون 2‬                                             ‫للقنون الول‬

                                            ‫التناغ م=4÷4=1‬                                           ‫التناغ م=3÷3=1‬
                                          ‫الكمال=4÷5= 8.0‬                                          ‫الكمال=3÷5= 6.0‬

  ‫كما ترى، كل القانونين لهما القيمه) 1 ( لمعامل التناغ م بينما يختلف معامل الكمال. لذا فان اضافة عامل الكمال‬
   ‫تسيكون له معنى حيث ان معامل التناغ م وحده غير كاف. بعد تعل م كافة القوانين، يشكل ‪ ARIS‬تقديرا لوزان‬
                                      ‫تربط بكل قانون ويت م تقدير الوزن باتستخدام حال ت فئة التدريب بكاملها.‬

                                                                                        ‫5. احتساب وزن القانون‬
    ‫يت م تقدير وزن القانون من خلل تشكيله من الوزان لخصائص القانون، ويمكن تعريف وزن القانون بانه:‬
    ‫مقياس الثقه في معتقد القانون ‪ ، Rule's opinion‬مبرزا اهمية الشروط للعتقاد )الفتراض او الصنف( ،‬
       ‫ويسمح لنا هذا بمعايرة قوة القانون بطريقة عمليه. يصف الجدول 1 المصطلحا ت ذا ت العلقه بهذا الشأن.‬
                                      ‫ونستخدم نظرية باييز ‪ Bayes‬لهشتقاق الوزان لكل جزئيه في القانون.‬
‫تخيل فضاء عينه تقسمه الحداث 2‪ . ……,E1,E‬وافترض ان ‪ +H‬تعني حدث في الفضاء يشير الى صنف )او‬
                                                                                  ‫شّ‬
                                                                   ‫مفهوم( معين باحتمال > 0 )+‪،P(H‬‬
                                                                                                    ‫اذا‬
                ‫) ‪P(H + E j )P(E j‬‬
                     ‫|‬
  ‫= + ‪P(E j | H‬‬
             ‫)‬                     ‫= ‪,i‬‬‫..2,1‬
                     ‫) ‪+ E )P(E‬‬
               ‫∑‬ ‫‪P(H‬‬   ‫|‬  ‫‪i‬‬     ‫‪i‬‬

                                                                   ‫وكمثال بسيط ذو هشرطين وافتراضين)أو صنفين( ‪-h+,h‬‬

                                         ‫) 1‪P ( H + | E1 ) P ( E‬‬
  ‫= ) + ‪P( E I | H‬‬               ‫+‬
                          ‫‪P( H‬‬       ‫) 2 ‪| E1 ) P ( E1 ) + P ( H + | E 2 ) P ( E‬‬


                                 ‫+‬
                          ‫‪P( H‬‬       ‫) 1‪| E1 ) P ( E‬‬
  ‫=‬          ‫+‬                                ‫+‬
      ‫‪P( H‬‬       ‫‪| E1 ) P ( E1 ) + P ( H‬‬          ‫) 1‪|~ E1 ) P (~ E‬‬


                                  ‫+‬
                           ‫‪P( H‬‬       ‫) 1‪| E1 ) P ( E‬‬
  ‫=‬          ‫+‬                                ‫+‬
      ‫‪P( H‬‬       ‫‪| E1 ) P ( E1 ) + P ( H‬‬          ‫) 1‪|~ E1 ) P(1 −E‬‬

                                                                                     ‫يمكننا تعريف هذا بالمعادله 2 ادناه‬
                 ‫+‬
  ‫‪P(E 1 | H‬‬       ‫= )‬‫∗ ‪QA‬‬‫) 1 ‪P(E‬‬                                             ‫)2(‬




                                                                                                               ‫حيث ان‬
                                              ‫+‬
                                       ‫‪P( H‬‬       ‫) 1‪| E‬‬
  ‫= ‪QA‬‬               ‫+‬                              ‫+‬
         ‫‪P( H‬‬            ‫‪| E1 ) P ( E1 ) + P ( H‬‬        ‫)) 1‪|~ E1 )(1 −P ( E‬‬
‫او اتستخدام اصطلحا ت الجدول 1‬
                  ‫1‪x‬‬
  ‫= ‪QA‬‬
         ‫) 3 ‪x1 x 3 + x 2 (1 − x‬‬



  ‫وتقع قيمة ‪ QA‬في الفتره ]0,+‪ . [INF‬اذا نظرنا الى المعادله 2 على اتساس انها صيغة تحديث للمعتقد في 1‪E‬‬
    ‫فان قي م ‪ QA‬الكبر من 1 يبدو انها تزيد من 1‪ (P(E‬وبالمثل القي م الصغر من 1 تقلل من 1‪ .(P(E‬لذا يمكن‬
      ‫اعتبار ‪ QA‬على اتساس نها وزن ، يحمله الدليل ‪،E‬والذي يحرك المعتقد بهذا التجاه او ذاك. تدل الوزان‬
‫الموجبه على دليل داع م للصنف، وتدل الوزان السالبه على دليل عكسي يعارض الفتراض)او الصنف(. وتجمع‬
                                                        ‫الداله التاليه اوزان كل هشرط في وزن واحد للقانون‬

  ‫+ ]]) 1‪w = E1 + E 2 (1 − E1 ) + E3 [1 −w E1 + E 2 (1 − E‬‬
     ‫‪w‬‬    ‫‪w‬‬        ‫‪w‬‬      ‫‪w‬‬       ‫[‬     ‫‪w‬‬        ‫‪w‬‬        ‫...‬




    ‫حيث ان ‪ W‬هي وزن القانون. ويحسب هذا تأرثير الختبارا ت في مقدمة القانون ،حيث ان 0=>1=<‪.W‬‬
‫ولكننا مهتمين بحصر قي م وزن الدليل في الفتره ]-1,+1[. لذا فقد اتستخدمت الداله التاليه لحالة القيمه الى المدى‬
                                                                                                   ‫المطلوب‬

‫)‪W=F(QA‬‬
                                                                                                        ‫حيث ان‬
                     ‫‪2QA‬‬
  ‫‪where‬‬      ‫= )‪F(QA‬‬     ‫−‬‫1‬
                    ‫+1‬‫‪QA‬‬



   ‫وتنتج هذه المعادله قيمة للوزن في المدى ]-1,+1[. الوزن للقانون هو اندماج لوزان اختباراته ، واتستخدم هذا‬
                        ‫الوزن كمعيار ترتيب لتنظي م القانون وللمساعده في التصنيف وايضا داعما لعملية التنقيح.‬

                                             ‫6. المعرفه الخاطصه بالتنقيح ‪Refinement knowledge‬‬
        ‫الهدف من تنقيح قاعدة المعرفه هو تقليل عدد الخطاء الموجبه ‪ false positive‬والخطاء السالبه ‪false‬‬
     ‫‪ negative‬في حال ت جديده، مع تقليل عدد الخطاء الجديده الموجبه والسالبه في الحال ت المشخصه حديثا.‬
    ‫وحيث أن هناك علقه بين الكمال والتناغ م عند تنقيح قاعدة المعرفه فاننا نعرف جودة قاعدة المعرفه كما يلي:‬
                                  ‫شّ‬

  ‫,‪Quality ( KB‬‬    ‫‪α‬‬  ‫+−= )‬
                        ‫(‬‫1‬         ‫‪α‬‬
                           ‫+ + ‪consistency ) completeness‬‬
                                                      ‫(‬                 ‫‪α‬‬
                                                        ‫‪consistency ) consistency‬‬



                ‫‪# correctly covered cases‬‬
  ‫= ‪completeness‬‬
                      ‫‪# of all cases‬‬

               ‫‪# correctly covered cases‬‬
  ‫= ‪consistency‬‬
                    ‫‪# covered cases‬‬




      ‫خلل تجاربنا، ت م تثبيت القيمه 8.0 للمتغير ‪ .α‬وهذا يحقق الهدف المنشود للتنقيح والذي يحسب جودة قاعدة‬
                                                                    ‫المعرفه كتشكيله من الكمال والتناغ م.‬

                                                                                             ‫7. نتائج عمليه‬

         ‫حاول البحث المعروض في هذه الورقه ايجاد طريقة افضل لتستغلل المعلوما ت في مجال ت بها البيانا ت‬
                           ‫المتاحه كبيرة الحج م وتنمو باتستمرار، مثل بيئا ت تجميع البيانا ت المؤتمته ‪.automated‬‬
‫الجدول 2 يلخص تجارب توضح التحسن في دقة التصنيف بعد انتهاء عمليا ت التنقيح. العمود الول في الجدول 3‬
                                                                ‫شّ‬
    ‫يصف المجال المستخدم في التجارب، وت م دمج الجدول في رثلرثة مجاميع: المجموعة الولى تلخص النتائج قبل‬
   ‫وبعد التنقيح لقواعد معرفه صنعها نظام ‪ ARIS‬وت م فيها اتستخدام معياري الكمال والتناغ م، وتحتوي المجموعه‬
‫الثانيه على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه طورها نظام 5.4‪ .C‬اما المجموعة الثالثه‬
       ‫فتحتوي على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه اختلقها نظام ‪ .RIPPER‬وفي كل‬
                                                                            ‫مجموعه ت م تقدي م المعلوما ت التاليه:‬
‫العمود المعنون "‪ "rules‬يشير الى متوتسط عدد القوانين في قاعدة المعرفه لعدد عشرة اختبارا ت اختير ت‬
                                                                                          ‫عشوائيا في كل مجال.‬
                      ‫العمود "‪ "%acc‬يعطي دقة التنبؤ لقاعدة المعرفه على فئة بيانا ت معينه لعدد 01 محاول ت‬
                                                                                     ‫شّ‬
                            ‫وتشير العلما ت ) √ ( الى ان عمليا ت التنقيح نتج عنها تحسن في دقة قاعدة المعرفه.‬
                                            ‫شّ‬     ‫شّ‬
  ‫وتعد مركمة قاعدة المعرفه خاصيه هامه للتحليل، اذ يعمل كل من نظام ‪) ARIS‬نقصد انتاج القوانين باتستخدام‬
   ‫خاصيتي الكمال والتناغ م( ونظام 5.4‪ C‬على انتاج قوانين من نماذج هشجرة قرار مستقراه بتحليل قاعدة بيانا ت‬
      ‫مكونه من امثله، وكل النظامين ينتج قوانين زائده.تحذف هذه القوانين الزائده خلل دورة التنقيح. ومن جهة‬   ‫شّ‬
       ‫اخرى ينتج نظام ‪ RIPPER‬قواعد معرفه موجزه، وهناك حاجه لضافة قوانين كنتيجة لمعلوما ت اضافيه‬
         ‫وخاصة في حالة ما ل م يعمل تعمي م القوانين الحاليه في المساعدة على تغطية البيانا ت التي تت م مصادفتها.‬

                                                                                 ‫8. المقارنه بين ةثلةثة انظمه‬
  ‫الهدف من هذا الجزء هو تحديد متى يمكن لتستراتيجية التقيي م إحداث نتائج افضل من تدريب نظام التعل م على‬
                                            ‫كافة البيانا ت المتاحه، ويتضمن اتسلوبنا في المقارنه، التستراتيجية التاليه:‬
 ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب نظام التعل م على 04% من البيانا ت المتاحه رث م تنقيحها باتستخدام‬
                                                                                   ‫02% من البيانا ت المتوفره‬
                        ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب النظام باتستخدام 06% من البيانا ت المتاحه‬
                   ‫• قارن الداء لقواعد المعرفه المنتجه وذلك باختبار التسلوبين على باقي البيانا ت )04%(.‬
    ‫• الجدول 3 هو مقارنه اخرى للنظمة الثلرثه أي 5.4‪ ،ARIS ، C‬و نظام ‪ RIPPER‬على مجال ت‬
 ‫اختبار منتقاه. تمت مقارنة نتائج التقيي م لقواعد معرفه مستقراه بواتسطة دمج كل من فئة بيانا ت التدريب‬
       ‫وفئة بيانا ت التنقيح كفئة تدريب مدمجه، وهذا يعطي مقارنه عادله بين كل من ‪،ARIS‬و 5.4‪ ،C‬و‬
 ‫‪ .RIPPER‬يبين العمود الول المجال المستخدم، ويوضح العمود الثاني اداء نظام ‪ ARIS‬على بيانا ت‬
   ‫الختبار حينما يدرب على 04% من البيانا ت المتاحه. ويعطي العمود الثالث اداء نظام ‪ ARIS‬على‬
         ‫نفس بيانا ت الختبار عند تدريبه على بيانا ت التدريب المدمجه )أي بيانا ت التدريب والتنقيح معا(.‬
 ‫ويعطي العمود الرابع اداء قاعدة المعرفه على بيانا ت الختبار بعد التنقيح. العمود الخامس يزودنا باداء‬
         ‫نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على 04% من البيانا ت المتاحه. اما العمود السادس‬
   ‫فيوضح اداء نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على البيانا ت مدمجة. ويشير العمود السابع‬
    ‫الى اداء قاعدة المعرفه المنقحة والمستقراة بواتسطة نظام 5.4‪ C‬على نفس بيانا ت الختبار. يوضح‬
                                                                                  ‫شّ‬
         ‫العمود الثامن اداء نظام ‪ RIPPER‬على ذا ت بيانا ت الختبار عند تدريبه على 04% من البيانا ت‬
    ‫المتوفره. ويعطي العمود التاتسع اداء نظام ‪ RIPPER‬على بيانا ت الختبار عند تدريبه على البيانا ت‬
     ‫مدمجة. ويبرز العمود العاهشر اداء قاعدة المعرفه المنقحه والمستقراة بواتسطة ‪ RIPPER‬على نفس‬
                                                       ‫شّ‬
                                                                                              ‫بيانا ت الختبار.‬
     ‫وتشير العلما ت ) √( الى المواضع التي انتجت فيهاعملية التدريب متبوعة بالتنقيح نتائج جيده افضل من تلك‬
                                                            ‫المتحصل عليها عن طريق التدريب على البيانا ت بأكملها.‬
    ‫وتوضح التجارب الفرق الواضح في اتستقراء القوانين بين كل من نظامي 5.4‪C‬و ‪ .RIPPER‬بالتحديد، يولد‬
      ‫شّ‬
     ‫نظام 5.4‪ C‬العديد من القوانين والتي يؤدي بعضها الى تضارب فيما بين القوانين. ويعمل نسق التنقيح المبين‬
         ‫شّ‬
 ‫على الغاء مثل هذه القوانين الزائده مما يزيد من دقة قاعدة المعرفه. من ناحية اخرى ، يعمل اتسلوب ‪RIPPER‬‬
                                                                   ‫شّ‬
        ‫في اتستقراء القوانين على انتاج عدد اقل من القوانين، لذا فانه خلل التنقيح يؤدي نظام ‪ ARIS‬عدد اكبر من‬
     ‫عمليا ت بناء القوانين ويظهر القليل من عمليا ت الغاء القوانين على قواعد المعرفه الخاصه بنظام ‪.RIPPER‬‬
        ‫باختصار، تعمل آلية التنقيح على تحسين جودة وصف الصناف لكافة الخوارزميا ت في رثلرثة مجال ت طبيه‬
      ‫)وهي ‪ Hepatitis‬و ‪ Hypothyroid‬و ‪( Heart‬وهي ذا ت معضل ت مثل التشويش )عدم النقاوه( و مشكلة‬
   ‫الحال ت الخاصه الصغرى. وفوق ذلك ت م الحصول على تحسينا ت على عدة مجال ت اخرى عديده اتستخدم فيها‬
‫نظامي 5.4‪ C‬و ‪ ARIS‬على التوالي. لذا ينصح بان تستخدم نظ م التعل م آلية تنقيح على بيانا ت اختبار والتي تكون‬
   ‫منفصله عن بيانا ت التدريب المستخدمة في اتستقراء قاعدة المعرفه كما في نظام ‪ RIPPER‬و 5.4‪ C‬للحصول‬
                                                                                 ‫على اوصاف مفاهي م ذا ت جودة عاليه.‬

                                                                                                    ‫9. الستنتاج‬
    ‫تعرضت هذه الورقه لمسألة بناء اوصاف مفاهي م ‪ concept descriptions‬في مجال ت كبيرة الحج م،‬
    ‫حتى يمكن التستفاده من كميا ت هائله من البيانا ت المتزايده باتستمرار. وت م تطوير نموذج تنقيح اتستقرائي قادر‬
‫على بناء قواعد معرفه من مكتبة من الحال ت المصنفة مسبقا، وتحديثها باتستمرار لتضمين حقائق جديده. ان لهذا‬
                                                         ّ‫ش‬
           .‫النموذج اهمية خاصه في المجال ت المتغيرة والمشوهشه مثل معامل ت بطاقة العتماد والصور الطبيه‬
                                                          ّ‫ش‬
.(‫لقد طورنا اتسلوبا لتعل م وزن القانون معتمدا على تقدير للعلقه بين هشروط القانون وخاتمة القانون )او التستنتاج‬
                               .‫ورتبت القوانين طبقا لوزانها لتحديد الحال ت التي أخطيء في تصنيفها بسهولة‬

                                                                                               ‫01. المراجع‬
[1] Aha David w., Goldstone Robert L., Concept learning and flexible weighting,
Proceedings of the Fourteenth Annual Conference of the cognitive Science Society,
Bloomington, 1992, pp. 534-539.
[2] Benferhat Salem, Dobois Didier, Prode Heneri, Nonmonotonic reasoning,
Conditional objects and possibility theory. Artificial Intelligence,1997, pp. 259-276
[3] Breiman Leo, Friedman Jerome, Olshen Richard, Stone Charles, Classification
and regression trees. Wadsworth, Pacific Grove, CA, 1984.
[4] Brunk Clifford. An investigation of knowledge intensive approaches to concept
learning and theory refinement. Ph.D. thesis, University of California,
   1996.
[5] Greiner Russell, The complexity of theory revision, Proceedings of the Fourteenth
International Joint Conference on Artificial Intelligence, Montreal, 1995.
[6] Quinlan John Ross, C4.5, Programs for machine learning, Morgan Kaufman,
1993.
‫الرمز‬                                                                                                                                ‫الوصف‬
             ‫‪Ei‬‬                                                                                            ‫تشير الى حدث او دليل )02=<‪.(eg. Age‬‬
          ‫~ ‪Ei‬‬                                                                                               ‫تشير الى متم م الحدث 02>‪((Ei eg. Age‬‬
          ‫+‬
           ‫‪H‬‬                                                                   ‫تدل على فضاء الحال ت الموجبه للفرضيه او الصنف )‪(eg. Healthy‬‬
            ‫-‬
             ‫‪H‬‬                                                                                ‫تدل على فضاء الحال ت السالبه للفتراض )‪(eg. Sick‬‬
        ‫‪(P(Ei‬‬                                   ‫تمثل التوزيع المسبق للكائنا ت او الحال ت في مدى الشرط نسبة الى العدد الكلي للمثله )02>‪.((e.g. P(Age‬‬
 ‫‪(X1 = P(H|Ei‬‬                                                          ‫‪.(Ei‬‬   ‫الجزء من الحال ت الموجبه المغطاة بالشرط ‪(i.e. True positives TP‬‬
‫‪(X2 = P(H|~Ei‬‬                                        ‫‪ Ei‬نسبة الى متم م ‪.(Ei (i.e. False negatives FN‬‬       ‫جزء الحال ت الموجبه غير المغطاه بالشرط‬
     ‫‪(X3=P(Ei‬‬                                                                              ‫جزء الحال ت التي يشملها الدليل ‪ E‬نسبة الى العدد الكلي‬


                                                                                              ‫الجدول 1: اطصطلحات وزن الشرط بالقانون‬

                                             ‫نظام أريس مستخدما الكمال والتناغم‬                                                            ‫نظام 5.4‪C‬‬                                                                        ‫نظام ‪RIPPER‬‬
    ‫المجال‬                                        ‫قبل التنقيح‬                           ‫بعد التنقيح‬                               ‫قبل التنقيح‬                    ‫بعد التنقيح‬                             ‫قبل التنقيح‬                               ‫بعد التنقيح‬


                              ‫# ‪rules‬‬           ‫‪% Acc‬‬              ‫‪% Acc‬‬              ‫# ‪rules‬‬              ‫# ‪rules‬‬           ‫‪% Acc‬‬                    ‫‪% Acc‬‬                    ‫# ‪rules‬‬         ‫# ‪rules‬‬                 ‫‪% Acc‬‬            ‫‪% Acc‬‬                    ‫# ‪rules‬‬


  ‫بيانات نبات السوسن‬      ‫6.2‬                ‫71.39‬             ‫√‬     ‫76.59‬        ‫3‬                   ‫6.4‬                  ‫5.39‬                 ‫5.39‬                    ‫5.2‬              ‫6.2‬                    ‫76.09‬               ‫√‬      ‫99.09‬          ‫1.3‬

         ‫بيانات النبيذ‬    ‫1.3‬                ‫63.78‬             ‫√‬     ‫21.88‬        ‫1.4‬                 ‫7.5‬                  ‫27.98‬                ‫27.98‬                   ‫3.4‬              ‫8.2‬                    ‫52.68‬               ‫√‬      ‫46.78‬          ‫8.3‬

   ‫بيانات التهاب الكبد‬    ‫3‬                  ‫55.87‬             ‫√‬     ‫25.97‬        ‫5.4‬                 ‫9.5‬                  ‫23.08‬                ‫√‬      ‫16.18‬            ‫7.3‬              ‫3.1‬                    ‫62.77‬               ‫√‬      ‫85.77‬          ‫4.3‬

   ‫بيانات الغدة الدرقيه‬   ‫4.3‬                ‫98.79‬             ‫√‬     ‫2.89‬         ‫5.4‬                 ‫6.7‬                  ‫99.69‬                ‫√‬      ‫76.79‬            ‫1.5‬              ‫5.2‬                    ‫4.89‬                ‫4.89‬                  ‫6.2‬

          ‫بيانات القلب‬    ‫8.62‬               ‫39.84‬             ‫√‬    ‫95.94‬         ‫2.62‬                ‫9.83‬                 ‫62.94‬                ‫√‬      ‫66.05‬            ‫3.21‬             ‫9.2‬                    ‫2.25‬                ‫√‬      ‫30.35‬          ‫5.9‬

    ‫بيانات راية الدوله‬    ‫2.13‬               ‫93.65‬             ‫√‬     ‫2.85‬         ‫9.51‬                ‫33‬                   ‫3.55‬                 ‫√‬      ‫42.06‬            ‫2.41‬             ‫6.8‬                    ‫98.25‬               ‫√‬      ‫66.55‬          ‫7.31‬

      ‫بيانات السمعيات‬     ‫9.22‬               ‫40.34‬             ‫√‬    ‫20.94‬         ‫1.61‬                ‫2.32‬                 ‫20.44‬                ‫√‬         ‫6.94‬          ‫6.21‬             ‫8.21‬                   ‫65.66‬               ‫√‬      ‫40.86‬          ‫8.21‬

          ‫بيانات الفطر‬    ‫7.22‬               ‫96.99‬             ‫√‬    ‫58.99‬         ‫8.9‬                 ‫3.43‬                 ‫74.89‬                ‫√‬       ‫5.89‬            ‫6.31‬             ‫5.7‬                    ‫48.99‬               ‫68.99‬                 ‫5.7‬

      ‫بيانات الراشدين‬     ‫8.061‬              ‫34.17‬             ‫44.17‬              ‫1.75‬                ‫822‬                  ‫26.77‬                ‫√‬      ‫16.87‬            ‫4.63‬             ‫4‬                      ‫72.18‬               ‫72.18‬                 ‫5.7‬

    ‫بيانات اطصطناعيه‬      ‫4.91‬               ‫90.89‬             ‫√‬    ‫11.89‬         ‫3.02‬                ‫9.74‬                 ‫0.29‬                 ‫√‬      ‫6.39‬             ‫2.33‬             ‫6.51‬                   ‫43.69‬               ‫53.69‬                 ‫9.71‬




                                                        ‫الجدول رقم 2: أداء عملية التنقيح على ةثلةثة انظمة تعلم، أتخذ المتوسط لعدد 01 تجارب لكل مجال‬




 ‫المجال‬                                      ‫‪ ARIS‬باستخدام التناغم والكمال‬                                                              ‫نظام 5.4‪C‬‬                                                                         ‫نظام ‪RIPPER‬‬
                          ‫التدريب باستخدام‬          ‫التدريب على بيانات‬     ‫قاعدة معرفه منقحه‬
                                                                             ‫بّ‬                         ‫التدريب باستخدام‬             ‫التدريب على بيانات‬            ‫قاعدة معرفه منقحه‬
                                                                                                                                                                     ‫بّ‬                      ‫التدريب باستخدام‬            ‫التدريب على بيانات‬          ‫قاعدة معرفه منقحه‬
                                                                                                                                                                                                                                                       ‫بّ‬
‫04%‬           ‫مدمجه‬                              ‫04%‬               ‫مدمجه‬                              ‫04%‬           ‫مدمجه‬
‫بيانات نبات السوسن‬     ‫71.39‬         ‫76.39‬           ‫√‬      ‫76.59‬       ‫5.39‬              ‫0.49‬               ‫5.39‬            ‫76.09‬         ‫33.39‬           ‫99.09‬

       ‫بيانات النبيذ‬   ‫63.78‬         ‫27.98‬           ‫21.88‬              ‫27.98‬             ‫0.09‬               ‫27.98‬           ‫52.68‬         ‫41.09‬           ‫46.78‬

 ‫بيانات التهاب الكبد‬   ‫55.87‬         ‫93.87‬           ‫√‬      ‫25.97‬       ‫23.08‬             ‫69.77‬              ‫√‬       ‫16.18‬   ‫62.77‬         ‫49.67‬           ‫√‬       ‫85.77‬

‫بيانات الغدة الدرقيه‬   ‫98.79‬         ‫41.89‬           ‫√‬      ‫2.89‬        ‫99.69‬             ‫42.79‬              ‫√‬       ‫76.79‬   ‫4.89‬          ‫02.89‬           ‫√‬       ‫4.89‬

        ‫بيانات القلب‬   ‫39.84‬         ‫50.74‬           ‫95.94 √‬            ‫62.94‬             ‫91.05‬              ‫√‬       ‫66.05‬   ‫2.25‬          ‫12.25‬           ‫√‬   ‫30.35‬

  ‫بيانات راية الدوله‬   ‫93.65‬         ‫46.95‬           ‫2.85‬               ‫3.55‬              ‫45.55‬              ‫√‬       ‫42.06‬   ‫98.25‬         ‫32.75‬           ‫66.55‬

   ‫بيانات السمعيات‬     ‫40.34‬         ‫02.04‬           ‫20.94 √‬            ‫20.44‬             ‫21.34‬              ‫√‬       ‫21.94‬   ‫65.66‬         ‫96.07‬           ‫40.86‬

        ‫بيانات الفطر‬   ‫96.99‬         ‫77.99‬           ‫√‬      ‫58.99‬       ‫74.89‬             ‫73.89‬              ‫√‬       ‫5.89‬    ‫48.99‬         ‫78.99‬           ‫68.99‬

    ‫بيانات الراشدين‬    ‫34.17‬         ‫79.07‬           ‫√‬      ‫44.17‬       ‫26.77‬             ‫70.87‬              ‫√‬       ‫16.87‬   ‫72.18‬         ‫22.28‬           ‫72.18‬

  ‫بيانات اطصطناعيه‬     ‫90.89‬         ‫68.89‬           ‫11.89‬              ‫0.29‬              ‫61.89‬              ‫6.69‬            ‫43.69‬         ‫35.79‬           ‫53.69‬



                                                                    ‫الجدول رقم 3 :مقارنة أداء ةثلةثة انظمه‬

More Related Content

Viewers also liked

Ai in education
Ai in educationAi in education
Ai in educationarteimi
 
part of speech tagger for ARABIC TEXT
part of speech tagger for ARABIC TEXTpart of speech tagger for ARABIC TEXT
part of speech tagger for ARABIC TEXTarteimi
 
أهمية إدارة المعلومات في تخطيط موارد المؤسسة
أهمية إدارة المعلومات في تخطيط موارد المؤسسةأهمية إدارة المعلومات في تخطيط موارد المؤسسة
أهمية إدارة المعلومات في تخطيط موارد المؤسسةarteimi
 
الذكاء الإصطناعي والنظم الخبيرة
الذكاء الإصطناعي والنظم الخبيرةالذكاء الإصطناعي والنظم الخبيرة
الذكاء الإصطناعي والنظم الخبيرةarteimi
 
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIES
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIESUTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIES
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIESarteimi
 
rule refinement in inductive knowledge based systems
rule refinement in inductive knowledge based systemsrule refinement in inductive knowledge based systems
rule refinement in inductive knowledge based systemsarteimi
 
الجودة في التعليم التقني
الجودة في التعليم التقنيالجودة في التعليم التقني
الجودة في التعليم التقنيarteimi
 
RANCANGAN PENGAJARAN HARIAN
RANCANGAN PENGAJARAN HARIANRANCANGAN PENGAJARAN HARIAN
RANCANGAN PENGAJARAN HARIANBukhori Mohamad
 
Ai in education2
Ai in education2Ai in education2
Ai in education2arteimi
 

Viewers also liked (10)

Ai in education
Ai in educationAi in education
Ai in education
 
part of speech tagger for ARABIC TEXT
part of speech tagger for ARABIC TEXTpart of speech tagger for ARABIC TEXT
part of speech tagger for ARABIC TEXT
 
أهمية إدارة المعلومات في تخطيط موارد المؤسسة
أهمية إدارة المعلومات في تخطيط موارد المؤسسةأهمية إدارة المعلومات في تخطيط موارد المؤسسة
أهمية إدارة المعلومات في تخطيط موارد المؤسسة
 
الذكاء الإصطناعي والنظم الخبيرة
الذكاء الإصطناعي والنظم الخبيرةالذكاء الإصطناعي والنظم الخبيرة
الذكاء الإصطناعي والنظم الخبيرة
 
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIES
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIESUTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIES
UTILIZING COOPERATIVE LEARNING FOR IT GRADUATE STUDIES
 
rule refinement in inductive knowledge based systems
rule refinement in inductive knowledge based systemsrule refinement in inductive knowledge based systems
rule refinement in inductive knowledge based systems
 
الجودة في التعليم التقني
الجودة في التعليم التقنيالجودة في التعليم التقني
الجودة في التعليم التقني
 
RANCANGAN PENGAJARAN HARIAN
RANCANGAN PENGAJARAN HARIANRANCANGAN PENGAJARAN HARIAN
RANCANGAN PENGAJARAN HARIAN
 
Ai in education2
Ai in education2Ai in education2
Ai in education2
 
Presentación universidad udi
Presentación universidad udiPresentación universidad udi
Presentación universidad udi
 

Similar to Active learning arabic

العوامل المؤثرة في كفاءة عمليات استرجاع المعلومات
العوامل المؤثرة في كفاءة عمليات استرجاع المعلوماتالعوامل المؤثرة في كفاءة عمليات استرجاع المعلومات
العوامل المؤثرة في كفاءة عمليات استرجاع المعلوماتالدكتور طلال ناظم الزهيري
 
النظم الخبيرة في مجال التصنيف
النظم الخبيرة في مجال التصنيفالنظم الخبيرة في مجال التصنيف
النظم الخبيرة في مجال التصنيفnada labib
 
First lecture
First lectureFirst lecture
First lectureghayth
 
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...Dr. Ahmed Farag
 
Uml use case diagram
Uml use case diagram Uml use case diagram
Uml use case diagram Sally Jarkas
 
قراءات في نظم المعلومات المحاسبية - الجزء الأول
قراءات في نظم المعلومات المحاسبية - الجزء الأولقراءات في نظم المعلومات المحاسبية - الجزء الأول
قراءات في نظم المعلومات المحاسبية - الجزء الأولHeba ElKomy
 
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوض
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوضبيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوض
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوضMuhammad Muawwad
 
تأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةتأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةBelghanami Wassila Nadjet
 
عرض تقديمي1
عرض تقديمي1عرض تقديمي1
عرض تقديمي1allawee242
 
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المرورية
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المروريةلمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المرورية
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المروريةWedadZein95
 
ميادين الذكاء الاصطناعي
ميادين الذكاء الاصطناعيميادين الذكاء الاصطناعي
ميادين الذكاء الاصطناعيnada labib
 
Future library system
Future library systemFuture library system
Future library systembasant3nter
 

Similar to Active learning arabic (20)

العوامل المؤثرة في كفاءة عمليات استرجاع المعلومات
العوامل المؤثرة في كفاءة عمليات استرجاع المعلوماتالعوامل المؤثرة في كفاءة عمليات استرجاع المعلومات
العوامل المؤثرة في كفاءة عمليات استرجاع المعلومات
 
النظم الخبيرة في مجال التصنيف
النظم الخبيرة في مجال التصنيفالنظم الخبيرة في مجال التصنيف
النظم الخبيرة في مجال التصنيف
 
First lecture
First lectureFirst lecture
First lecture
 
First lecture
First lectureFirst lecture
First lecture
 
النظام التعليمي
النظام التعليمي النظام التعليمي
النظام التعليمي
 
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...
أنظمة البحث التجميعي المفاهيم والبناء الهيكلي وآليات التقويم في مؤسسات المعلو...
 
المشروع
المشروعالمشروع
المشروع
 
Erp
ErpErp
Erp
 
28438
2843828438
28438
 
Uml use case diagram
Uml use case diagram Uml use case diagram
Uml use case diagram
 
قراءات في نظم المعلومات المحاسبية - الجزء الأول
قراءات في نظم المعلومات المحاسبية - الجزء الأولقراءات في نظم المعلومات المحاسبية - الجزء الأول
قراءات في نظم المعلومات المحاسبية - الجزء الأول
 
Scada
ScadaScada
Scada
 
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوض
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوضبيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوض
بيبفلو : مشروع انسيابية العمل الببليوجرافي / ترجمة محمد عبد الحميد معوض
 
Types of information systems
Types of information systemsTypes of information systems
Types of information systems
 
تأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةتأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسة
 
عرض تقديمي1
عرض تقديمي1عرض تقديمي1
عرض تقديمي1
 
نشاط
نشاط نشاط
نشاط
 
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المرورية
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المروريةلمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المرورية
لمحة عن بعض الطرق المدروسة للتنبؤ بالكثافة المرورية
 
ميادين الذكاء الاصطناعي
ميادين الذكاء الاصطناعيميادين الذكاء الاصطناعي
ميادين الذكاء الاصطناعي
 
Future library system
Future library systemFuture library system
Future library system
 

More from arteimi

Nils nilson
Nils nilsonNils nilson
Nils nilsonarteimi
 
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبيا
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبياتحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبيا
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبياarteimi
 
My paper for philippine conference
My paper for philippine conferenceMy paper for philippine conference
My paper for philippine conferencearteimi
 
My paper for philippine conference
My paper for philippine conferenceMy paper for philippine conference
My paper for philippine conferencearteimi
 
Double transform contoor extraction
Double transform contoor extractionDouble transform contoor extraction
Double transform contoor extractionarteimi
 
Utilising learning styles
Utilising learning stylesUtilising learning styles
Utilising learning stylesarteimi
 
Electronic publishing
Electronic publishingElectronic publishing
Electronic publishingarteimi
 

More from arteimi (7)

Nils nilson
Nils nilsonNils nilson
Nils nilson
 
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبيا
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبياتحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبيا
تحديات تطبيق تقنيات انطمة الدفع الالكتروني في ليبيا
 
My paper for philippine conference
My paper for philippine conferenceMy paper for philippine conference
My paper for philippine conference
 
My paper for philippine conference
My paper for philippine conferenceMy paper for philippine conference
My paper for philippine conference
 
Double transform contoor extraction
Double transform contoor extractionDouble transform contoor extraction
Double transform contoor extraction
 
Utilising learning styles
Utilising learning stylesUtilising learning styles
Utilising learning styles
 
Electronic publishing
Electronic publishingElectronic publishing
Electronic publishing
 

Recently uploaded

في قضية اللفظ والمعني والبعض من آراء العلماء
في قضية اللفظ والمعني والبعض من آراء العلماءفي قضية اللفظ والمعني والبعض من آراء العلماء
في قضية اللفظ والمعني والبعض من آراء العلماءneamam383
 
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .ppt
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .pptالفعل الصحيح والفعل المعتل ونواعه لفيف نقص .ppt
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .pptNaeema18
 
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...MaymonSalim
 
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...belalabdelmoniem1
 
أنواع الحياة والاغراض الشعرية في العصر الجاهلي
أنواع الحياة والاغراض الشعرية في العصر الجاهليأنواع الحياة والاغراض الشعرية في العصر الجاهلي
أنواع الحياة والاغراض الشعرية في العصر الجاهليneamam383
 
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...MaymonSalim
 
إسنــــاد الأفعال. إلى الضمائر.pptx
إسنــــاد الأفعال.    إلى الضمائر.pptxإسنــــاد الأفعال.    إلى الضمائر.pptx
إسنــــاد الأفعال. إلى الضمائر.pptxssusere01cf5
 

Recently uploaded (7)

في قضية اللفظ والمعني والبعض من آراء العلماء
في قضية اللفظ والمعني والبعض من آراء العلماءفي قضية اللفظ والمعني والبعض من آراء العلماء
في قضية اللفظ والمعني والبعض من آراء العلماء
 
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .ppt
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .pptالفعل الصحيح والفعل المعتل ونواعه لفيف نقص .ppt
الفعل الصحيح والفعل المعتل ونواعه لفيف نقص .ppt
 
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...
الكامل في إثبات أن حديث اذهبوا فأنتم الطلقاء حديث آحاد مختلف فيه بين ضعيف ومت...
 
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...
(بلال عبد المنعم شفيق-الفرقة الثالثة - شعبة عام لغة عربية - كلية التربية بقنا...
 
أنواع الحياة والاغراض الشعرية في العصر الجاهلي
أنواع الحياة والاغراض الشعرية في العصر الجاهليأنواع الحياة والاغراض الشعرية في العصر الجاهلي
أنواع الحياة والاغراض الشعرية في العصر الجاهلي
 
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...
الكامل في اتفاق الصحابة والأئمة أن من لم يؤمن بمحمد رسول الله فهو كافر مشرك و...
 
إسنــــاد الأفعال. إلى الضمائر.pptx
إسنــــاد الأفعال.    إلى الضمائر.pptxإسنــــاد الأفعال.    إلى الضمائر.pptx
إسنــــاد الأفعال. إلى الضمائر.pptx
 

Active learning arabic

  • 1. ‫التعلم النشط واستقراء قاعدة المعرفه‬ ‫د. وجدي سالم بسباس‬ ‫د. محمد ابوالقاسم الرتيمي‬ ‫قسم علوم الحاسوب‬ ‫قسم هندسة الحاسوب‬ ‫جامعة السابع من ابريل‬ ‫جامعة السابع من ابريل‬ ‫بريد الكتروني ‪act@lttnet.net‬‬ ‫بريد الكتروني ‪artemi@yahoo.com‬‬ ‫مستخلص‬ ‫تعرض هذه الورقه طرقا لتعزيز دقة انظمة التعل م التستقرائي، وتهت م بمسائل: تعل م قواعد الرثر ‪production‬‬ ‫مُ‬ ‫‪ rules‬في مهام تصنيف متعددة الفئه ‪ multi-class classification tasks‬في مجال ت مشوهشه ، والبقاء‬ ‫شّ‬ ‫على تعل م مستمر عند مصادفة وضع جديد عقب انتهاء مرحلة التعل م الولى، وتصنيف كائن ما ‪ object‬عندما ل‬ ‫يوجد قانون ينطبق على ذلك الكائن.‬ ‫لقد اوضحنا ان دمج نسق تقيي م الداء والتعل م يعمل على تقدي م تصنيفا ت دقيقه لفئا ت بيانا ت واقعيه. وتعرض‬ ‫الورقه النظام أريس ‪ ARIS‬الذي يحقق هذا التسلوب، وقد تبين ان التصنيفا ت الناتجه هي غالبا أدق من تلك التي‬ ‫توفر ت عن طريق قواعد المعرفه غير المنقحه.‬ ‫يعتمد قرار التصمي م الرئيسي في نظام اريس على ترتيب القوانين ‪ Rules‬طبقا لوزانها، ويت م تعل م وزن القانون‬ ‫باتستخدام نظرية باييز لحساب اوزان هشروط القانون ودمجها، ويركز هذا النموذج على تحليل قاعدة المعرفه‬ ‫ويساند عملية التنقيح بكفاءة.‬ ‫ان هذا النظام )أي اريس ‪ (ARIS‬ليس تفاعليا، ويعتمد على كاهشفا ت ‪ heuristics‬لتركيز عملية التنقيح على تلك‬ ‫التجارب التي تبدو اكثر تناغما مع فئة بيانا ت التنقيح. ويتكون الطار التصميمي لنظام ‪ ARIS‬من نموذج جدولي‬ ‫لتمثيل اوزان القانون والعلقه بين حال ت التنقيح والقوانين التي تفي )او تنطبق على( كل حاله لتركيز عملية‬ ‫التنقيح، وقد اتستخدم النظام لتنقيح قواعد معرفه صنعها ‪ ARIS‬بنفسه، وكذلك تنقيح قواعد معرفه اختلقها نظام‬ ‫‪ RIPPER‬ونظام 5.4‪ C‬في عشرة ميادين ت م اختياها.‬ ‫الكلمات المفتاحيه: الذكاء الطصطناعي، تعلم الله، تنقيح قاعدة المعرفه، التعلم النشط‬ ‫1. مقدمه:‬ ‫لقد ادى التطور في تقنية قواعد البيانا ت واتصال ت الحاتسوب الى انتاج مستودعا ت بيانا ت ضخمه وكفؤه‬ ‫في كل المجال ت، مثل معامل ت بطاقة العتماد، والصور الطبيه و عمليا ت مسح الفضاء الجوي كلها تخزن في‬ ‫قواعد بيانا ت ضخمه تتزايد باتستمرار. وتحتاج هذه البيانا ت للتحليل واهشتقاق معلوما ت ذا ت مستوى عال ويمكن‬ ‫ان تكون مجديه في اتخاذ القرارا ت وفي فه م العملية المنتجه للبيانا ت. ولنظمة من هذا النوع نحتاج الى اتساليب‬ ‫مؤتمته تمكنها من اكتساب معرفه لصنع القرارا ت.‬ ‫يحاول الناس فه م الطبيعه بواتسطة ايجاد تبسيط لهذه الطبيعه )يدعى نموذج(. ويمثل هذا النموذج احداث في البيئه‬ ‫والتشابها ت بين الكائنا ت . تجمع الكائنا ت المتشابهة في اصناف ‪ classes‬رث م تبنى قوانين ‪ rules‬للتنبؤ بسلوك‬ ‫كائنا ت ‪ objects‬جديده لذلك الصنف. نحاول في مجال تعل م الله ميكنة هذه العمليه وبناء توصيفا ت او اوصاف‬ ‫‪ descriptions‬للصنف )النموذج( باتستخدام اتستراتيجية بحث تكراريه على مكتبه من المثله. ويسمى هذا النوع‬ ‫تعل م اتستقرائي ‪ . inductive learning‬المشكله في التستنتاج التستقرائي هي ان المعرفة المنتجه اتستقرائيا‬ ‫) تسواء كانت مختلقه بواتسطة البشر او الل ت( هي غير مؤكده ‪ uncertain‬حيث ت م تأتسيسها بناء على عينه فقط‬ ‫من كل الحال ت الممكنه.‬ ‫هناك اتسلوبان هشائعا التستخدام. في التعل م الموجه ‪ supervised learning‬تحدد الصناف ‪ classes‬للنظام‬ ‫بصحبة امثله من كل صنف. اما في التعل م غيرالموجه ‪) unsupervised learning‬او التعل م من الملحظه‬ ‫والكتشاف( فيجب على النظام اكتشاف الصناف من تلقاء نفسه معتمدا على خصائص عامه للكائنا ت. وتقتصر‬ ‫هذه الورقه على التسلوب الول.‬ ‫وتعد مسألة تنقيح قاعدة المعرفه غير التامه )الناقصه/ غير الصحيحه( مفهوما مهما لتحسين القدره التنبؤيه لنظام‬ ‫التعل م على حال ت ل م يت م رؤيتها مسبقا. وقد ظهر ت العديد من التساليب )4،3،2،1(. احد المآخذ على هذه‬ ‫التساليب هو عدم وجود اتستراتيجيه مناتسبه لتعريض فئة الختبار بكاملها للمزيد من التحليل عندما تصادف حاله‬
  • 2. ‫أخطئء في تصنيفها، بدل من التستعجال لتصحيح الحاله المشخصة خطأ. السبب الشائع في ظاهرة التصنيف‬ ‫الخاطئ هو ان انتقاء قوانين التستنتاج يت م بطريقه اعتباطيه )عشوائيه( وهذا راجع الى ان القوانين يت م ترتيبها‬ ‫حسب اولوية ظهورها او انتاجها. الفائده من ترتيب القوانين طبقا لمعيار اهمية معينه هو ان ذلك ينج م عنه تطبيق‬ ‫عدد اقل من عوامل التحويل على قاعدة المعرفه.‬ ‫تصف هذه الورقه منهجيه نظريه وتنفيذ لهذه المنهجيه في نظام تنقيح اتستقرائي يدعى أريس ‪ ،ARIS‬والذي‬ ‫يحقق خطوة للمام باتجاه تحسين انظمة تعل م المفاهي م اتستقرائيا. ويستخدم اريس ‪ ARIS‬عدد من التقنيا ت لتركيز‬ ‫عملية التنقيح على الجزاء الكثر اهميه في قاعدة المعرفه واصلحها.‬ ‫2. المصاعب التي تواجه النظمة الحاليه‬ ‫تلعب قاعدة المعرفه دورا مهما في امكانيا ت الحل لنظمة التعل م، وهي الوحده الكثر قوة، ولكن جرينر‬ ‫5( ‪ (Greiner‬اوضح ان بناء قاعدة معرفه كفؤه هي مسألة غاية في الصعوبه ‪ ، NP hard‬وغالبا ما تكون‬ ‫قاعدة المعرفه التي ت م بناؤها غير متناغمه ‪ inconsistent‬وغير كامله ‪ incomplete‬وقد ل تعمل بكفاءه تامه،‬ ‫بغض النظر عما اذا كانت قاعدة المعرفه هذه قد انتزعت مباهشرة من الخبراء او من خلل تحليل مكتبة من‬ ‫الحال ت. لذا، من الضروري تحديث قاعدة المعرفه للحصول على نموذج أع م ومطور واكثر تأرثيرا. وتعد‬ ‫العتبارا ت التاليه حوافز دافعه لهذا البحث:‬ ‫• تعاني خوارزما ت تعل م المفاهي م التستقرائيه من عيوب تضعها في هشرك ما يعرف بالقمة المحليه ‪local‬‬ ‫‪ maxima‬والتي قد تكون بعيده جدا عن الحل المثل بشكل عام‬ ‫• يمكن ان تكون انظمة التعل م التستقرائي اكثر ذكاء في حل المسائل اذا دعمت بامكانية دمج تحليل الداء‬ ‫في عملية التعل م. بالتحديد، السماح لنظام التعل م ان يستعل م عما اذا كان احتواء مثال معين في قاعدة‬ ‫المعرفه يزيد بشكل ملحوظ من قوة النظام ام ل. السبب هو ان هذه التغذيه الراجعه )العكسيه(‬ ‫‪ feedback‬تزيد من مقدرة التعل م باتجاها ت مختلفه عن طريق تعمي م ‪ generalize‬قاعدة المعرفه‬ ‫الصليه لتضمين المثله التي تقع خارج التغطيه واتستثناء المثله المضمنة بقاعدة المعرفه بالخطاء.‬ ‫ويض م ذلك تعمي م غطاء القانون وإضافة قانون جديد، وإلغاء قوانين زائده وتخصيص بعض القوانين‬ ‫العامه بشكل مفرط.‬ ‫• تلجأ النظمه الحاليه الى تعيين صنف النسحاب ‪) default class‬صنف الغالبيه( الى حالة يراد‬ ‫تصنيفها، اذا ل م يتوفر قانون ينطبق على قي م خصائص الحاله. وعند ازدياد عدد الحال ت لكثر من ارثنين‬ ‫يزداد احتمال الخروج بتنبؤا ت خاطئه. ومن رث م يتطلب المر تقنية بديله‬ ‫3. بنية نظام اريس ‪ARIS‬‬ ‫يعمل نظام اريس مبدئيا على انتاج قاعدة معرفه باتستخدام التستقراء على مجموعه من امثلة التدريب،‬ ‫ويواصل النظام بعد ذلك اختبار قاعدة المعرفه على مجموعه منفصله من البيانا ت لغراض التنقيح وتسمى هذه‬ ‫الفئه فئة بيانا ت التنقيح ‪ . refinement data set‬بعد هذا الختبار وفقط في حالة بروز تصنيف خاطئ لبعض‬ ‫بيانا ت التنقيح يستدعى النظام الفرعي للتنقيح. واخيرا يختبر النظام على فئة منفصلة خاصه بالختبار لتعمي م‬ ‫عملية التنقيح. يعمل نظام التنقيح على تحديد الخطاء المحتمله في قاعدة المعرفه، ويستدعي مكتبة من العوامل‬ ‫لكتشاف التنقيح الممكن بمساعدة دالة كاهشفه عامه ‪ ، global heuristic‬ويطبق افضل تنقيح، وتتكرر العمليه‬ ‫حتى تنتهي كافة التنقيحا ت الممكنه.‬ ‫يؤدي نظ م اريس بحثا في فضاء من عوامل التخصيص ‪ specialization‬والتعمي م ‪ generalization‬في‬ ‫محاولة ليجاد ادنى تنقيح او تعديل لقاعدة المعرفه. ومن حيث المفهوم توجد رثلرثة مراحل رئيسية لنظام التنقيح،‬ ‫تنفذ ارثنتان منها لكل فرضيه او صنف متوفر بقاعدة المعرفه، بينما يحافظ على ترتيب القوانين ‪ rules‬وفقا‬ ‫لوزانها‬ ‫المرحلة الولى )المركزه ‪(Localization‬‬ ‫يت م خلل هذه المرحله تحديد كافة الحال ت التي أخطئء في تصنيفها من ضمن فئة التنقيح والتي تنتمي الى‬ ‫صنف ‪ class‬معين. وتمنح كل حاله وزن ‪ weight‬من خلل القوانين التي تنطبق على الحاله، ويشير هذا الى‬ ‫التشابك عند هذه النقطه )الحاله( في فضاء الصنف )الفرضيه(. ويت م اختيار الحاله ذا ت العلى وزن من بين‬ ‫الحال ت التي أخطىء في تصنيفها، لن هذا يحدد القانون القوى من فئة القوانين الخاطئه.‬
  • 3. ‫المرحلة الثانيه )تنفيذ التنقيح والتحقق والتختبار(‬ ‫يحدد في هذه المرحلة القانون ‪ rule‬المسئول عن الخطاء، ويت م تجربة كافة عوامل التنقيح الممكنه، أي يت م‬ ‫تخصيص القانون الخاطيء ، ويعم م قانون آخر مشابه يغطي الصنف المقصود، كما يستحدث قانون جديد .‬ ‫تجرب كافة العوامل الممكنه وتختبر قاعدة المعرفه ويحتفظ بالداء الناتج. أخيرا يت م اختيار عامل التنقيح او‬ ‫مجموعة العوامل التي تعطي افضل اداء. وتكرر العمليه حتى ل تبقى اية تحسينا ت اخرى ممكنه.‬ ‫المرحلة الثالثه )التأكد من الكمال وإزالة القوانين الزائده(‬ ‫أخيرا، تفحص قاعدة المعرفه للتأكد من تمامها . ويجب تغطية كل حاله بقانون واحد على القل. اذا كانت هناك‬ ‫حال ت غير مشموله بالقوانين المتوفره ، فيمكن اضافة قوانين جديده . إضافة الى ذلك تزال القوانين الزائده عن‬ ‫الحاجه. المكونا ت التساتسيه لنظام اريس ‪ ARIS‬هي مولد الشجره ‪ tree generator‬و مولد القوانين ‪rule‬‬ ‫شّ‬ ‫شّ‬ ‫‪ generator‬و مولد التنقيح ونموذج الحك م ‪ judgement module‬و آلية التستنتاج ‪. inference engine‬‬ ‫مولد التنقيح هو المسئول عن تطبيق كل التنقيحا ت الممكنه لعلج أي خطأ تصنيفي ويمكن ان تتغير القوانين‬‫شّ‬ ‫بواتسطة تحريرها )ويدعى التمكين ‪ (enabling‬او منعها من التحرر )ويسمى العاقه ‪ . (disabling‬يختار‬ ‫نموذج الحك م ‪ judgement module‬عامل التنقيح او مجموعة العوامل التي تنتج افضل تحسين على اداء قاعدة‬ ‫المعرفه مع ضرورة تصحيح الحال ت المصنفه خطأ في السابق. ويوضح الشكل ادناه بنية نظام اريس ‪. ARIS‬‬ ‫بيانا ت اختبار‬ ‫بيانا ت تنقيح‬ ‫المصنف‬ ‫شّ‬ ‫مولد القانون‬ ‫شّ‬ ‫نتيجة التنبؤ‬ ‫(آلية التستنتاج‬ ‫بيانا ت التدريب‬ ‫مولد الشجره‬ ‫قاعدة‬ ‫مرتب القوانين‬ ‫القوانين مرتبة‬ ‫بّ‬ ‫شّ‬ ‫القوانين‬ ‫مولد التنقيح‬ ‫شّ‬ ‫شّ‬ ‫قائمة القوانين المنقحه‬ ‫شّ‬ ‫قاعدة معرفه‬ ‫منقحه‬ ‫شّ‬ ‫البنيه الساسيه‬ ‫نموذج التنقيح‬ ‫الشكل 1: بنية النظام أريس‬ ‫4. استقراء قاعدة المعرفه‬ ‫ت م اتستخدام تمثيل القضايا ‪ propositional representation‬كلغة تمثيل المعرفه، ويستخدم تمثيل القضايا‬ ‫صيغ المنطق المحتويه على هشرط وقيمة الخاصيه .‪ attribute-value condition‬فمثل‬ ‫‪(colour=red v colour=green) & shape=circle‬‬ ‫)اللون=احمر او اللون=اخضر( و الشكل=دائره‬ ‫وتأخذ قاعدة المعرفه هشكل قوانين أرثر )او انتاج( ‪ production rule‬والتي يمكن ان تحتوي على اتستثناءا ت‬ ‫محليه للقانون مثل‬ ‫‪IF outlook=sunny & humidity=low THEN class=mild‬‬ ‫‪IF outlook=rain & windy=true THEN class=don't play‬‬ ‫‪UNLESS‬‬ ‫‪Covered_stadium=true‬‬ ‫وليت م بناء نماذج تصنيف، يعرض على اريس ‪ ARIS‬ملف يحتوي على اوصاف قيمة-خاصيه -‪attribute‬‬ ‫‪ value‬لفئة من الحال ت التي ت م تعريف اصنافها، وكل حاله هي وصف لكائن واحد. يحلل نظ م اريس بيانا ت‬ ‫التدريب ‪ training data‬ويولد فئة من قوانين الرثر في صيغة القضايا التي تصف المفاهي م ‪. concepts‬‬ ‫شّ‬
  • 4. ‫تبدأ عملية التأويل بتعل م هشجرة القرار، وترجع الفكره التساتسيه الى عمل كوينلن 6( ‪ (quinlan‬مستغل فكرة "‬ ‫فرق تسد " واوضحت التجارب ان تحويل هشجرة القرار الى مجموعة من القوانين يؤدي الى قوانين واضحه‬ ‫شّ‬ ‫ومفهومه وذا ت تنبؤ دقيق على حال ت ل م يسبق مصادفتها. إن إعادة كتابة هشجرة في هشكل مجموعة من‬ ‫القوانين ،قانون لكل مسار بالشجره لن ينتج تراكيب ابسط لنه ببساطه يوجد قانون واحد لكل وريقه طرفيه.‬ ‫ولكن بالتفحص الجيد عن قرب في مقدمة القانون قد نتعرف على بعض الشروط التي ليست ذا ت علقه. الغاء‬ ‫شّ‬ ‫الشروط الزائده ينتج قانون جديد بدون التأرثير في دقة القانون الصلي، مما يجعل القانون اكثر قبول. ولفه م الفكره‬ ‫من وراء إلغاء الشروط نفرض ان القانون ‪ G‬هو‬ ‫‪IF A THEN class C‬‬ ‫حيث ان ‪ A‬هي اتحاد لمجموعة هشروط 3‪.……,a1,a2,a‬‬ ‫وقانون آخر اكثر عمومية ‪ 'G‬هو‬ ‫‪IF A' THEN class C‬‬ ‫حيث ان ‪ 'A‬يتحصل عليها بالغاء هشرط واحد ‪ ai‬من الشروط ‪. A‬‬ ‫كل حاله في بيانا ت التدريب التي تشملها المقدمه القصيره ‪ 'A‬اما انها تنتمي او ل تنتمي الى الصنف المعني‬ ‫‪ ، C‬وانها ترضي او ل ترضى الشرط ‪ai‬‬ ‫يمكن تنظي م عدد الحال ت في كل مجموعه كما يلي:‬ ‫الصنف‬ ‫اصناف اخرى‬ ‫‪C‬‬ ‫حال ت ترضي الشرط ‪ai‬‬ ‫1‪S‬‬ ‫1‪E‬‬ ‫حال ت ل ترضي الشرط ‪ai‬‬ ‫2‪S‬‬ ‫2‪E‬‬ ‫يوجد عدد 1‪ S1+E‬حاله من الحال ت التي تغطيها ‪ 'A‬وهي ترضي الشرط ‪) ai‬بمعنى ان القانون ‪ G‬يشملها(‬ ‫حيث ان منها عدد 1‪ E‬يصنفها القانون ‪ G‬تصنيف غير صحيح. ويوجد عدد 2‪ S2+E‬حاله مغطاة بواتسطة القانون‬ ‫المعم م ‪ 'G‬ول يغطيها القانون الصلي. يوجد منها عدد 2‪ E‬ت م تضمينها بالخطأ، حيث انها تنتمي الى اصناف‬ ‫اخرى. وحيث ان ‪ 'G‬تغطي كل الحال ت التي يغطيها ‪ G‬ايضا، فإن عدد الحال ت المغطاة بواتسطة ‪ 'G‬هي +1‪S‬‬ ‫2‪ . S2+E1+E‬اتستخدم اختبار الهميه ‪ test of significance‬على الجدول اعله لتقرير ما اذا كان من الواجب‬ ‫2 ‪E1 + E‬‬ ‫للقانون ‪'G‬‬ ‫2 ‪S1 + S‬‬ ‫الغاء الشرط ‪ .ai‬الفكره هي ان يبقى الشرط ‪ ai‬فقط عندما يكون معدل الخطأ الحقيقي‬ ‫1‪E‬‬ ‫لقانون ‪ . G‬انه من غير المرجح للقانون الذي يرتكب نسبة خطأ مقدارها‬ ‫1‪S‬‬ ‫اكبر من معدل الخطأ الحقيقي‬ ‫‪E‬‬ ‫‪E‬‬ ‫على حال ت ل م يسبق رؤيتها، لذا ت م اتستخدام مقياس‬ ‫‪N‬‬ ‫في بيانا ت التدريب ان يكون له خطأ في حدود‬ ‫‪N‬‬ ‫خطأ تقديري يدعى تقدير لبلس للخطأ ‪Laplace error estimate‬‬ ‫1+ ‪E‬‬ ‫حيث ان ‪ N‬هو عدد امثلة التدريب وان عدد ‪ E‬منها تنتمي الى اصناف غير الصنف المعني ‪ . C‬لذا‬ ‫2+ ‪N‬‬ ‫يحتفظ بالشرط ‪ ai‬فقط اذا كان الغاؤه يحدث معدل خطأ حقيقي اكبر من خطأ النسحاب. وبالطبع، يمكن الغاء‬ ‫اكثر من هشرط في القانون عند تعمي م القانون. ويعمل النظام على تطبيق اتسلوب هشره ‪ greedy approach‬في‬ ‫الغاء الشروط التي تنتج اقل معدل خطأ حقيقي للقانون المعم م.‬ ‫لقد ت م تطوير اتسلوب آخر لبناء القوانين، ويوجه هذا التسلوب بواتسطة دالة تقيي م كاهشفه ‪heuristic evaluation‬‬ ‫‪ function‬لتقيي م جودة القانون بتطبيق خاصيتين مهمتين وهما الكمال ‪ completeness‬والتناغ م‬ ‫‪ .consistency‬ويت م احتساب قيمة جودة الداله باتستخدام‬ ‫, ‪Quality ( rule‬‬ ‫‪α‬‬ ‫= )‬ ‫(‬‫−1‬‫+‬‫‪α‬‬ ‫+ + ‪consistencu ) completeness‬‬ ‫(‬ ‫‪α‬‬ ‫‪consistenc y ) consistency‬‬ ‫)1(‬ ‫‪# correctly covered examples‬‬ ‫= )‪consistency ( rule‬‬ ‫‪# covered examples‬‬ ‫‪# correctly covered examples‬‬ ‫= )‪completeness ( rule‬‬ ‫‪# of examples of same class as rule‬‬
  • 5. ‫ويسبب الغاء احد هشروط القانون، زيادة غطاء القانون، بينما يعمل اضافة هشرط للقانون على زيادة نقاوة القانون.‬ ‫يتعل م اريس ‪ ARIS‬القوانين )باتستخدام هذا التسلوب( بحيث تركز بشكل اكبر على التناغ م وبشكل اقل على‬ ‫التغطيه ‪ ،coverage‬ولكن يمكن تغيير هذا بتعديل قيمة المتغير ‪ .α‬هذه دالة كاهشفه، نتجت من تجارب‬ ‫وملحظا ت مع ‪ ARIS‬في عدة مجال ت فعليه. يعمل اعتماد جودة القانون على التناغ م كطريقه لبراز بعض‬ ‫المرونه، والتكيف مع اوضاع متنوعه )مثل القوانين التي تغطي حال ت نادره او القوانين العامه جدا(. لقد ت م‬ ‫تثبيت قيمة المتغير ‪ α‬ليساوي 8.0 وتعظي م جودة الداله )1(. ويساعد عامل الكمال او التمام على تفضيل القوانين‬ ‫التي تغطي حال ت اكثر عندما يتساوى التناغ م كما يوضحه المثال ادناه:‬ ‫بفرض ان لدينا عدد من البيانا ت =)01 حال ت منها 5 موجبه و عدد 5 تسالبه( واذا كان لدينا قانونين:‬ ‫قانون 1: يغطي 3 حال ت كلها تنتمي الى الصنف +‬ ‫والقانون 2: يغطي 4 حال ت ، كلها تنتمي الى الصنف + فان‬ ‫وللقانون 2‬ ‫للقنون الول‬ ‫التناغ م=4÷4=1‬ ‫التناغ م=3÷3=1‬ ‫الكمال=4÷5= 8.0‬ ‫الكمال=3÷5= 6.0‬ ‫كما ترى، كل القانونين لهما القيمه) 1 ( لمعامل التناغ م بينما يختلف معامل الكمال. لذا فان اضافة عامل الكمال‬ ‫تسيكون له معنى حيث ان معامل التناغ م وحده غير كاف. بعد تعل م كافة القوانين، يشكل ‪ ARIS‬تقديرا لوزان‬ ‫تربط بكل قانون ويت م تقدير الوزن باتستخدام حال ت فئة التدريب بكاملها.‬ ‫5. احتساب وزن القانون‬ ‫يت م تقدير وزن القانون من خلل تشكيله من الوزان لخصائص القانون، ويمكن تعريف وزن القانون بانه:‬ ‫مقياس الثقه في معتقد القانون ‪ ، Rule's opinion‬مبرزا اهمية الشروط للعتقاد )الفتراض او الصنف( ،‬ ‫ويسمح لنا هذا بمعايرة قوة القانون بطريقة عمليه. يصف الجدول 1 المصطلحا ت ذا ت العلقه بهذا الشأن.‬ ‫ونستخدم نظرية باييز ‪ Bayes‬لهشتقاق الوزان لكل جزئيه في القانون.‬ ‫تخيل فضاء عينه تقسمه الحداث 2‪ . ……,E1,E‬وافترض ان ‪ +H‬تعني حدث في الفضاء يشير الى صنف )او‬ ‫شّ‬ ‫مفهوم( معين باحتمال > 0 )+‪،P(H‬‬ ‫اذا‬ ‫) ‪P(H + E j )P(E j‬‬ ‫|‬ ‫= + ‪P(E j | H‬‬ ‫)‬ ‫= ‪,i‬‬‫..2,1‬ ‫) ‪+ E )P(E‬‬ ‫∑‬ ‫‪P(H‬‬ ‫|‬ ‫‪i‬‬ ‫‪i‬‬ ‫وكمثال بسيط ذو هشرطين وافتراضين)أو صنفين( ‪-h+,h‬‬ ‫) 1‪P ( H + | E1 ) P ( E‬‬ ‫= ) + ‪P( E I | H‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 2 ‪| E1 ) P ( E1 ) + P ( H + | E 2 ) P ( E‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E1 ) P ( E‬‬ ‫=‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫) 1‪|~ E1 ) P (~ E‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E1 ) P ( E‬‬ ‫=‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫) 1‪|~ E1 ) P(1 −E‬‬ ‫يمكننا تعريف هذا بالمعادله 2 ادناه‬ ‫+‬ ‫‪P(E 1 | H‬‬ ‫= )‬‫∗ ‪QA‬‬‫) 1 ‪P(E‬‬ ‫)2(‬ ‫حيث ان‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E‬‬ ‫= ‪QA‬‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫)) 1‪|~ E1 )(1 −P ( E‬‬
  • 6. ‫او اتستخدام اصطلحا ت الجدول 1‬ ‫1‪x‬‬ ‫= ‪QA‬‬ ‫) 3 ‪x1 x 3 + x 2 (1 − x‬‬ ‫وتقع قيمة ‪ QA‬في الفتره ]0,+‪ . [INF‬اذا نظرنا الى المعادله 2 على اتساس انها صيغة تحديث للمعتقد في 1‪E‬‬ ‫فان قي م ‪ QA‬الكبر من 1 يبدو انها تزيد من 1‪ (P(E‬وبالمثل القي م الصغر من 1 تقلل من 1‪ .(P(E‬لذا يمكن‬ ‫اعتبار ‪ QA‬على اتساس نها وزن ، يحمله الدليل ‪،E‬والذي يحرك المعتقد بهذا التجاه او ذاك. تدل الوزان‬ ‫الموجبه على دليل داع م للصنف، وتدل الوزان السالبه على دليل عكسي يعارض الفتراض)او الصنف(. وتجمع‬ ‫الداله التاليه اوزان كل هشرط في وزن واحد للقانون‬ ‫+ ]]) 1‪w = E1 + E 2 (1 − E1 ) + E3 [1 −w E1 + E 2 (1 − E‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫[‬ ‫‪w‬‬ ‫‪w‬‬ ‫...‬ ‫حيث ان ‪ W‬هي وزن القانون. ويحسب هذا تأرثير الختبارا ت في مقدمة القانون ،حيث ان 0=>1=<‪.W‬‬ ‫ولكننا مهتمين بحصر قي م وزن الدليل في الفتره ]-1,+1[. لذا فقد اتستخدمت الداله التاليه لحالة القيمه الى المدى‬ ‫المطلوب‬ ‫)‪W=F(QA‬‬ ‫حيث ان‬ ‫‪2QA‬‬ ‫‪where‬‬ ‫= )‪F(QA‬‬ ‫−‬‫1‬ ‫+1‬‫‪QA‬‬ ‫وتنتج هذه المعادله قيمة للوزن في المدى ]-1,+1[. الوزن للقانون هو اندماج لوزان اختباراته ، واتستخدم هذا‬ ‫الوزن كمعيار ترتيب لتنظي م القانون وللمساعده في التصنيف وايضا داعما لعملية التنقيح.‬ ‫6. المعرفه الخاطصه بالتنقيح ‪Refinement knowledge‬‬ ‫الهدف من تنقيح قاعدة المعرفه هو تقليل عدد الخطاء الموجبه ‪ false positive‬والخطاء السالبه ‪false‬‬ ‫‪ negative‬في حال ت جديده، مع تقليل عدد الخطاء الجديده الموجبه والسالبه في الحال ت المشخصه حديثا.‬ ‫وحيث أن هناك علقه بين الكمال والتناغ م عند تنقيح قاعدة المعرفه فاننا نعرف جودة قاعدة المعرفه كما يلي:‬ ‫شّ‬ ‫,‪Quality ( KB‬‬ ‫‪α‬‬ ‫+−= )‬ ‫(‬‫1‬ ‫‪α‬‬ ‫+ + ‪consistency ) completeness‬‬ ‫(‬ ‫‪α‬‬ ‫‪consistency ) consistency‬‬ ‫‪# correctly covered cases‬‬ ‫= ‪completeness‬‬ ‫‪# of all cases‬‬ ‫‪# correctly covered cases‬‬ ‫= ‪consistency‬‬ ‫‪# covered cases‬‬ ‫خلل تجاربنا، ت م تثبيت القيمه 8.0 للمتغير ‪ .α‬وهذا يحقق الهدف المنشود للتنقيح والذي يحسب جودة قاعدة‬ ‫المعرفه كتشكيله من الكمال والتناغ م.‬ ‫7. نتائج عمليه‬ ‫حاول البحث المعروض في هذه الورقه ايجاد طريقة افضل لتستغلل المعلوما ت في مجال ت بها البيانا ت‬ ‫المتاحه كبيرة الحج م وتنمو باتستمرار، مثل بيئا ت تجميع البيانا ت المؤتمته ‪.automated‬‬ ‫الجدول 2 يلخص تجارب توضح التحسن في دقة التصنيف بعد انتهاء عمليا ت التنقيح. العمود الول في الجدول 3‬ ‫شّ‬ ‫يصف المجال المستخدم في التجارب، وت م دمج الجدول في رثلرثة مجاميع: المجموعة الولى تلخص النتائج قبل‬ ‫وبعد التنقيح لقواعد معرفه صنعها نظام ‪ ARIS‬وت م فيها اتستخدام معياري الكمال والتناغ م، وتحتوي المجموعه‬ ‫الثانيه على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه طورها نظام 5.4‪ .C‬اما المجموعة الثالثه‬ ‫فتحتوي على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه اختلقها نظام ‪ .RIPPER‬وفي كل‬ ‫مجموعه ت م تقدي م المعلوما ت التاليه:‬
  • 7. ‫العمود المعنون "‪ "rules‬يشير الى متوتسط عدد القوانين في قاعدة المعرفه لعدد عشرة اختبارا ت اختير ت‬ ‫عشوائيا في كل مجال.‬ ‫العمود "‪ "%acc‬يعطي دقة التنبؤ لقاعدة المعرفه على فئة بيانا ت معينه لعدد 01 محاول ت‬ ‫شّ‬ ‫وتشير العلما ت ) √ ( الى ان عمليا ت التنقيح نتج عنها تحسن في دقة قاعدة المعرفه.‬ ‫شّ‬ ‫شّ‬ ‫وتعد مركمة قاعدة المعرفه خاصيه هامه للتحليل، اذ يعمل كل من نظام ‪) ARIS‬نقصد انتاج القوانين باتستخدام‬ ‫خاصيتي الكمال والتناغ م( ونظام 5.4‪ C‬على انتاج قوانين من نماذج هشجرة قرار مستقراه بتحليل قاعدة بيانا ت‬ ‫مكونه من امثله، وكل النظامين ينتج قوانين زائده.تحذف هذه القوانين الزائده خلل دورة التنقيح. ومن جهة‬ ‫شّ‬ ‫اخرى ينتج نظام ‪ RIPPER‬قواعد معرفه موجزه، وهناك حاجه لضافة قوانين كنتيجة لمعلوما ت اضافيه‬ ‫وخاصة في حالة ما ل م يعمل تعمي م القوانين الحاليه في المساعدة على تغطية البيانا ت التي تت م مصادفتها.‬ ‫8. المقارنه بين ةثلةثة انظمه‬ ‫الهدف من هذا الجزء هو تحديد متى يمكن لتستراتيجية التقيي م إحداث نتائج افضل من تدريب نظام التعل م على‬ ‫كافة البيانا ت المتاحه، ويتضمن اتسلوبنا في المقارنه، التستراتيجية التاليه:‬ ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب نظام التعل م على 04% من البيانا ت المتاحه رث م تنقيحها باتستخدام‬ ‫02% من البيانا ت المتوفره‬ ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب النظام باتستخدام 06% من البيانا ت المتاحه‬ ‫• قارن الداء لقواعد المعرفه المنتجه وذلك باختبار التسلوبين على باقي البيانا ت )04%(.‬ ‫• الجدول 3 هو مقارنه اخرى للنظمة الثلرثه أي 5.4‪ ،ARIS ، C‬و نظام ‪ RIPPER‬على مجال ت‬ ‫اختبار منتقاه. تمت مقارنة نتائج التقيي م لقواعد معرفه مستقراه بواتسطة دمج كل من فئة بيانا ت التدريب‬ ‫وفئة بيانا ت التنقيح كفئة تدريب مدمجه، وهذا يعطي مقارنه عادله بين كل من ‪،ARIS‬و 5.4‪ ،C‬و‬ ‫‪ .RIPPER‬يبين العمود الول المجال المستخدم، ويوضح العمود الثاني اداء نظام ‪ ARIS‬على بيانا ت‬ ‫الختبار حينما يدرب على 04% من البيانا ت المتاحه. ويعطي العمود الثالث اداء نظام ‪ ARIS‬على‬ ‫نفس بيانا ت الختبار عند تدريبه على بيانا ت التدريب المدمجه )أي بيانا ت التدريب والتنقيح معا(.‬ ‫ويعطي العمود الرابع اداء قاعدة المعرفه على بيانا ت الختبار بعد التنقيح. العمود الخامس يزودنا باداء‬ ‫نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على 04% من البيانا ت المتاحه. اما العمود السادس‬ ‫فيوضح اداء نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على البيانا ت مدمجة. ويشير العمود السابع‬ ‫الى اداء قاعدة المعرفه المنقحة والمستقراة بواتسطة نظام 5.4‪ C‬على نفس بيانا ت الختبار. يوضح‬ ‫شّ‬ ‫العمود الثامن اداء نظام ‪ RIPPER‬على ذا ت بيانا ت الختبار عند تدريبه على 04% من البيانا ت‬ ‫المتوفره. ويعطي العمود التاتسع اداء نظام ‪ RIPPER‬على بيانا ت الختبار عند تدريبه على البيانا ت‬ ‫مدمجة. ويبرز العمود العاهشر اداء قاعدة المعرفه المنقحه والمستقراة بواتسطة ‪ RIPPER‬على نفس‬ ‫شّ‬ ‫بيانا ت الختبار.‬ ‫وتشير العلما ت ) √( الى المواضع التي انتجت فيهاعملية التدريب متبوعة بالتنقيح نتائج جيده افضل من تلك‬ ‫المتحصل عليها عن طريق التدريب على البيانا ت بأكملها.‬ ‫وتوضح التجارب الفرق الواضح في اتستقراء القوانين بين كل من نظامي 5.4‪C‬و ‪ .RIPPER‬بالتحديد، يولد‬ ‫شّ‬ ‫نظام 5.4‪ C‬العديد من القوانين والتي يؤدي بعضها الى تضارب فيما بين القوانين. ويعمل نسق التنقيح المبين‬ ‫شّ‬ ‫على الغاء مثل هذه القوانين الزائده مما يزيد من دقة قاعدة المعرفه. من ناحية اخرى ، يعمل اتسلوب ‪RIPPER‬‬ ‫شّ‬ ‫في اتستقراء القوانين على انتاج عدد اقل من القوانين، لذا فانه خلل التنقيح يؤدي نظام ‪ ARIS‬عدد اكبر من‬ ‫عمليا ت بناء القوانين ويظهر القليل من عمليا ت الغاء القوانين على قواعد المعرفه الخاصه بنظام ‪.RIPPER‬‬ ‫باختصار، تعمل آلية التنقيح على تحسين جودة وصف الصناف لكافة الخوارزميا ت في رثلرثة مجال ت طبيه‬ ‫)وهي ‪ Hepatitis‬و ‪ Hypothyroid‬و ‪( Heart‬وهي ذا ت معضل ت مثل التشويش )عدم النقاوه( و مشكلة‬ ‫الحال ت الخاصه الصغرى. وفوق ذلك ت م الحصول على تحسينا ت على عدة مجال ت اخرى عديده اتستخدم فيها‬ ‫نظامي 5.4‪ C‬و ‪ ARIS‬على التوالي. لذا ينصح بان تستخدم نظ م التعل م آلية تنقيح على بيانا ت اختبار والتي تكون‬ ‫منفصله عن بيانا ت التدريب المستخدمة في اتستقراء قاعدة المعرفه كما في نظام ‪ RIPPER‬و 5.4‪ C‬للحصول‬ ‫على اوصاف مفاهي م ذا ت جودة عاليه.‬ ‫9. الستنتاج‬ ‫تعرضت هذه الورقه لمسألة بناء اوصاف مفاهي م ‪ concept descriptions‬في مجال ت كبيرة الحج م،‬ ‫حتى يمكن التستفاده من كميا ت هائله من البيانا ت المتزايده باتستمرار. وت م تطوير نموذج تنقيح اتستقرائي قادر‬
  • 8. ‫على بناء قواعد معرفه من مكتبة من الحال ت المصنفة مسبقا، وتحديثها باتستمرار لتضمين حقائق جديده. ان لهذا‬ ّ‫ش‬ .‫النموذج اهمية خاصه في المجال ت المتغيرة والمشوهشه مثل معامل ت بطاقة العتماد والصور الطبيه‬ ّ‫ش‬ .(‫لقد طورنا اتسلوبا لتعل م وزن القانون معتمدا على تقدير للعلقه بين هشروط القانون وخاتمة القانون )او التستنتاج‬ .‫ورتبت القوانين طبقا لوزانها لتحديد الحال ت التي أخطيء في تصنيفها بسهولة‬ ‫01. المراجع‬ [1] Aha David w., Goldstone Robert L., Concept learning and flexible weighting, Proceedings of the Fourteenth Annual Conference of the cognitive Science Society, Bloomington, 1992, pp. 534-539. [2] Benferhat Salem, Dobois Didier, Prode Heneri, Nonmonotonic reasoning, Conditional objects and possibility theory. Artificial Intelligence,1997, pp. 259-276 [3] Breiman Leo, Friedman Jerome, Olshen Richard, Stone Charles, Classification and regression trees. Wadsworth, Pacific Grove, CA, 1984. [4] Brunk Clifford. An investigation of knowledge intensive approaches to concept learning and theory refinement. Ph.D. thesis, University of California, 1996. [5] Greiner Russell, The complexity of theory revision, Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, Montreal, 1995. [6] Quinlan John Ross, C4.5, Programs for machine learning, Morgan Kaufman, 1993.
  • 9. ‫الرمز‬ ‫الوصف‬ ‫‪Ei‬‬ ‫تشير الى حدث او دليل )02=<‪.(eg. Age‬‬ ‫~ ‪Ei‬‬ ‫تشير الى متم م الحدث 02>‪((Ei eg. Age‬‬ ‫+‬ ‫‪H‬‬ ‫تدل على فضاء الحال ت الموجبه للفرضيه او الصنف )‪(eg. Healthy‬‬ ‫-‬ ‫‪H‬‬ ‫تدل على فضاء الحال ت السالبه للفتراض )‪(eg. Sick‬‬ ‫‪(P(Ei‬‬ ‫تمثل التوزيع المسبق للكائنا ت او الحال ت في مدى الشرط نسبة الى العدد الكلي للمثله )02>‪.((e.g. P(Age‬‬ ‫‪(X1 = P(H|Ei‬‬ ‫‪.(Ei‬‬ ‫الجزء من الحال ت الموجبه المغطاة بالشرط ‪(i.e. True positives TP‬‬ ‫‪(X2 = P(H|~Ei‬‬ ‫‪ Ei‬نسبة الى متم م ‪.(Ei (i.e. False negatives FN‬‬ ‫جزء الحال ت الموجبه غير المغطاه بالشرط‬ ‫‪(X3=P(Ei‬‬ ‫جزء الحال ت التي يشملها الدليل ‪ E‬نسبة الى العدد الكلي‬ ‫الجدول 1: اطصطلحات وزن الشرط بالقانون‬ ‫نظام أريس مستخدما الكمال والتناغم‬ ‫نظام 5.4‪C‬‬ ‫نظام ‪RIPPER‬‬ ‫المجال‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫بيانات نبات السوسن‬ ‫6.2‬ ‫71.39‬ ‫√‬ ‫76.59‬ ‫3‬ ‫6.4‬ ‫5.39‬ ‫5.39‬ ‫5.2‬ ‫6.2‬ ‫76.09‬ ‫√‬ ‫99.09‬ ‫1.3‬ ‫بيانات النبيذ‬ ‫1.3‬ ‫63.78‬ ‫√‬ ‫21.88‬ ‫1.4‬ ‫7.5‬ ‫27.98‬ ‫27.98‬ ‫3.4‬ ‫8.2‬ ‫52.68‬ ‫√‬ ‫46.78‬ ‫8.3‬ ‫بيانات التهاب الكبد‬ ‫3‬ ‫55.87‬ ‫√‬ ‫25.97‬ ‫5.4‬ ‫9.5‬ ‫23.08‬ ‫√‬ ‫16.18‬ ‫7.3‬ ‫3.1‬ ‫62.77‬ ‫√‬ ‫85.77‬ ‫4.3‬ ‫بيانات الغدة الدرقيه‬ ‫4.3‬ ‫98.79‬ ‫√‬ ‫2.89‬ ‫5.4‬ ‫6.7‬ ‫99.69‬ ‫√‬ ‫76.79‬ ‫1.5‬ ‫5.2‬ ‫4.89‬ ‫4.89‬ ‫6.2‬ ‫بيانات القلب‬ ‫8.62‬ ‫39.84‬ ‫√‬ ‫95.94‬ ‫2.62‬ ‫9.83‬ ‫62.94‬ ‫√‬ ‫66.05‬ ‫3.21‬ ‫9.2‬ ‫2.25‬ ‫√‬ ‫30.35‬ ‫5.9‬ ‫بيانات راية الدوله‬ ‫2.13‬ ‫93.65‬ ‫√‬ ‫2.85‬ ‫9.51‬ ‫33‬ ‫3.55‬ ‫√‬ ‫42.06‬ ‫2.41‬ ‫6.8‬ ‫98.25‬ ‫√‬ ‫66.55‬ ‫7.31‬ ‫بيانات السمعيات‬ ‫9.22‬ ‫40.34‬ ‫√‬ ‫20.94‬ ‫1.61‬ ‫2.32‬ ‫20.44‬ ‫√‬ ‫6.94‬ ‫6.21‬ ‫8.21‬ ‫65.66‬ ‫√‬ ‫40.86‬ ‫8.21‬ ‫بيانات الفطر‬ ‫7.22‬ ‫96.99‬ ‫√‬ ‫58.99‬ ‫8.9‬ ‫3.43‬ ‫74.89‬ ‫√‬ ‫5.89‬ ‫6.31‬ ‫5.7‬ ‫48.99‬ ‫68.99‬ ‫5.7‬ ‫بيانات الراشدين‬ ‫8.061‬ ‫34.17‬ ‫44.17‬ ‫1.75‬ ‫822‬ ‫26.77‬ ‫√‬ ‫16.87‬ ‫4.63‬ ‫4‬ ‫72.18‬ ‫72.18‬ ‫5.7‬ ‫بيانات اطصطناعيه‬ ‫4.91‬ ‫90.89‬ ‫√‬ ‫11.89‬ ‫3.02‬ ‫9.74‬ ‫0.29‬ ‫√‬ ‫6.39‬ ‫2.33‬ ‫6.51‬ ‫43.69‬ ‫53.69‬ ‫9.71‬ ‫الجدول رقم 2: أداء عملية التنقيح على ةثلةثة انظمة تعلم، أتخذ المتوسط لعدد 01 تجارب لكل مجال‬ ‫المجال‬ ‫‪ ARIS‬باستخدام التناغم والكمال‬ ‫نظام 5.4‪C‬‬ ‫نظام ‪RIPPER‬‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬
  • 10. ‫04%‬ ‫مدمجه‬ ‫04%‬ ‫مدمجه‬ ‫04%‬ ‫مدمجه‬ ‫بيانات نبات السوسن‬ ‫71.39‬ ‫76.39‬ ‫√‬ ‫76.59‬ ‫5.39‬ ‫0.49‬ ‫5.39‬ ‫76.09‬ ‫33.39‬ ‫99.09‬ ‫بيانات النبيذ‬ ‫63.78‬ ‫27.98‬ ‫21.88‬ ‫27.98‬ ‫0.09‬ ‫27.98‬ ‫52.68‬ ‫41.09‬ ‫46.78‬ ‫بيانات التهاب الكبد‬ ‫55.87‬ ‫93.87‬ ‫√‬ ‫25.97‬ ‫23.08‬ ‫69.77‬ ‫√‬ ‫16.18‬ ‫62.77‬ ‫49.67‬ ‫√‬ ‫85.77‬ ‫بيانات الغدة الدرقيه‬ ‫98.79‬ ‫41.89‬ ‫√‬ ‫2.89‬ ‫99.69‬ ‫42.79‬ ‫√‬ ‫76.79‬ ‫4.89‬ ‫02.89‬ ‫√‬ ‫4.89‬ ‫بيانات القلب‬ ‫39.84‬ ‫50.74‬ ‫95.94 √‬ ‫62.94‬ ‫91.05‬ ‫√‬ ‫66.05‬ ‫2.25‬ ‫12.25‬ ‫√‬ ‫30.35‬ ‫بيانات راية الدوله‬ ‫93.65‬ ‫46.95‬ ‫2.85‬ ‫3.55‬ ‫45.55‬ ‫√‬ ‫42.06‬ ‫98.25‬ ‫32.75‬ ‫66.55‬ ‫بيانات السمعيات‬ ‫40.34‬ ‫02.04‬ ‫20.94 √‬ ‫20.44‬ ‫21.34‬ ‫√‬ ‫21.94‬ ‫65.66‬ ‫96.07‬ ‫40.86‬ ‫بيانات الفطر‬ ‫96.99‬ ‫77.99‬ ‫√‬ ‫58.99‬ ‫74.89‬ ‫73.89‬ ‫√‬ ‫5.89‬ ‫48.99‬ ‫78.99‬ ‫68.99‬ ‫بيانات الراشدين‬ ‫34.17‬ ‫79.07‬ ‫√‬ ‫44.17‬ ‫26.77‬ ‫70.87‬ ‫√‬ ‫16.87‬ ‫72.18‬ ‫22.28‬ ‫72.18‬ ‫بيانات اطصطناعيه‬ ‫90.89‬ ‫68.89‬ ‫11.89‬ ‫0.29‬ ‫61.89‬ ‫6.69‬ ‫43.69‬ ‫35.79‬ ‫53.69‬ ‫الجدول رقم 3 :مقارنة أداء ةثلةثة انظمه‬