SlideShare ist ein Scribd-Unternehmen logo
1 von 35
Downloaden Sie, um offline zu lesen
‫ﺩﺍﻧﺸﮕﺎﻩ ﺍﺻﻔﻬﺎﻥ‬
                           ‫ﺩﺍﻧﺸﮑﺪﻩ ﻓﻨﻲ ﻭ ﻣﻬﻨﺪﺳﻲ‬
                              ‫ﮔﺮﻭﻩ ﮐﺎﻣﭙﻴﻮﺗﺮ‬

         ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ/ﺧﺼﻮﺻﻴﺘﻲ ﺑﻴﻦ‬
          ‫ﻧﻮﺩﻫﺎﯼ ﮔﺮﺍﻑ ‪ RDF‬ﻭ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﻥ ﺑﺮﺍﯼ‬
              ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬

    ‫‪Structure/Attribute Computation of Similarities‬‬
        ‫‪Between Nodes of a RDF Graph with‬‬
        ‫‪Application to Linked Data Clustering‬‬

               ‫ﻣﺤﻘﻖ:‬                                   ‫ﺍﺳﺘﺎﺩ ﺭﺍﻫﻨﻤﺎ:‬
      ‫ﻫﺎﺩﻱ ﺧﺴﺮﻭﻱ ﻓﺎﺭﺳﺎﻧﯽ‬                          ‫ﺩﮐﺘﺮ ﻣﺤﻤﺪﻋﻠﯽ ﻧﻌﻤﺖ ﺑﺨﺶ‬
‫1‬                                                                    ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                           ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                    ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                       ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                  ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫2‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                           ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                    ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                       ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                  ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫3‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )‪(Linked Data Principles‬‬
                                                             ‫• ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ‪ URI‬ﺑﺮﺍﯼ ﺷﻨﺎﺳﺎﻳﻲ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ‬
                                               ‫• ﺍﺯ ﭘﺮﻭﺗﮑﻞ ‪ HTTP‬ﺑﺮﺍﯼ ﺩﺳﺘﺮﺳﯽ ﺑﻪ ﺍﻳﻦ ﻧﺎﻣﻬﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬
‫• ﻫﻨﮕﺎﻣﯽ ﮐﻪ ﻳﮏ ﻓﺮﺩ، ﺩﺭﺧﻮﺍﺳﺖ ﻳﮏ ‪ URI‬ﺭﺍ ﻣﯽ ﮐﻨﺪ، ﺗﻤﺎﻣﯽ ﺍﻃﻼﻋﺎﺕ ﻣﻔﻴﺪ ﺑﻪ ﻓﺮﻣﺖ ‪ RDF‬ﻧﺸﺎﻥ ﺩﺍﺩﻩ ﺷﻮﺩ‬
 ‫• ﻋﺒﺎﺭﺗﻬﺎﯼ ‪ RDF‬ﻻﺯﻡ ﺍﺳﺖ ﺑﻪ ﺩﻳﮕﺮ ‪ URI‬ﻫﺎ ﺍﻧﻮﺍﻉ ﻣﺨﺘﻠﻒ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ ﺑﻪ ﺻﻮﺭﺗﯽ ﮐﻪ ﺍﻓﺮﺍﺩ ﻗﺎﺩﺭ ﺑﺎﺷﻨﺪ‬
                                                        ‫ﺍﻃﻼﻋﺎﺕ ﺑﻴﺸﺘﺮﯼ ﺩﺭ ﻣﻮﺭﺩ ﺁﻥ ﻣﻮﺟﻮﺩﻳﺖ ﮐﺴﺐ ﮐﻨﻨﺪ.‬




‫4‬                                   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                         ‫72/9/0931‬
‫ﺗﻌﺮﻳﻒ ﻣﻨﺎﺑﻊ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )ﻣﺜﺎﻝ(‬
    ‫‪http://dbpedia.org/page/Nigel_Clough‬‬




‫5‬                         ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬        ‫72/9/0931‬
‫ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ : ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ‬
                                    ‫•‬




‫6‬                          ‫72/9/0931‬
                            ‫62/7/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                   ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                           ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                    ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                       ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                 ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                  ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫7‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻣﺴﺎﻟﻪ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬
                                          ‫ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺑﻪ ﭼﻪ ﺷﮑﻠﯽ ﺍﻧﺠﺎﻡ ﺷﻮﺩ .‬    ‫•‬

                                                                                          ‫ﺍﻳﺪﻩ:‬         ‫•‬
                             ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﻭ ﺳﭙﺲ ﺍﻋﻤﺎﻝ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺩﺭ ﻫﺮ ﺧﻮﺷﻪ‬

                               ‫ﺩﺭ ﻫﺮ ﮐﺪﺍﻡ ﺍﺯ ﺧﻮﺷﻪ ﻫﺎ ﻧﻮﺩﻫﺎﯼ ﺑﺴﻴﺎﺭ ﻣﺸﺎﺑﻪ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﻧﺪ‬       ‫•‬
    ‫• ﺑﺮﺍﯼ ﻣﺜﺎﻝ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﻭﺭﺯﺵ ﺳﺎﺧﺘﻪ ﺷﻮﺩ، ﮐﻼﺳﺘﺮ ﺩﻳﮕﺮﯼ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﺁﮐﺎﺩﻣﻴﮏ‬
                                                                          ‫ﺗﺸﮑﻴﻞ ﺷﻮﺩ ﻭ ...‬
    ‫• ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﻣﺜﻼ ﮐﻼﺳﺘﺮ ﻭﺭﺯﺷﯽ ﺑﻪ ﮐﻼﺳﺘﺮ ﺁﮐﺎﺩﻣﻴﮏ ﺣﺬﻑ ﻣﯽ ﺷﻮﻧﺪ ﭼﺮﺍ ﮐﻪ‬
                               ‫ﻟﻴﻨﮏ ﻳﮏ ﻓﺮﺩ ﺁﮐﺎﺩﻣﻴﮏ ﺑﻪ ﻳﮏ ﻓﺮﺩ ﻭﺭﺯﺵ ﺍﺭﺯﺵ ﮐﻤﯽ ﺩﺍﺭﺩ‬

                      ‫ﺩﺭ ﺩﺭﻭﻥ ﻫﺮ ﮐﻼﺳﺘﺮ، ﺍﻟﮕﻮﺭﻳﺘﻢ ‪ PageRank‬ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬       ‫•‬
                                                                           ‫• ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ‬
                              ‫• ﮐﺎﻫﺶ ﺍﻧﺪﺍﺯﻩ ﮔﺮﺍﻑ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﮐﺎﻫﺶ ﻫﺰﻳﻨﻪ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﻧﻮﺩﻫﺎ‬




‫8‬                                      ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                         ‫72/9/0931‬
‫ﺯﻳﺮ ﻣﺴﺎﻳﻞ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬

                                                                                   ‫ﻓﺎﺯﻫﺎﯼ ﭘﺮﻭﮊﻩ‬          ‫•‬
                                               ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﭘﺎﻳﻪ ‪PageRank‬‬
                                     ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻣﻮﺟﻮﺩﻳﺖ ﺩﺭ ﻫﺮ ‪dataset‬‬
    ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ - ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬
     ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬
                                         ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﻫﺮ ﮐﻼﺳﺘﺮ ﻭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﺭﻭﺵ ﭘﺎﻳﻪ‬

                                                                                       ‫ﺍﻳﻦ ﺍﺭﺍﺋﻪ:‬        ‫•‬
      ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬

                                                                                            ‫ﺯﻳﺮ ﻣﺴﺎﻟﻪ:‬   ‫•‬
                                                                               ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ‬
                                ‫• ﻧﻴﺎﺯ ﺑﻪ ﺩﺍﺷﺘﻦ ﺍﻟﮕﻮﺭﻳﺘﻤﯽ ﺗﻮﺍﻧﺎ ﺟﻬﺖ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺗﺸﺎﺑﻪ ﺩﻭ ﺍﻳﺘﻢ‬

                                                                                                         ‫•‬


‫9‬                                      ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻣﺜﺎﻝ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ‬




                                            ‫ﻫﻤﻪ ﻧﻮﺩﻫﺎ ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺳﺖ‬             ‫•‬
                                    ‫ﺗﻨﻬﺎ ﻳﮏ ﻧﻮﻉ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺍﺳﺖ ‪wikiPagewikilink‬‬            ‫•‬
            ‫• ﺑﺎ ﮔﺬﺍﺷﺘﻦ ﭘﻴﺸﻮﻧﺪ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﻭ ﻳﺎ ﻭﻳﮑﯽ ﭘﺪﻳﺎ ﺑﻪ ﺍﺑﺘﺪﺍﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﻣﯽ ﺗﻮﺍﻥ ﺁﻥ ﻧﻮﺩ ﺭﺍ ﺩﺭ ﻭﺏ ﺑﺮﺭﺳﯽ ﮐﺮﺩ‬
‫• ﻻﺯﻡ ﺑﻪ ﺫﮐﺮ ﺍﺳﺖ ﮐﻪ ﺍﻳﻦ ﮔﺮﺍﻑ ﺑﺨﺶ ﮐﻮﭼﮑﯽ ﺍﺯ ﮔﺮﺍﻑ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺖ. ﺗﻌﺪﺍﺩ ﺯﻳﺎﺩﯼ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ‬
                                                                                          ‫ﺳﺎﺩﮔﯽ ﺧﺬﻑ ﺷﺪﻩ ﺍﺳﺖ.‬




‫01‬                                      ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                            ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                            ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                 ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                     ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                        ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                   ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫11‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﺭﻭﺷﻬﺎﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬
                                                  ‫ﺑﻪ ﺳﻪ ﺩﺳﺘﻪ ﮐﻠﯽ ﺗﻘﺴﻴﻢ ﺑﻨﺪﯼ ﻣﯽ ﺷﻮﻧﺪ‬    ‫•‬
                                                              ‫• ﺭﻭﺷﻬﺎﯼ ﺳﺎﺧﺘﺎﺭﯼ‬
          ‫• ﮐﻪ ﺗﻨﻬﺎ ﺍﺯ ﺳﺎﺧﺘﺎﺭ ﻟﻴﻨﮏ ﻣﺎﺑﻴﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ‬
                                      ‫‪SimRank, BipartiteRank, PRank‬‬        ‫•‬

                                      ‫ﺭﻭﺷﻬﺎﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ‬      ‫•‬
            ‫• ﮐﻪ ﺍﺯ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺁﻧﻬﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬
                        ‫• ﻣﻌﻤﻮﻻ ﺑﺮ ﺍﺳﺎﺱ ﻣﺤﺎﺳﺒﻪ ﺷﺒﺎﻫﺖ ‪ Jaccard‬ﻫﺴﺘﻨﺪ.‬

                                                             ‫ﺭﻭﺷﻬﺎﯼ ﺗﺮﮐﻴﺒﯽ‬      ‫•‬
     ‫• ﮐﻪ ﺍﺯ ﻫﺮ ﺩﻭ ﺭﻭﺵ ﻗﺒﻠﯽ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬




‫21‬                     ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                        ‫72/9/0931‬
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪SimRank‬‬
                                    ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﻭﺭﻭﺩﯼ‬    ‫•‬
                                                  ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬




‫31‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                              ‫72/9/0931‬
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪Bipartite‬‬
                                ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬    ‫•‬
                                              ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬




‫41‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪PRank‬‬
                                ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬    ‫•‬
                                     ‫ﻭ ﻭﺭﻭﺩﯼ ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬




‫51‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﺭﻭﺵ ﻣﺒﺘﻨﯽ ﺑﺮ ‪Jaccard‬‬
     ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﺩﺍﺭﺍﯼ ﺗﻌﺪﺍﺩ ﺑﻴﺸﺘﺮﯼ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺑﺎﺷﻨﺪ‬    ‫•‬
                     ‫‪ N‬ﺑﺮﺍﺑﺮ ﺗﻌﺪﺍﺩ ﮐﻞ ﺧﺼﻮﺻﻴﺎﺕ ﻣﻮﺟﻮﺩ ﺩﺭ ﮔﺮﺍﻑ‬          ‫•‬




‫61‬      ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                     ‫72/9/0931‬
‫ﺭﻭﺵ ﺗﺮﮐﻴﺒﯽ‬
‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺑﻪ ﺻﻮﺭﺕ ﺿﺮﻳﺒﯽ ﺍﺯ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ ﻭ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﺩ‬          ‫•‬



                                         ‫ﺭﻭﺵ ﺩﻳﮕﺮ ﺗﺒﺪﻳﻞ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭ‬           ‫•‬
  ‫• ﺩﻭ ﻧﻮﺩ ﮐﻪ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ ﺍﺯ ﺣﺪ ﺁﺳﺘﺎﻧﻪ ﺑﻴﺸﺘﺮ ﺑﺎﺷﺪ ﻧﻮﺩﻱ ﺍﻳﺠﺎﺩ ﻣﻲ ﺷﻮﺩ ﮐﻪ ﺑﻪ ﻫﺮ ﺩﻭﯼ‬
                  ‫ﺁﻧﻬﺎ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﺪ ﻭ ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺁﻧﻬﺎ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭﯼ ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﻧﺰﺩﻳﮑﺘﺮ ﻣﯽ ﺷﻮﻧﺪ‬
                                                               ‫• ﭘﻴﭽﻴﺪﮔﯽ ﺁﻥ ﺑﺴﻴﺎﺭ ﺯﻳﺎﺩ ﺧﻮﺍﻫﺪ ﺷﺪ.‬




  ‫71‬                                   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                     ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                            ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                 ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                     ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                        ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                   ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫81‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬

     ‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺩﺭ ﻳﮏ ﮔﺮﺍﻑ ﺟﻬﺖ ﺩﺍﺭ ﺑﻪ ﻣﻮﺍﺭﺩ ﺯﻳﺮ ﻭﺍﺑﺴﺘﻪ ﺍﺳﺖ‬    ‫•‬




‫91‬        ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                    ‫72/9/0931‬
‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬




‫02‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                ‫72/9/0931‬
‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬




‫12‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                ‫72/9/0931‬
‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬
                                                   ‫1. ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ‬

                                         ‫2. ﺍﺩﻏﺎﻡ ﺩﻭ ﺧﻮﺷﻪ ﺑﺎ ﺑﺎﻻﺗﺮﻳﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬

                       ‫3. ﺗﻮﻗﻒ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺻﻮﺭﺕ ﺭﺳﻴﺪﻥ ﺑﻪ ﻣﻘﺪﺍﺭ ﺁﺳﺘﺎﻧﻪ‬




‫22‬        ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                              ‫72/9/0931‬
‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬
‫ﺑﺮﺍﯼ ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ، ﺍﺯ ﺗﻮﺍﺑﻊ ﻣﺠﻤﻮﻉ، ﻣﺎﮐﺰﻳﻤﻢ، ﺗﻌﺪﺍﺩ، ﻣﻴﻨﻴﻤﻢ ﻭ ﻣﻴﺎﻧﮕﻴﻦ ﻣﯽ ﺗﻮﺍﻥ ﺍﺳﺘﻔﺎﺩﻩ ﻧﻤﻮﺩ.‬    ‫‪‬‬




     ‫ﺩﺭ ﭘﻴﺎﺩﻩ ﺳﺎﺯﯼ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ، ﺍﺯ ﺗﺎﺑﻊ ﻣﺠﻤﻮﻉ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺑﻴﻦ ﺩﻭ ﻧﻮﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬        ‫‪‬‬


                        ‫ﻓﺮﻣﻮﻝ ﺯﻳﺮ ﺑﺮﺍﯼ ﺗﺮﮐﻴﺐ ﺩﻭ ﮐﻼﺳﺘﺮ ﺩﺭ ﻣﺮﺣﻠﻪ ﺩﻭﻡ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬           ‫‪‬‬




‫32‬                                     ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                         ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                            ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                 ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                     ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                        ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                   ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫42‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬
‫• ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﮐﻪ ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ ﺑﺎﻟﻎ ﺑﺮ 6.1 ﻣﻴﻠﻴﻮﻥ‬
                                                                                         ‫ﻣﻮﺟﻮﺩﻳﺖ ﺩﺍﺭﺩ‬
               ‫• ﺑﺎﻟﻎ ﺑﺮ 063 ﻫﺰﺍﺭ ﺍﺯ ﻣﻨﺎﺑﻊ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺍﻓﺮﺍﺩ ﺭﺍ ﺗﻮﺻﻴﻒ ﻣﯽ ﮐﻨﻨﺪ. ﮐﻪ ﺍﻳﻦ ﺍﻓﺮﺍﺩ ﺗﻮﺳﻂ ﻟﻴﻨﮏ‬
                                                          ‫‪ Wikipageredirect‬ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﻨﺪ.‬

                                  ‫ﻣﻨﺎﺑﻊ ﺗﻮﺳﻂ ﻟﻴﻨﮏ ‪ Wordnet‬ﺑﻪ ﺁﻧﺘﻮﻟﻮﮊﯼ ﺯﺑﺎﻧﯽ ﻭﺭﺩﻧﺖ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺍﻧﺪ.‬       ‫•‬

     ‫ﺍﺯ ﮐﻞ ﻣﻨﺎﺑﻊ ﺍﻓﺮﺍﺩ ﻣﻮﺟﻮﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺗﻨﻬﺎ 021 ﻫﺰﺍﺭ ﻋﺪﺩ ﺍﺯ ﺁﻧﻬﺎ ﺣﺎﻭﯼ ﻣﻘﺪﺍﺭ ﺑﺮﺍﯼ ﺍﻳﻦ ﻟﻴﻨﮏ ﻫﺴﺘﻨﺪ.‬    ‫•‬

                                                  ‫ﺍﻓﺮﺍﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺑﻪ 03 ﮐﻼﺱ ﺩﺳﺘﻪ ﺑﻨﺪﯼ ﺷﺪﻩ ﺍﻧﺪ.‬     ‫•‬

                              ‫ﻫﺪﻑ ﺍﺯ ﺧﻮﺷﻪ ﺑﻨﺪﯼ، ﺗﻮﻟﻴﺪ ﻫﻤﻴﻦ ﮐﻼﺳﻬﺎ ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻟﻴﻨﮏ ﻭﺭﺩﻧﺖ‬           ‫•‬

 ‫• ﺑﻌﺪ ﺍﺯ ﻓﻴﻠﺘﺮﻳﻨﮓ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺍﯼ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ ﮐﻪ ﻧﺴﺨﻪ ﺍﯼ ﺍﺯ ﺁﻥ ﺩﺭ ﻭﺏ ﺑﺮﺍﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻫﺎﯼ ﺑﻌﺪﯼ‬
                                                                                ‫ﺍﻧﺘﺸﺎﺭ ﺩﺍﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬



‫52‬                                      ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                        ‫72/9/0931‬
‫ﺗﻮﺯﻳﻊ ﮐﻼﺱ ﺍﻓﺮﺍﺩ ﺩﺭ ﻭﺭﺩﻧﺖ‬




‫62‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                 ‫72/9/0931‬
‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ )ﺍﺩﺍﻣﻪ(‬
                                                               ‫•‬




‫72‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                  ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                            ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                 ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                     ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                        ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                   ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫82‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻣﺘﺪﻫﺎﯼ ﺍﺭﺯﻳﺎﺑﯽ‬
                                                                                ‫ﺁﻧﺘﺮﻭﭘﻲ:‬      ‫•‬
       ‫• ﻋﺪﺩﯼ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﻋﻀﻮﻫﺎﯼ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﻪ ﻳﮏ ﮐﻼﺱ ﺗﻨﻬﺎ ﺗﻌﻠﻖ ﺩﺍﺭﻧﺪ‬




                                                                               ‫ﺩﻗﺖ:‬           ‫•‬
                       ‫• ﺩﺭﺻﺪﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﺍﺳﺖ ﮐﻪ ﺷﺎﻣﻞ ﺍﺷﻴﺎﺀ ﺍﺯ ﻳﮏ ﮐﻼﺱ ﻣﺸﺨﺺ ﺑﺎﺷﺪ.‬



                                                                                  ‫ﺑﺎﺯﻳﺎﺑﯽ‬     ‫•‬
‫• ﻋﺪﺩﻱ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﺍﻋﻀﺎﻱ ﻳﮏ ﮐﻼﺱ، ﺩﺭ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺎ ﻫﻤﺪﻳﮕﺮ ﻭﺍﻗﻊ ﻣﯽ ﺷﻮﻧﺪ‬

                                                                           ‫‪F-Measure‬‬          ‫•‬
                                                                                              ‫•‬


  ‫92‬                                ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                  ‫72/9/0931‬
‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬

                                    ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬

                                            ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬     ‫•‬

                                                 ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬     ‫•‬

                                     ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬     ‫•‬

                                        ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬      ‫•‬

                                                  ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬      ‫•‬

                                                   ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬   ‫•‬


‫03‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                          ‫72/9/0931‬
‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬
                                                        ‫•‬




‫13‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬           ‫72/9/0931‬
‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬
                                                        ‫•‬




‫23‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬           ‫72/9/0931‬
‫ﻧﺘﺎﻳﺞ ﺑﻪ ﺻﻮﺭﺕ ﮔﺮﺍﻑ‬
                                                            ‫•‬




‫33‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬               ‫72/9/0931‬
‫ﻧﺘﻴﺠﻪ ﮔﻴﺮﯼ ﻭ ﮐﺎﺭﻫﺎﯼ ﺁﻳﻨﺪﻩ‬


        ‫ﺭﻭﺷﻲ ﺑﺮﺍﯼ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺍﺭﺍﺋﻪ ﺷﺪﻩ ﺍﺳﺖ‬    ‫•‬

                          ‫ﺍﻋﻤﺎﻝ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺮ ﺭﻭﯼ ﮔﺮﺍﻑ ﺷﺒﮑﻪ ﻫﺎﯼ ﺍﺟﺘﻤﺎﻋﯽ‬      ‫•‬

          ‫ﺍﺭﺍﺋﻪ ﻳﮏ ﻣﺘﺪ ﻋﻤﻮﻣﯽ ﺩﺍﺭﺍﯼ ﻗﺎﺑﻠﻴﺖ ﺳﻔﺎﺭﺷﯽ ﺷﺪﻥ ﺑﺮﺍﯼ ﻫﺮ ﺣﻮﺯﻩ ﺧﺎﺹ‬          ‫•‬

     ‫ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﻳﻦ ﺭﻭﺵ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﮔﺮﺍﻑ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬    ‫•‬




‫43‬              ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬                       ‫72/9/0931‬
‫ﺑﺎ ﺗﺸﮑﺮ ﺍﺯ ﺣﺴﻦ ﺗﻮﺟﻪ ﺷﻤﺎ‬




‫53‬   ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬   ‫72/9/0931‬

Weitere ähnliche Inhalte

Was ist angesagt?

Temporal Difference Methods (Persian)
Temporal Difference Methods (Persian)Temporal Difference Methods (Persian)
Temporal Difference Methods (Persian)Sina Iravanian
 
Internet marketing seminar 2015 at gicci
Internet marketing seminar 2015 at gicciInternet marketing seminar 2015 at gicci
Internet marketing seminar 2015 at giccipeyvand pourshaban
 
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟Reza Ghorbani
 
نقشه راه استراتژیک فرهنگ ایمنی
نقشه راه استراتژیک فرهنگ ایمنی نقشه راه استراتژیک فرهنگ ایمنی
نقشه راه استراتژیک فرهنگ ایمنی ali seyedi zadeh
 

Was ist angesagt? (6)

Temporal Difference Methods (Persian)
Temporal Difference Methods (Persian)Temporal Difference Methods (Persian)
Temporal Difference Methods (Persian)
 
Internet marketing seminar 2015 at gicci
Internet marketing seminar 2015 at gicciInternet marketing seminar 2015 at gicci
Internet marketing seminar 2015 at gicci
 
About Hotel Cms
About Hotel CmsAbout Hotel Cms
About Hotel Cms
 
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟
چرا تمرکز بر استارت‌آپ‌های فین‌تک اهمیت ویژه‌ای دارد؟
 
About Expert Cms
About Expert CmsAbout Expert Cms
About Expert Cms
 
نقشه راه استراتژیک فرهنگ ایمنی
نقشه راه استراتژیک فرهنگ ایمنی نقشه راه استراتژیک فرهنگ ایمنی
نقشه راه استراتژیک فرهنگ ایمنی
 

Ähnlich wie Structure attribute computation of similarities between nodes of a graph with application in clustering

Help poster
Help posterHelp poster
Help posterjavadst
 
Professional learning communities plc (جوامع یادگیری حرفه ای)
Professional learning communities   plc (جوامع یادگیری حرفه ای)Professional learning communities   plc (جوامع یادگیری حرفه ای)
Professional learning communities plc (جوامع یادگیری حرفه ای)Mahnaz Taslimi
 
نظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfنظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfAbdullah312926
 
نظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfنظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfAbdullah312926
 
ارزیابی ریسک به روش هازوپ
ارزیابی ریسک به روش هازوپ ارزیابی ریسک به روش هازوپ
ارزیابی ریسک به روش هازوپ Mehdi Parvini
 
Fo it 94-11-database
Fo it 94-11-databaseFo it 94-11-database
Fo it 94-11-databasemb_dadkhah
 
آشنایی با بهینه سازی موتورهای جستجو
آشنایی با بهینه سازی موتورهای جستجوآشنایی با بهینه سازی موتورهای جستجو
آشنایی با بهینه سازی موتورهای جستجوNavid Kashani
 
آداب غذا خوردن [Compatibility mode]
آداب غذا خوردن [Compatibility mode]آداب غذا خوردن [Compatibility mode]
آداب غذا خوردن [Compatibility mode]Neda Jafari
 

Ähnlich wie Structure attribute computation of similarities between nodes of a graph with application in clustering (10)

Help poster
Help posterHelp poster
Help poster
 
فین‌تک
فین‌تکفین‌تک
فین‌تک
 
Professional learning communities plc (جوامع یادگیری حرفه ای)
Professional learning communities   plc (جوامع یادگیری حرفه ای)Professional learning communities   plc (جوامع یادگیری حرفه ای)
Professional learning communities plc (جوامع یادگیری حرفه ای)
 
نظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfنظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdf
 
نظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdfنظام التقويم الصفي الذكي.pdf
نظام التقويم الصفي الذكي.pdf
 
ارزیابی ریسک به روش هازوپ
ارزیابی ریسک به روش هازوپ ارزیابی ریسک به روش هازوپ
ارزیابی ریسک به روش هازوپ
 
Fo it 94-11-database
Fo it 94-11-databaseFo it 94-11-database
Fo it 94-11-database
 
آشنایی با بهینه سازی موتورهای جستجو
آشنایی با بهینه سازی موتورهای جستجوآشنایی با بهینه سازی موتورهای جستجو
آشنایی با بهینه سازی موتورهای جستجو
 
به فام
به فامبه فام
به فام
 
آداب غذا خوردن [Compatibility mode]
آداب غذا خوردن [Compatibility mode]آداب غذا خوردن [Compatibility mode]
آداب غذا خوردن [Compatibility mode]
 

Structure attribute computation of similarities between nodes of a graph with application in clustering

  • 1. ‫ﺩﺍﻧﺸﮕﺎﻩ ﺍﺻﻔﻬﺎﻥ‬ ‫ﺩﺍﻧﺸﮑﺪﻩ ﻓﻨﻲ ﻭ ﻣﻬﻨﺪﺳﻲ‬ ‫ﮔﺮﻭﻩ ﮐﺎﻣﭙﻴﻮﺗﺮ‬ ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ/ﺧﺼﻮﺻﻴﺘﻲ ﺑﻴﻦ‬ ‫ﻧﻮﺩﻫﺎﯼ ﮔﺮﺍﻑ ‪ RDF‬ﻭ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﻥ ﺑﺮﺍﯼ‬ ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫‪Structure/Attribute Computation of Similarities‬‬ ‫‪Between Nodes of a RDF Graph with‬‬ ‫‪Application to Linked Data Clustering‬‬ ‫ﻣﺤﻘﻖ:‬ ‫ﺍﺳﺘﺎﺩ ﺭﺍﻫﻨﻤﺎ:‬ ‫ﻫﺎﺩﻱ ﺧﺴﺮﻭﻱ ﻓﺎﺭﺳﺎﻧﯽ‬ ‫ﺩﮐﺘﺮ ﻣﺤﻤﺪﻋﻠﯽ ﻧﻌﻤﺖ ﺑﺨﺶ‬ ‫1‬ ‫72/9/0931‬
  • 2. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫2‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 3. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫3‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 4. ‫ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )‪(Linked Data Principles‬‬ ‫• ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ‪ URI‬ﺑﺮﺍﯼ ﺷﻨﺎﺳﺎﻳﻲ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ‬ ‫• ﺍﺯ ﭘﺮﻭﺗﮑﻞ ‪ HTTP‬ﺑﺮﺍﯼ ﺩﺳﺘﺮﺳﯽ ﺑﻪ ﺍﻳﻦ ﻧﺎﻣﻬﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬ ‫• ﻫﻨﮕﺎﻣﯽ ﮐﻪ ﻳﮏ ﻓﺮﺩ، ﺩﺭﺧﻮﺍﺳﺖ ﻳﮏ ‪ URI‬ﺭﺍ ﻣﯽ ﮐﻨﺪ، ﺗﻤﺎﻣﯽ ﺍﻃﻼﻋﺎﺕ ﻣﻔﻴﺪ ﺑﻪ ﻓﺮﻣﺖ ‪ RDF‬ﻧﺸﺎﻥ ﺩﺍﺩﻩ ﺷﻮﺩ‬ ‫• ﻋﺒﺎﺭﺗﻬﺎﯼ ‪ RDF‬ﻻﺯﻡ ﺍﺳﺖ ﺑﻪ ﺩﻳﮕﺮ ‪ URI‬ﻫﺎ ﺍﻧﻮﺍﻉ ﻣﺨﺘﻠﻒ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ ﺑﻪ ﺻﻮﺭﺗﯽ ﮐﻪ ﺍﻓﺮﺍﺩ ﻗﺎﺩﺭ ﺑﺎﺷﻨﺪ‬ ‫ﺍﻃﻼﻋﺎﺕ ﺑﻴﺸﺘﺮﯼ ﺩﺭ ﻣﻮﺭﺩ ﺁﻥ ﻣﻮﺟﻮﺩﻳﺖ ﮐﺴﺐ ﮐﻨﻨﺪ.‬ ‫4‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 5. ‫ﺗﻌﺮﻳﻒ ﻣﻨﺎﺑﻊ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )ﻣﺜﺎﻝ(‬ ‫‪http://dbpedia.org/page/Nigel_Clough‬‬ ‫5‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 6. ‫ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ : ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ‬ ‫•‬ ‫6‬ ‫72/9/0931‬ ‫62/7/0931‬
  • 7. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫7‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 8. ‫ﻣﺴﺎﻟﻪ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬ ‫ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺑﻪ ﭼﻪ ﺷﮑﻠﯽ ﺍﻧﺠﺎﻡ ﺷﻮﺩ .‬ ‫•‬ ‫ﺍﻳﺪﻩ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﻭ ﺳﭙﺲ ﺍﻋﻤﺎﻝ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺩﺭ ﻫﺮ ﺧﻮﺷﻪ‬ ‫ﺩﺭ ﻫﺮ ﮐﺪﺍﻡ ﺍﺯ ﺧﻮﺷﻪ ﻫﺎ ﻧﻮﺩﻫﺎﯼ ﺑﺴﻴﺎﺭ ﻣﺸﺎﺑﻪ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﻧﺪ‬ ‫•‬ ‫• ﺑﺮﺍﯼ ﻣﺜﺎﻝ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﻭﺭﺯﺵ ﺳﺎﺧﺘﻪ ﺷﻮﺩ، ﮐﻼﺳﺘﺮ ﺩﻳﮕﺮﯼ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﺁﮐﺎﺩﻣﻴﮏ‬ ‫ﺗﺸﮑﻴﻞ ﺷﻮﺩ ﻭ ...‬ ‫• ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﻣﺜﻼ ﮐﻼﺳﺘﺮ ﻭﺭﺯﺷﯽ ﺑﻪ ﮐﻼﺳﺘﺮ ﺁﮐﺎﺩﻣﻴﮏ ﺣﺬﻑ ﻣﯽ ﺷﻮﻧﺪ ﭼﺮﺍ ﮐﻪ‬ ‫ﻟﻴﻨﮏ ﻳﮏ ﻓﺮﺩ ﺁﮐﺎﺩﻣﻴﮏ ﺑﻪ ﻳﮏ ﻓﺮﺩ ﻭﺭﺯﺵ ﺍﺭﺯﺵ ﮐﻤﯽ ﺩﺍﺭﺩ‬ ‫ﺩﺭ ﺩﺭﻭﻥ ﻫﺮ ﮐﻼﺳﺘﺮ، ﺍﻟﮕﻮﺭﻳﺘﻢ ‪ PageRank‬ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ‬ ‫•‬ ‫• ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ‬ ‫• ﮐﺎﻫﺶ ﺍﻧﺪﺍﺯﻩ ﮔﺮﺍﻑ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﮐﺎﻫﺶ ﻫﺰﻳﻨﻪ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﻧﻮﺩﻫﺎ‬ ‫8‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 9. ‫ﺯﻳﺮ ﻣﺴﺎﻳﻞ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ‬ ‫ﻓﺎﺯﻫﺎﯼ ﭘﺮﻭﮊﻩ‬ ‫•‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﭘﺎﻳﻪ ‪PageRank‬‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻣﻮﺟﻮﺩﻳﺖ ﺩﺭ ﻫﺮ ‪dataset‬‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ - ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﻫﺮ ﮐﻼﺳﺘﺮ ﻭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﺭﻭﺵ ﭘﺎﻳﻪ‬ ‫ﺍﻳﻦ ﺍﺭﺍﺋﻪ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ‬ ‫ﺯﻳﺮ ﻣﺴﺎﻟﻪ:‬ ‫•‬ ‫• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ‬ ‫• ﻧﻴﺎﺯ ﺑﻪ ﺩﺍﺷﺘﻦ ﺍﻟﮕﻮﺭﻳﺘﻤﯽ ﺗﻮﺍﻧﺎ ﺟﻬﺖ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺗﺸﺎﺑﻪ ﺩﻭ ﺍﻳﺘﻢ‬ ‫•‬ ‫9‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 10. ‫ﻣﺜﺎﻝ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ‬ ‫ﻫﻤﻪ ﻧﻮﺩﻫﺎ ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺳﺖ‬ ‫•‬ ‫ﺗﻨﻬﺎ ﻳﮏ ﻧﻮﻉ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺍﺳﺖ ‪wikiPagewikilink‬‬ ‫•‬ ‫• ﺑﺎ ﮔﺬﺍﺷﺘﻦ ﭘﻴﺸﻮﻧﺪ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﻭ ﻳﺎ ﻭﻳﮑﯽ ﭘﺪﻳﺎ ﺑﻪ ﺍﺑﺘﺪﺍﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﻣﯽ ﺗﻮﺍﻥ ﺁﻥ ﻧﻮﺩ ﺭﺍ ﺩﺭ ﻭﺏ ﺑﺮﺭﺳﯽ ﮐﺮﺩ‬ ‫• ﻻﺯﻡ ﺑﻪ ﺫﮐﺮ ﺍﺳﺖ ﮐﻪ ﺍﻳﻦ ﮔﺮﺍﻑ ﺑﺨﺶ ﮐﻮﭼﮑﯽ ﺍﺯ ﮔﺮﺍﻑ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺖ. ﺗﻌﺪﺍﺩ ﺯﻳﺎﺩﯼ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ‬ ‫ﺳﺎﺩﮔﯽ ﺧﺬﻑ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫01‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 11. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫11‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 12. ‫ﺭﻭﺷﻬﺎﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬ ‫ﺑﻪ ﺳﻪ ﺩﺳﺘﻪ ﮐﻠﯽ ﺗﻘﺴﻴﻢ ﺑﻨﺪﯼ ﻣﯽ ﺷﻮﻧﺪ‬ ‫•‬ ‫• ﺭﻭﺷﻬﺎﯼ ﺳﺎﺧﺘﺎﺭﯼ‬ ‫• ﮐﻪ ﺗﻨﻬﺎ ﺍﺯ ﺳﺎﺧﺘﺎﺭ ﻟﻴﻨﮏ ﻣﺎﺑﻴﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ‬ ‫‪SimRank, BipartiteRank, PRank‬‬ ‫•‬ ‫ﺭﻭﺷﻬﺎﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ‬ ‫•‬ ‫• ﮐﻪ ﺍﺯ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺁﻧﻬﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬ ‫• ﻣﻌﻤﻮﻻ ﺑﺮ ﺍﺳﺎﺱ ﻣﺤﺎﺳﺒﻪ ﺷﺒﺎﻫﺖ ‪ Jaccard‬ﻫﺴﺘﻨﺪ.‬ ‫ﺭﻭﺷﻬﺎﯼ ﺗﺮﮐﻴﺒﯽ‬ ‫•‬ ‫• ﮐﻪ ﺍﺯ ﻫﺮ ﺩﻭ ﺭﻭﺵ ﻗﺒﻠﯽ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.‬ ‫21‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 13. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪SimRank‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﻭﺭﻭﺩﯼ‬ ‫•‬ ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬ ‫31‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 14. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪Bipartite‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬ ‫•‬ ‫ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬ ‫41‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 15. ‫ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ ‪PRank‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ‬ ‫•‬ ‫ﻭ ﻭﺭﻭﺩﯼ ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ‬ ‫51‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 16. ‫ﺭﻭﺵ ﻣﺒﺘﻨﯽ ﺑﺮ ‪Jaccard‬‬ ‫ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﺩﺍﺭﺍﯼ ﺗﻌﺪﺍﺩ ﺑﻴﺸﺘﺮﯼ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺑﺎﺷﻨﺪ‬ ‫•‬ ‫‪ N‬ﺑﺮﺍﺑﺮ ﺗﻌﺪﺍﺩ ﮐﻞ ﺧﺼﻮﺻﻴﺎﺕ ﻣﻮﺟﻮﺩ ﺩﺭ ﮔﺮﺍﻑ‬ ‫•‬ ‫61‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 17. ‫ﺭﻭﺵ ﺗﺮﮐﻴﺒﯽ‬ ‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺑﻪ ﺻﻮﺭﺕ ﺿﺮﻳﺒﯽ ﺍﺯ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ ﻭ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﺩ‬ ‫•‬ ‫ﺭﻭﺵ ﺩﻳﮕﺮ ﺗﺒﺪﻳﻞ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭ‬ ‫•‬ ‫• ﺩﻭ ﻧﻮﺩ ﮐﻪ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ ﺍﺯ ﺣﺪ ﺁﺳﺘﺎﻧﻪ ﺑﻴﺸﺘﺮ ﺑﺎﺷﺪ ﻧﻮﺩﻱ ﺍﻳﺠﺎﺩ ﻣﻲ ﺷﻮﺩ ﮐﻪ ﺑﻪ ﻫﺮ ﺩﻭﯼ‬ ‫ﺁﻧﻬﺎ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﺪ ﻭ ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺁﻧﻬﺎ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭﯼ ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﻧﺰﺩﻳﮑﺘﺮ ﻣﯽ ﺷﻮﻧﺪ‬ ‫• ﭘﻴﭽﻴﺪﮔﯽ ﺁﻥ ﺑﺴﻴﺎﺭ ﺯﻳﺎﺩ ﺧﻮﺍﻫﺪ ﺷﺪ.‬ ‫71‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 18. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫81‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 19. ‫ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺩﺭ ﻳﮏ ﮔﺮﺍﻑ ﺟﻬﺖ ﺩﺍﺭ ﺑﻪ ﻣﻮﺍﺭﺩ ﺯﻳﺮ ﻭﺍﺑﺴﺘﻪ ﺍﺳﺖ‬ ‫•‬ ‫91‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 20. ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬ ‫02‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 21. ‫ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﮐﻼﺳﺘﺮﻫﺎ‬ ‫12‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 22. ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫1. ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ‬ ‫2. ﺍﺩﻏﺎﻡ ﺩﻭ ﺧﻮﺷﻪ ﺑﺎ ﺑﺎﻻﺗﺮﻳﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ‬ ‫3. ﺗﻮﻗﻒ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺻﻮﺭﺕ ﺭﺳﻴﺪﻥ ﺑﻪ ﻣﻘﺪﺍﺭ ﺁﺳﺘﺎﻧﻪ‬ ‫22‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 23. ‫ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫ﺑﺮﺍﯼ ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ، ﺍﺯ ﺗﻮﺍﺑﻊ ﻣﺠﻤﻮﻉ، ﻣﺎﮐﺰﻳﻤﻢ، ﺗﻌﺪﺍﺩ، ﻣﻴﻨﻴﻤﻢ ﻭ ﻣﻴﺎﻧﮕﻴﻦ ﻣﯽ ﺗﻮﺍﻥ ﺍﺳﺘﻔﺎﺩﻩ ﻧﻤﻮﺩ.‬ ‫‪‬‬ ‫ﺩﺭ ﭘﻴﺎﺩﻩ ﺳﺎﺯﯼ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ، ﺍﺯ ﺗﺎﺑﻊ ﻣﺠﻤﻮﻉ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺑﻴﻦ ﺩﻭ ﻧﻮﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫‪‬‬ ‫ﻓﺮﻣﻮﻝ ﺯﻳﺮ ﺑﺮﺍﯼ ﺗﺮﮐﻴﺐ ﺩﻭ ﮐﻼﺳﺘﺮ ﺩﺭ ﻣﺮﺣﻠﻪ ﺩﻭﻡ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫‪‬‬ ‫32‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 24. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫42‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 25. ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫• ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﮐﻪ ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ ﺑﺎﻟﻎ ﺑﺮ 6.1 ﻣﻴﻠﻴﻮﻥ‬ ‫ﻣﻮﺟﻮﺩﻳﺖ ﺩﺍﺭﺩ‬ ‫• ﺑﺎﻟﻎ ﺑﺮ 063 ﻫﺰﺍﺭ ﺍﺯ ﻣﻨﺎﺑﻊ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺍﻓﺮﺍﺩ ﺭﺍ ﺗﻮﺻﻴﻒ ﻣﯽ ﮐﻨﻨﺪ. ﮐﻪ ﺍﻳﻦ ﺍﻓﺮﺍﺩ ﺗﻮﺳﻂ ﻟﻴﻨﮏ‬ ‫‪ Wikipageredirect‬ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﻨﺪ.‬ ‫ﻣﻨﺎﺑﻊ ﺗﻮﺳﻂ ﻟﻴﻨﮏ ‪ Wordnet‬ﺑﻪ ﺁﻧﺘﻮﻟﻮﮊﯼ ﺯﺑﺎﻧﯽ ﻭﺭﺩﻧﺖ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺍﻧﺪ.‬ ‫•‬ ‫ﺍﺯ ﮐﻞ ﻣﻨﺎﺑﻊ ﺍﻓﺮﺍﺩ ﻣﻮﺟﻮﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺗﻨﻬﺎ 021 ﻫﺰﺍﺭ ﻋﺪﺩ ﺍﺯ ﺁﻧﻬﺎ ﺣﺎﻭﯼ ﻣﻘﺪﺍﺭ ﺑﺮﺍﯼ ﺍﻳﻦ ﻟﻴﻨﮏ ﻫﺴﺘﻨﺪ.‬ ‫•‬ ‫ﺍﻓﺮﺍﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺑﻪ 03 ﮐﻼﺱ ﺩﺳﺘﻪ ﺑﻨﺪﯼ ﺷﺪﻩ ﺍﻧﺪ.‬ ‫•‬ ‫ﻫﺪﻑ ﺍﺯ ﺧﻮﺷﻪ ﺑﻨﺪﯼ، ﺗﻮﻟﻴﺪ ﻫﻤﻴﻦ ﮐﻼﺳﻬﺎ ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻟﻴﻨﮏ ﻭﺭﺩﻧﺖ‬ ‫•‬ ‫• ﺑﻌﺪ ﺍﺯ ﻓﻴﻠﺘﺮﻳﻨﮓ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺍﯼ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ ﮐﻪ ﻧﺴﺨﻪ ﺍﯼ ﺍﺯ ﺁﻥ ﺩﺭ ﻭﺏ ﺑﺮﺍﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻫﺎﯼ ﺑﻌﺪﯼ‬ ‫ﺍﻧﺘﺸﺎﺭ ﺩﺍﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.‬ ‫52‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 26. ‫ﺗﻮﺯﻳﻊ ﮐﻼﺱ ﺍﻓﺮﺍﺩ ﺩﺭ ﻭﺭﺩﻧﺖ‬ ‫62‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 27. ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ )ﺍﺩﺍﻣﻪ(‬ ‫•‬ ‫72‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 28. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫82‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 29. ‫ﻣﺘﺪﻫﺎﯼ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫ﺁﻧﺘﺮﻭﭘﻲ:‬ ‫•‬ ‫• ﻋﺪﺩﯼ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﻋﻀﻮﻫﺎﯼ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﻪ ﻳﮏ ﮐﻼﺱ ﺗﻨﻬﺎ ﺗﻌﻠﻖ ﺩﺍﺭﻧﺪ‬ ‫ﺩﻗﺖ:‬ ‫•‬ ‫• ﺩﺭﺻﺪﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﺍﺳﺖ ﮐﻪ ﺷﺎﻣﻞ ﺍﺷﻴﺎﺀ ﺍﺯ ﻳﮏ ﮐﻼﺱ ﻣﺸﺨﺺ ﺑﺎﺷﺪ.‬ ‫ﺑﺎﺯﻳﺎﺑﯽ‬ ‫•‬ ‫• ﻋﺪﺩﻱ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﺍﻋﻀﺎﻱ ﻳﮏ ﮐﻼﺱ، ﺩﺭ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺎ ﻫﻤﺪﻳﮕﺮ ﻭﺍﻗﻊ ﻣﯽ ﺷﻮﻧﺪ‬ ‫‪F-Measure‬‬ ‫•‬ ‫•‬ ‫92‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 30. ‫ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ‬ ‫ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ‬ ‫•‬ ‫ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ‬ ‫•‬ ‫ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ‬ ‫•‬ ‫ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ‬ ‫•‬ ‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ‬ ‫•‬ ‫ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ‬ ‫•‬ ‫03‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 31. ‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬ ‫•‬ ‫13‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 32. ‫ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ‬ ‫•‬ ‫23‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 33. ‫ﻧﺘﺎﻳﺞ ﺑﻪ ﺻﻮﺭﺕ ﮔﺮﺍﻑ‬ ‫•‬ ‫33‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 34. ‫ﻧﺘﻴﺠﻪ ﮔﻴﺮﯼ ﻭ ﮐﺎﺭﻫﺎﯼ ﺁﻳﻨﺪﻩ‬ ‫ﺭﻭﺷﻲ ﺑﺮﺍﯼ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺍﺭﺍﺋﻪ ﺷﺪﻩ ﺍﺳﺖ‬ ‫•‬ ‫ﺍﻋﻤﺎﻝ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺮ ﺭﻭﯼ ﮔﺮﺍﻑ ﺷﺒﮑﻪ ﻫﺎﯼ ﺍﺟﺘﻤﺎﻋﯽ‬ ‫•‬ ‫ﺍﺭﺍﺋﻪ ﻳﮏ ﻣﺘﺪ ﻋﻤﻮﻣﯽ ﺩﺍﺭﺍﯼ ﻗﺎﺑﻠﻴﺖ ﺳﻔﺎﺭﺷﯽ ﺷﺪﻥ ﺑﺮﺍﯼ ﻫﺮ ﺣﻮﺯﻩ ﺧﺎﺹ‬ ‫•‬ ‫ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﻳﻦ ﺭﻭﺵ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﮔﺮﺍﻑ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ‬ ‫•‬ ‫43‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬
  • 35. ‫ﺑﺎ ﺗﺸﮑﺮ ﺍﺯ ﺣﺴﻦ ﺗﻮﺟﻪ ﺷﻤﺎ‬ ‫53‬ ‫ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی‬ ‫72/9/0931‬