Data Fusion model for web analytics

Mahdi Sayyad
Mahdi SayyadCyber Security Researcher um HyperSec Solutions
Developing data fusion and
correlation model for web ranking:
proposed solution
Iran Telecommunication Research Center(ITRC)
Communication Technology Department
Web ranking project
By: Mahdi Sayyad
December 20 , 2017
Outline
 Who we are?
 Our Work Process
 Fusion or correlation?
 Proposed approach
 Introduction to ontology
 Describing Artichecture of model
 Software solution for deploying model
 Conclusions and future works
Our Team
Mahdi Sayyad
MS in Computer Engineering ,CEH
,CCNA, ISMS Lead Auditor,
Cybersecurity Researcher, Co-Founder
of ICSGROUP.IR
7+ year experience in InfoSec and
Cybersecurity analysis
Mohammad H. Bazrafkan
MS in Information Security, CEH, OSCP,
Co-Founder ARTINERTEBAT.
6+ year experience in InfoSec and
Cybersecurity analysis
Our Research Process
Requirements
analysis
•Problem Definition
•Requirement Skills
•Scope Determination
•Team Selection and
acquisition
Information
Gathering and
Resource
Selection
•Papers(journals and
Conferences)
•Books(handbooks and
proceeding studies)
•Thesis
•Technical reports
•Workshop presentation
•Main Keywords: Data
Fusion/Log Correlation/web
log Analytics
Review and Study
•Fundamentals and
scope define
•Models and
Architectures
•Tools and
Techniques
Feasibility
Analysis and
Proposed
solutions
•Leveraging tools and
techniques for use
case
•Selection and
Developing proposed
solution
Reporting
• Phase 1 
• Phase 2 
• Phase 3 
‫نیازمندهای‬‫با‬‫سنجی‬‫تطابق‬
‫بندی‬‫رتبه‬‫پروژه‬‫های‬
‫اول‬ ‫بخش‬
‫همبستگی‬ ‫یا‬ ‫ادغام‬ ‫است‬ ‫این‬ ‫مسئله‬!
‫همبستگی‬
‫اطالعات‬ ‫سطح‬
‫فرآیند‬ ‫شروع‬ ‫از‬ ‫قبل‬ ‫پردازش‬ ‫پیش‬
‫باال‬ ‫سطح‬
‫هدف‬:‫گیری‬ ‫تصمیم‬ ‫و‬ ‫برای‬ ‫بهتر‬ ‫تحلیل‬
‫موثر‬(‫رویداد‬ ‫کشف‬)
‫ادغام‬
‫داده‬ ‫سطح‬(‫خام‬/‫ویژگی‬/‫تصمیم‬)
‫فرآیند‬ ‫حین‬ ‫در‬ ‫داده‬ ‫پردازش‬
(‫پایین‬/‫میانی‬/‫باال‬/‫ترکیبی‬)
‫پایین‬ ‫سطح‬
‫هدف‬:‫تصمیم‬ ‫و‬ ‫تحلیل‬ ‫برای‬ ‫کارآمد‬ ‫داده‬
‫ها‬ ‫سایت‬ ‫وب‬ ‫بندی‬ ‫رتبه‬ ‫پروژه‬
‫بندی‬ ‫رتبه‬ ‫پروژه‬ ‫در‬ ‫الگ‬ ‫داده‬ ‫شناخت‬
‫نوع‬ ‫دو‬ ‫شامل‬HTTP‫و‬HTTPS ‫پراکسی‬ ‫الگ‬/‫شبکه‬ ‫جریان‬
‫اسکریپت‬ ‫الگ‬(‫سرور‬ ‫وب‬) ‫بازدیدها‬ ‫اطالعات‬ ‫تجمیع‬ ‫و‬ ‫رمز‬ ‫غیر‬
‫ها‬ ‫داده‬/‫موجود‬ ‫ها‬ ‫الگ‬
‫یا‬ ‫ادغام‬ ‫فرآیند‬ ‫سنجی‬ ‫امکان‬‫همبستگی‬
‫الگ‬ ‫ادغام‬
‫با‬ ‫اسکریپت‬
‫شبکه‬ ‫جریان‬
‫های‬ ‫الگ‬ ‫ادغام‬
‫شبکه‬(‫همگون‬)
‫الگ‬ ‫ادغام‬‫های‬
‫شبکه‬(‫ناهمگون‬)
‫الگ‬ ‫همبستگی‬
‫کشف‬ ‫هدف‬ ‫با‬ ‫ها‬
‫ناهنجاری‬/‫تهدید‬
‫شبکه‬ ‫جریان‬ ‫های‬ ‫الگ‬ ‫ادغام‬(‫همگون‬ ‫های‬ ‫الگ‬)
‫شبکه‬ ‫جریان‬ ‫های‬ ‫الگ‬ ‫ادغام‬(‫های‬ ‫الگ‬‫ناهمگون‬)
‫ت‬ ‫و‬ ‫ناهنجاری‬ ‫کشف‬ ‫برای‬ ‫ها‬ ‫الگ‬ ‫همبستگی‬‫هدید‬
‫قاعده‬ ‫قابل‬ ‫رویدادهای‬
‫گذاری‬
‫سطح‬‫میکرو‬‫یا‬‫ماکرو‬
‫ربات‬
‫مخرب‬
‫نفوذ‬
‫حمله‬
‫رفتار‬
‫غیرعادی‬
‫بدافزار‬
‫پیشنهادی‬‫راهکاری‬
‫دوم‬ ‫بخش‬
‫پیشنهادی‬ ‫راهکار‬:‫زمینه‬ ‫پیش‬
‫معتبر‬ ‫عملی‬ ‫مقاله‬ ‫دو‬(ISI Journal)
1. Web Warehouse – A New Web Information
Fusion Tool for Web Mining, 2006
2. An ontology-based data integration approach
for web analytics in e-commerce, 2016
‫آن‬ ‫در‬ ‫ادغام‬ ‫کاربرد‬ ‫و‬ ‫وب‬ ‫داده‬ ‫انبار‬
‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫شناسی‬ ‫هستان‬(OWA)
‫شناخت‬ ‫پایگاه‬ ‫ارائه‬(‫شناسی‬ ‫هستان‬)‫وب‬->WAO
‫پیشنهادی‬ ‫راهکاری‬=‫معماری‬ ‫طراحی‬+
‫افزاری‬ ‫نرم‬ ‫بستر‬ ‫روی‬ ‫سازی‬ ‫پیاده‬
‫هستان‬
‫تجزیه‬ ‫شناسی‬
‫وب‬ ‫تحلیل‬ ‫و‬
‫وب‬ ‫انبارداده‬
‫داده‬ ‫ادغام‬
From: Maria del Mar Roldan et all., An Ontology-Based Data Integration Approach for Web Analytics in E-Commerce, Expert Systems With Applications (2016)
‫شناسی‬ ‫هستان‬
‫وب‬
‫آنتولوژی‬ ‫بر‬ ‫ای‬ ‫مقدمه‬
‫نمایش‬‫رسمی‬‫از‬‫دنیای‬‫واقعی‬‫که‬‫توسط‬‫جامعه‬‫ای‬‫از‬‫کاربران‬
‫بوسیله‬‫تعریف‬‫مفاهیم‬‫و‬‫ارتباط‬‫بین‬‫آن‬‫ها‬‫ایجاد‬‫شده‬‫است‬.
‫نام‬‫گذاری‬‫و‬‫تعریف‬‫رسمی‬‫از‬‫گونه‬،‫ها‬‫صفات‬‫و‬‫ارتباطات‬‫بی‬‫ن‬
‫موجودیت‬‫های‬‫موجود‬‫در‬‫یک‬‫حوزه‬‫دانش‬/‫بحث‬(‫ویکیپدیا‬)
‫اساسا‬‫یک‬‫دانش‬‫رده‬‫بندی‬(Taxonomy)‫است‬‫اما‬‫با‬‫رده‬‫بندی‬
‫تفاوت‬‫دارد‬
‫در‬‫علوم‬‫رایانه‬‫و‬،‫اطالعات‬‫پایگاه‬‫شناخت‬/‫هستان‬
‫شناسی‬/‫هستی‬‫شناسی‬‫مجموعه‬‫از‬‫موجودیت‬‫های‬‫اولیه‬‫بازن‬‫مایی‬
‫شده‬‫تعریف‬‫می‬‫کند‬‫که‬‫برای‬‫مدل‬‫کردن‬‫یک‬‫حوزه‬‫دانش‬‫یا‬
‫مبحث‬‫مورد‬‫استفاده‬‫قرار‬‫می‬‫گیرد‬(‫مجموعه‬‫ای‬‫از‬‫مفاهیم‬‫و‬
‫ارتباطات‬‫مورد‬‫استفاده‬‫در‬‫مدل‬‫سازی‬‫یک‬‫حوزه‬‫دانش‬).
‫موجودیت‬‫های‬‫اولیه‬‫عموما‬‫مشتکل‬‫از‬
‫مفاهیم‬(‫کالس‬‫ها‬)
‫ویژگی‬‫ها‬(‫صفات‬)
‫اعضای‬‫کالس‬(‫نمونه‬‫های‬‫کالس‬)
Off-Topic
‫مثال‬:‫فیلم‬ ‫آنتولوژی‬Off-Topic
‫معنایی‬ ‫وب‬ ‫در‬ ‫آنتولوژی‬
‫ها‬‫شناسی‬‫هستی‬‫شالوده‬‫وب‬‫معنایی‬‫هستند‬.‫ارتباط‬‫بین‬‫مفاهیم‬‫در‬‫وب‬‫و‬‫دنیای‬‫واقعی‬
‫برای‬‫ساخت‬‫و‬‫گسترش‬‫وب‬،‫معنایی‬‫باید‬‫تا‬‫حد‬‫امکان‬‫قادر‬‫باشیم‬‫تمامی‬‫موجودیت‬
‫ها‬(entities)‫و‬‫مفاهیم‬(concepts)‫و‬‫نیز‬‫روابط‬‫و‬‫ّصاالت‬‫ت‬‫ا‬‫ها‬‫آن‬‫با‬‫یکدیگر‬‫را‬‫به‬‫صورت‬
‫هایی‬‫مدل‬‫مجرد‬‫به‬‫هایی‬‫زبان‬‫که‬‫برای‬‫ها‬‫رایانه‬‫قابل‬‫درک‬‫است‬‫بیان‬‫کنیم‬.
‫اینکه‬،‫کامپیوترها‬‫چطور‬‫این‬‫ارتباطات‬‫را‬‫درک‬‫کنند‬‫به‬‫نحوه‬‫ی‬‫ذخیره‬‫سازی‬‫اطالعات‬‫بس‬‫تگی‬
‫دارد‬.‫ما‬‫در‬‫ذخیره‬‫سازی‬‫اطالعات‬‫باید‬‫طوری‬‫عمل‬‫کنیم‬‫که‬‫بازیابی‬‫آن‬‫موثرتر‬‫و‬‫مفیدتر‬‫ب‬‫اشد‬.
‫نیاز‬‫داریم‬‫عالوه‬‫بر‬«‫اطالعات‬»،‫به‬«‫معنای‬‫اطالعات‬»‫نیز‬‫دسترسی‬‫داشته‬‫باشیم‬.
‫تعریف‬‫تیم‬،‫برنرزلی‬‫پدر‬،‫وب‬‫وب‬‫معنایی‬‫را‬‫تعریف‬‫میکند‬:
«‫قرار‬ ‫پردازش‬ ‫مورد‬ ‫ماشین‬ ‫توسط‬ ‫مسقیم‬ ‫غیر‬ ‫و‬ ‫مستقیم‬ ‫تواند‬‫می‬ ‫که‬ ‫داده‬ ‫از‬ ‫تارنمایی‬‫بگیرد‬.»
‫وب‬‫فهم‬ ‫قابل‬ ‫انسان‬ ‫توسط‬ ‫فقط‬ ‫کنونی‬ ‫وب‬ ‫برخالف‬ ‫که‬ ‫است‬ ‫وبی‬ ‫آینده‬،‫نباشد‬‫ماشین‬ ‫توسط‬ ‫بلکه‬‫ها‬‫پ‬ ‫و‬ ‫درک‬ ‫قابل‬ ‫نیز‬‫باشد‬ ‫ردازش‬.
Off-Topic
‫معنایی‬ ‫وب‬ ‫و‬ ‫آنتولوژی‬
‫وب‬‫معنایی‬‫یک‬‫جنبش‬‫مشترک‬‫است‬‫که‬‫توسط‬w3c
‫رهبری‬‫شود‬‫می‬‫و‬‫های‬‫فرمت‬‫رایج‬‫داده‬‫را‬‫روی‬‫شبکه‬
‫گسترده‬‫جهانی‬‫ترویج‬‫کند‬‫می‬.
‫وب‬‫معنایی‬‫با‬‫تشویق‬‫به‬‫گنجاندن‬‫محتوای‬‫معنا‬‫یی‬‫در‬
‫صفحات‬،‫وب‬‫به‬‫تبدیل‬‫شدن‬‫وب‬‫کنونی‬(‫که‬‫شامل‬
‫اسناد‬‫ساختار‬‫نایافته‬‫است‬)‫به‬«‫وبی‬‫از‬‫داده‬‫ها‬»‫ک‬‫مک‬
‫کند‬‫می‬.
‫در‬‫چارچوب‬‫شرح‬‫منابع‬(RDF)‫ساخته‬‫می‬‫شود‬.
XML/XMLS
RDF/RDFS
OWL
SPARQL
‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬
Off-Topic
‫کیک‬‫الیه‬‫ای‬/‫پشته‬‫وب‬‫معنایی‬
Off-Topic
‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬
RDF:‫زبان‬‫هستان‬‫شناسی‬‫مورد‬‫استفاده‬‫برای‬‫نمایش‬‫اطالعات‬‫دربارها‬‫منابع‬‫موجود‬‫روی‬‫وب‬
‫منابع‬‫در‬‫قالب‬‫جمالتی‬‫شامل‬‫صفت‬‫ها‬‫و‬‫مقادیر‬‫صفت‬‫بیان‬‫می‬‫شوند‬.
‫عبارت‬RDF‫به‬‫صورت‬‫سه‬‫تایی‬‫متشکل‬‫از‬subject> predicate >object‫نمایش‬‫می‬‫یابند‬
‫الگوی‬RDF‫یا‬RDFS:‫از‬‫لحاظ‬‫نحوی‬/‫دستوری‬RDF‫را‬‫قادر‬‫می‬‫سازد‬‫که‬‫درباره‬‫کالس‬‫های‬‫منابع‬‫و‬‫صفاتی‬‫که‬‫قرار‬
‫است‬‫در‬‫آن‬‫ها‬‫استفاده‬‫شود‬‫ها‬‫صحبت‬‫گردد‬.‫امکان‬‫تعریف‬‫واژه‬‫نامه‬‫های‬RDF‫مبتنی‬‫بر‬‫یک‬‫کاربرد‬‫خاص‬‫را‬‫می‬
‫دهد‬
Subject
(Resource)
http://www.w3.org/Home/Lassila
Predicate
(Property)
Creator
Object (literal) "Ora Lassila"
Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila
http://www.w3.org/
Home/Lassila
Ora Lassila
Creator
Off-Topic
SPARQL:‫جوی‬ ‫و‬ ‫پرس‬ ‫زبان‬ ‫یک‬RDF‫است‬ ‫داده‬ ‫پایگاه‬ ‫و‬ ‫آنتولوژی‬ ‫های‬ ‫مدل‬ ‫برای‬.
.1‫قالب‬ ‫در‬ ‫شده‬ ‫ذخیره‬ ‫اطالعات‬ ‫دستکاری‬ ‫و‬ ‫استخراج‬ ‫قابلیت‬RDF‫دارد‬ ‫را‬.
.2‫گراف‬ ‫بر‬ ‫مبتنی‬ ‫جوی‬ ‫و‬ ‫پرس‬ ‫زبان‬(graph-matching)‫دارد‬ ‫را‬ ‫مدل‬ ‫روی‬ ‫از‬ ‫دانش‬ ‫استخراج‬ ‫قابلیت‬ ‫است‬.
.3‫شده‬ ‫تگ‬ ،‫یافته‬ ‫ساخت‬ ‫نیمه‬ ‫های‬ ‫داده‬ ‫از‬ ‫پشتیبانی‬(‫یافته‬ ‫غیرساخت‬)‫وب‬ ‫و‬ ‫شبکه‬ ‫داده‬ ‫منابع‬ ‫در‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫و‬(‫نشان‬
‫با‬ ‫شده‬URI)
OWL:‫ها‬ ‫شناسی‬ ‫هستان‬ ‫نوشتن‬ ‫برای‬ ‫دانش‬ ‫نمایش‬ ‫های‬ ‫زبان‬ ‫از‬ ‫ای‬ ‫خانواده‬(‫یافت‬ ‫تعمیم‬‫ه‬RDF
‫و‬RDFS)
‫ها‬ ‫کالس‬ ‫و‬ ‫ها‬ ‫ویژگی‬ ‫توصیف‬ ‫برای‬ ‫بیشتر‬ ‫واژگان‬ ‫نمودن‬ ‫اضافه‬
‫ها‬ ‫کالس‬ ‫بین‬ ‫ارتباط‬(disjointedness)،cardinality‫صفات‬ ‫از‬ ‫تر‬ ‫بهینه‬ ‫انواع‬ ،‫تساوی‬ ،
OWL-DL:‫از‬ ‫ای‬ ‫گونه‬OWA‫توصیف‬ ‫منطق‬ ‫یافته‬ ‫تغییر‬ ،SHOIN/‫بر‬ ‫مبتنی‬RDFS
‫کند‬ ‫می‬ ‫پشتیانی‬ ‫داده‬ ‫نوع‬ ‫صفات‬ ‫و‬ ‫داده‬ ‫انواع‬ ،‫داده‬ ‫مقادیر‬ ‫از‬
‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬
Off-Topic
‫مثال‬:RDF‫و‬SPARQL
PREFIX ex: <http://example.com/exampleOntology#>
SELECT ?capital ?country
WHERE {
?x ex:cityname ?capital ;
ex:isCapitalOf ?y .
?y ex:countryname ?country ;
ex:isInContinent ex:Africa .
}
Off-Topic
‫پیشنهادی‬ ‫راهکار‬:‫کالن‬ ‫معماری‬
‫پیشنهادی‬ ‫راهکار‬:‫تشریح‬‫مدل‬
‫الیه‬1:‫داده‬ ‫های‬ ‫منبع‬
‫الیه‬2:‫داده‬ ‫انباره‬ ‫زیرساخت‬
‫الیه‬3:‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬
‫الیه‬4:‫نمایش‬
‫پیشنهادی‬ ‫راهکار‬:‫مدل‬ ‫تشریح‬
‫شناسی‬ ‫هستان‬
‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬
(OWA)
‫نگاشت‬ ‫توابع‬
‫های‬ ‫داده‬ ‫مخزن‬
‫معنایی‬
(RDF Repos.)
‫راهکار‬‫پیشنهادی‬:‫اف‬ ‫نرم‬ ‫حل‬ ‫راه‬ ‫با‬ ‫سازی‬ ‫پیاده‬‫زاری‬
‫پروژه‬ ‫فنی‬ ‫شرایط‬(‫ه‬ ‫الگ‬‫ا‬
‫پروژه‬ ‫مسئله‬ ‫و‬)
•‫سرور‬ ‫وب‬ ‫الگ‬(‫اسکریپ‬)
•‫اینترنتی‬ ‫اوپراتور‬ ‫الگ‬(‫ش‬‫بکه‬)
•‫نرم‬ ‫های‬ ‫حل‬ ‫راه‬ ‫بررسی‬
‫افزاری‬
‫راهکار‬ ‫جزئیات‬
‫پیشنهادی‬
•‫وب‬ ‫داده‬ ‫انباره‬(ETL)
•‫داده‬ ‫ادغام‬(‫و‬ ‫پردازش‬ ‫سطوح‬
‫مختلف‬ ‫معماری‬)
‫سنجی‬ ‫تطابق‬‫با‬‫ها‬ ‫نیازمندی‬
‫سنجی‬ ‫تطابق‬‫با‬‫ها‬ ‫نیازمندی‬
‫پیشنهادی‬ ‫راهکار‬:‫با‬ ‫سازی‬ ‫پیاده‬‫افزاری‬ ‫نرم‬ ‫حل‬ ‫راه‬
‫پیشنهادی‬ ‫راهکار‬:‫افزاری‬ ‫نرم‬ ‫بستر‬ ‫های‬ ‫مؤلفه‬
Hadoop HDFS
APACHE ZOOKEEPER
APACHE
SOLR
APACHE
JENA
SPARQL
APACHE
SPARK
APACHE
HBASE
‫گیری‬ ‫نتیجه‬ ‫و‬ ‫بندی‬ ‫جمع‬
‫پیشنهادی‬ ‫حل‬ ‫راه‬
‫داده‬ ‫انباره‬ ‫پایه‬ ‫بر‬‫ادغام‬ ‫فرآیند‬ ‫انجام‬ ‫قابلیت‬ ‫با‬ ‫ها‬
‫داده‬ ‫ادغام‬ ‫معماری‬ ‫سه‬ ‫از‬ ‫پشتیبانی‬Redundant،Complementary‫و‬Cooperative
‫چندسطح‬ ‫در‬ ‫تحلیل‬ ‫و‬ ‫پردازش‬ ‫قابلیت‬(‫داده‬ ‫سطح‬/‫تصمیم‬ ‫سطح‬ ‫و‬ ‫ویژگی‬ ‫سطح‬ ،‫اندازه‬)
‫عظیم‬ ‫های‬ ‫داده‬ ‫پردازش‬ ‫مناسب‬ ‫و‬ ‫سریع‬ ،‫پذیری‬ ‫توسعه‬ ‫معماری‬
‫آینده‬ ‫کارهای‬:
‫امنیتی‬ ‫تهدیدات‬ ‫و‬ ‫ها‬ ‫ربات‬ ،‫ناهنجاری‬ ‫کشف‬ ‫برای‬ ‫الگ‬ ‫همبستگی‬ ‫های‬ ‫شیوه‬ ‫از‬ ‫استفاده‬
‫شیوه‬ ‫بنیادی‬ ‫توسعه‬‫همبستگی‬ ‫و‬ ‫ادغام‬ ‫های‬
‫کارگیری‬ ‫به‬‫جمع‬ ‫بستر‬‫آوری‬‫جریانی‬ ‫های‬ ‫داده‬ ‫کالن‬ ‫تحلیل‬ ‫و‬ ‫ادغام‬ ،(Stream Big Data)
‫نتای‬ ‫سازی‬ ‫شخصی‬ ‫و‬ ‫تجمیع‬ ‫برای‬ ‫مشترک‬ ‫صورت‬ ‫به‬ ‫ها‬ ‫الگ‬ ‫همبستگی‬ ‫و‬ ‫ها‬ ‫داده‬ ‫ادغام‬ ‫های‬ ‫تکنیک‬ ‫کارگیری‬ ‫به‬‫و‬ ‫پرس‬ ‫ج‬
‫جستجو‬ ‫موتورهای‬ ‫در‬ ‫کاربر‬ ‫جوی‬
Data Fusion model for web analytics
Data Fusion model for web analytics
1 von 32

Recomendados

ِData Fusion and Log correlation tools & case-studies von
ِData Fusion and Log correlation tools & case-studiesِData Fusion and Log correlation tools & case-studies
ِData Fusion and Log correlation tools & case-studiesMahdi Sayyad
174 views66 Folien
ارزیابی امنیتی محصولات فناوری اطلاعات(ISO 15408 Common Criteria)- بخش دوم von
ارزیابی امنیتی محصولات فناوری اطلاعات(ISO 15408 Common Criteria)- بخش دومارزیابی امنیتی محصولات فناوری اطلاعات(ISO 15408 Common Criteria)- بخش دوم
ارزیابی امنیتی محصولات فناوری اطلاعات(ISO 15408 Common Criteria)- بخش دومMahdi Sayyad
919 views33 Folien
an introduction to Web 3.0 - Semantic Web von
an introduction to Web 3.0 - Semantic Weban introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic WebHossein sharafi
414 views16 Folien
اسلايد آموزشي هوش تجاري von
اسلايد آموزشي هوش تجارياسلايد آموزشي هوش تجاري
اسلايد آموزشي هوش تجاريAli Masoombeigi
7.9K views144 Folien
مقدمه ای بر داده های پيوندی von
مقدمه ای بر داده های پيوندیمقدمه ای بر داده های پيوندی
مقدمه ای بر داده های پيوندیkhosravi82
2.3K views60 Folien
چارچوب متن باز جهت توسعه سیستم های نرم افزاری von
چارچوب متن باز جهت توسعه سیستم های نرم افزاریچارچوب متن باز جهت توسعه سیستم های نرم افزاری
چارچوب متن باز جهت توسعه سیستم های نرم افزاریعباس بني اسدي مقدم
439 views23 Folien

Más contenido relacionado

Similar a Data Fusion model for web analytics

Ordbms پایگاه داده شی گرا-رابطه ای von
Ordbms پایگاه داده شی گرا-رابطه ایOrdbms پایگاه داده شی گرا-رابطه ای
Ordbms پایگاه داده شی گرا-رابطه ایAli Moradi
2.5K views31 Folien
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران von
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهرانFarafekr Technology
2.2K views81 Folien
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز von
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازMobin Ranjbar
519 views79 Folien
Digital Publisher von
Digital PublisherDigital Publisher
Digital PublisherShad Far
575 views12 Folien
13940305-NetManagementOS_ver1.5 von
13940305-NetManagementOS_ver1.513940305-NetManagementOS_ver1.5
13940305-NetManagementOS_ver1.5Ehsan Khanahmadi
603 views57 Folien
13940305-SharePoint-Ver3.51-forStudent von
13940305-SharePoint-Ver3.51-forStudent13940305-SharePoint-Ver3.51-forStudent
13940305-SharePoint-Ver3.51-forStudentEhsan Khanahmadi
583 views84 Folien

Similar a Data Fusion model for web analytics(20)

Ordbms پایگاه داده شی گرا-رابطه ای von Ali Moradi
Ordbms پایگاه داده شی گرا-رابطه ایOrdbms پایگاه داده شی گرا-رابطه ای
Ordbms پایگاه داده شی گرا-رابطه ای
Ali Moradi2.5K views
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران von Farafekr Technology
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
Farafekr Technology2.2K views
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز von Mobin Ranjbar
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیرازIntroduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Mobin Ranjbar519 views
Digital Publisher von Shad Far
Digital PublisherDigital Publisher
Digital Publisher
Shad Far575 views
13940305-SharePoint-Ver3.51-forStudent von Ehsan Khanahmadi
13940305-SharePoint-Ver3.51-forStudent13940305-SharePoint-Ver3.51-forStudent
13940305-SharePoint-Ver3.51-forStudent
Ehsan Khanahmadi583 views
Bi and data mining with Oracle von ghanadbashi
Bi and data mining with OracleBi and data mining with Oracle
Bi and data mining with Oracle
ghanadbashi227 views
2017 - مقاله چالشهای امنیتی در مدلهای رایانش ابری - نویسندگان: ناصری فرد و ... von Aidin NaseriFard
 2017  - مقاله چالشهای امنیتی در مدلهای رایانش ابری - نویسندگان: ناصری فرد و ... 2017  - مقاله چالشهای امنیتی در مدلهای رایانش ابری - نویسندگان: ناصری فرد و ...
2017 - مقاله چالشهای امنیتی در مدلهای رایانش ابری - نویسندگان: ناصری فرد و ...
Aidin NaseriFard489 views
Big Data and select suitable tools von Meghdad Hatami
Big Data and select suitable toolsBig Data and select suitable tools
Big Data and select suitable tools
Meghdad Hatami4.1K views
Navid Conference - 1394 - Shiraz, Iran von Hamed Takmil
Navid Conference - 1394 - Shiraz, IranNavid Conference - 1394 - Shiraz, Iran
Navid Conference - 1394 - Shiraz, Iran
Hamed Takmil360 views
راهنمای کامل راه اندازی الاستیک سرچ و استفاده آن در شرکت گارتکس von Seied Mahdi Sadat Hosseini
راهنمای کامل راه اندازی الاستیک سرچ و استفاده آن در شرکت گارتکسراهنمای کامل راه اندازی الاستیک سرچ و استفاده آن در شرکت گارتکس
راهنمای کامل راه اندازی الاستیک سرچ و استفاده آن در شرکت گارتکس
Rezome.Ali.Bagheri von Ali Bagheri
Rezome.Ali.BagheriRezome.Ali.Bagheri
Rezome.Ali.Bagheri
Ali Bagheri131 views
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری نویسنده ناص... von Aidin NaseriFard
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری   نویسنده ناص...مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری   نویسنده ناص...
مقاله بررسی مدل های ارزیابی ریسک امنیت اطلاعات برای رایانش ابری نویسنده ناص...
Aidin NaseriFard229 views

Data Fusion model for web analytics

  • 1. Developing data fusion and correlation model for web ranking: proposed solution Iran Telecommunication Research Center(ITRC) Communication Technology Department Web ranking project By: Mahdi Sayyad December 20 , 2017
  • 2. Outline  Who we are?  Our Work Process  Fusion or correlation?  Proposed approach  Introduction to ontology  Describing Artichecture of model  Software solution for deploying model  Conclusions and future works
  • 3. Our Team Mahdi Sayyad MS in Computer Engineering ,CEH ,CCNA, ISMS Lead Auditor, Cybersecurity Researcher, Co-Founder of ICSGROUP.IR 7+ year experience in InfoSec and Cybersecurity analysis Mohammad H. Bazrafkan MS in Information Security, CEH, OSCP, Co-Founder ARTINERTEBAT. 6+ year experience in InfoSec and Cybersecurity analysis
  • 4. Our Research Process Requirements analysis •Problem Definition •Requirement Skills •Scope Determination •Team Selection and acquisition Information Gathering and Resource Selection •Papers(journals and Conferences) •Books(handbooks and proceeding studies) •Thesis •Technical reports •Workshop presentation •Main Keywords: Data Fusion/Log Correlation/web log Analytics Review and Study •Fundamentals and scope define •Models and Architectures •Tools and Techniques Feasibility Analysis and Proposed solutions •Leveraging tools and techniques for use case •Selection and Developing proposed solution Reporting • Phase 1  • Phase 2  • Phase 3 
  • 6. ‫همبستگی‬ ‫یا‬ ‫ادغام‬ ‫است‬ ‫این‬ ‫مسئله‬! ‫همبستگی‬ ‫اطالعات‬ ‫سطح‬ ‫فرآیند‬ ‫شروع‬ ‫از‬ ‫قبل‬ ‫پردازش‬ ‫پیش‬ ‫باال‬ ‫سطح‬ ‫هدف‬:‫گیری‬ ‫تصمیم‬ ‫و‬ ‫برای‬ ‫بهتر‬ ‫تحلیل‬ ‫موثر‬(‫رویداد‬ ‫کشف‬) ‫ادغام‬ ‫داده‬ ‫سطح‬(‫خام‬/‫ویژگی‬/‫تصمیم‬) ‫فرآیند‬ ‫حین‬ ‫در‬ ‫داده‬ ‫پردازش‬ (‫پایین‬/‫میانی‬/‫باال‬/‫ترکیبی‬) ‫پایین‬ ‫سطح‬ ‫هدف‬:‫تصمیم‬ ‫و‬ ‫تحلیل‬ ‫برای‬ ‫کارآمد‬ ‫داده‬
  • 7. ‫ها‬ ‫سایت‬ ‫وب‬ ‫بندی‬ ‫رتبه‬ ‫پروژه‬
  • 8. ‫بندی‬ ‫رتبه‬ ‫پروژه‬ ‫در‬ ‫الگ‬ ‫داده‬ ‫شناخت‬ ‫نوع‬ ‫دو‬ ‫شامل‬HTTP‫و‬HTTPS ‫پراکسی‬ ‫الگ‬/‫شبکه‬ ‫جریان‬ ‫اسکریپت‬ ‫الگ‬(‫سرور‬ ‫وب‬) ‫بازدیدها‬ ‫اطالعات‬ ‫تجمیع‬ ‫و‬ ‫رمز‬ ‫غیر‬ ‫ها‬ ‫داده‬/‫موجود‬ ‫ها‬ ‫الگ‬
  • 9. ‫یا‬ ‫ادغام‬ ‫فرآیند‬ ‫سنجی‬ ‫امکان‬‫همبستگی‬ ‫الگ‬ ‫ادغام‬ ‫با‬ ‫اسکریپت‬ ‫شبکه‬ ‫جریان‬ ‫های‬ ‫الگ‬ ‫ادغام‬ ‫شبکه‬(‫همگون‬) ‫الگ‬ ‫ادغام‬‫های‬ ‫شبکه‬(‫ناهمگون‬) ‫الگ‬ ‫همبستگی‬ ‫کشف‬ ‫هدف‬ ‫با‬ ‫ها‬ ‫ناهنجاری‬/‫تهدید‬
  • 10. ‫شبکه‬ ‫جریان‬ ‫های‬ ‫الگ‬ ‫ادغام‬(‫همگون‬ ‫های‬ ‫الگ‬)
  • 11. ‫شبکه‬ ‫جریان‬ ‫های‬ ‫الگ‬ ‫ادغام‬(‫های‬ ‫الگ‬‫ناهمگون‬)
  • 12. ‫ت‬ ‫و‬ ‫ناهنجاری‬ ‫کشف‬ ‫برای‬ ‫ها‬ ‫الگ‬ ‫همبستگی‬‫هدید‬ ‫قاعده‬ ‫قابل‬ ‫رویدادهای‬ ‫گذاری‬ ‫سطح‬‫میکرو‬‫یا‬‫ماکرو‬ ‫ربات‬ ‫مخرب‬ ‫نفوذ‬ ‫حمله‬ ‫رفتار‬ ‫غیرعادی‬ ‫بدافزار‬
  • 14. ‫پیشنهادی‬ ‫راهکار‬:‫زمینه‬ ‫پیش‬ ‫معتبر‬ ‫عملی‬ ‫مقاله‬ ‫دو‬(ISI Journal) 1. Web Warehouse – A New Web Information Fusion Tool for Web Mining, 2006 2. An ontology-based data integration approach for web analytics in e-commerce, 2016 ‫آن‬ ‫در‬ ‫ادغام‬ ‫کاربرد‬ ‫و‬ ‫وب‬ ‫داده‬ ‫انبار‬ ‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫شناسی‬ ‫هستان‬(OWA) ‫شناخت‬ ‫پایگاه‬ ‫ارائه‬(‫شناسی‬ ‫هستان‬)‫وب‬->WAO ‫پیشنهادی‬ ‫راهکاری‬=‫معماری‬ ‫طراحی‬+ ‫افزاری‬ ‫نرم‬ ‫بستر‬ ‫روی‬ ‫سازی‬ ‫پیاده‬ ‫هستان‬ ‫تجزیه‬ ‫شناسی‬ ‫وب‬ ‫تحلیل‬ ‫و‬ ‫وب‬ ‫انبارداده‬ ‫داده‬ ‫ادغام‬
  • 15. From: Maria del Mar Roldan et all., An Ontology-Based Data Integration Approach for Web Analytics in E-Commerce, Expert Systems With Applications (2016) ‫شناسی‬ ‫هستان‬ ‫وب‬
  • 16. ‫آنتولوژی‬ ‫بر‬ ‫ای‬ ‫مقدمه‬ ‫نمایش‬‫رسمی‬‫از‬‫دنیای‬‫واقعی‬‫که‬‫توسط‬‫جامعه‬‫ای‬‫از‬‫کاربران‬ ‫بوسیله‬‫تعریف‬‫مفاهیم‬‫و‬‫ارتباط‬‫بین‬‫آن‬‫ها‬‫ایجاد‬‫شده‬‫است‬. ‫نام‬‫گذاری‬‫و‬‫تعریف‬‫رسمی‬‫از‬‫گونه‬،‫ها‬‫صفات‬‫و‬‫ارتباطات‬‫بی‬‫ن‬ ‫موجودیت‬‫های‬‫موجود‬‫در‬‫یک‬‫حوزه‬‫دانش‬/‫بحث‬(‫ویکیپدیا‬) ‫اساسا‬‫یک‬‫دانش‬‫رده‬‫بندی‬(Taxonomy)‫است‬‫اما‬‫با‬‫رده‬‫بندی‬ ‫تفاوت‬‫دارد‬ ‫در‬‫علوم‬‫رایانه‬‫و‬،‫اطالعات‬‫پایگاه‬‫شناخت‬/‫هستان‬ ‫شناسی‬/‫هستی‬‫شناسی‬‫مجموعه‬‫از‬‫موجودیت‬‫های‬‫اولیه‬‫بازن‬‫مایی‬ ‫شده‬‫تعریف‬‫می‬‫کند‬‫که‬‫برای‬‫مدل‬‫کردن‬‫یک‬‫حوزه‬‫دانش‬‫یا‬ ‫مبحث‬‫مورد‬‫استفاده‬‫قرار‬‫می‬‫گیرد‬(‫مجموعه‬‫ای‬‫از‬‫مفاهیم‬‫و‬ ‫ارتباطات‬‫مورد‬‫استفاده‬‫در‬‫مدل‬‫سازی‬‫یک‬‫حوزه‬‫دانش‬). ‫موجودیت‬‫های‬‫اولیه‬‫عموما‬‫مشتکل‬‫از‬ ‫مفاهیم‬(‫کالس‬‫ها‬) ‫ویژگی‬‫ها‬(‫صفات‬) ‫اعضای‬‫کالس‬(‫نمونه‬‫های‬‫کالس‬) Off-Topic
  • 18. ‫معنایی‬ ‫وب‬ ‫در‬ ‫آنتولوژی‬ ‫ها‬‫شناسی‬‫هستی‬‫شالوده‬‫وب‬‫معنایی‬‫هستند‬.‫ارتباط‬‫بین‬‫مفاهیم‬‫در‬‫وب‬‫و‬‫دنیای‬‫واقعی‬ ‫برای‬‫ساخت‬‫و‬‫گسترش‬‫وب‬،‫معنایی‬‫باید‬‫تا‬‫حد‬‫امکان‬‫قادر‬‫باشیم‬‫تمامی‬‫موجودیت‬ ‫ها‬(entities)‫و‬‫مفاهیم‬(concepts)‫و‬‫نیز‬‫روابط‬‫و‬‫ّصاالت‬‫ت‬‫ا‬‫ها‬‫آن‬‫با‬‫یکدیگر‬‫را‬‫به‬‫صورت‬ ‫هایی‬‫مدل‬‫مجرد‬‫به‬‫هایی‬‫زبان‬‫که‬‫برای‬‫ها‬‫رایانه‬‫قابل‬‫درک‬‫است‬‫بیان‬‫کنیم‬. ‫اینکه‬،‫کامپیوترها‬‫چطور‬‫این‬‫ارتباطات‬‫را‬‫درک‬‫کنند‬‫به‬‫نحوه‬‫ی‬‫ذخیره‬‫سازی‬‫اطالعات‬‫بس‬‫تگی‬ ‫دارد‬.‫ما‬‫در‬‫ذخیره‬‫سازی‬‫اطالعات‬‫باید‬‫طوری‬‫عمل‬‫کنیم‬‫که‬‫بازیابی‬‫آن‬‫موثرتر‬‫و‬‫مفیدتر‬‫ب‬‫اشد‬. ‫نیاز‬‫داریم‬‫عالوه‬‫بر‬«‫اطالعات‬»،‫به‬«‫معنای‬‫اطالعات‬»‫نیز‬‫دسترسی‬‫داشته‬‫باشیم‬. ‫تعریف‬‫تیم‬،‫برنرزلی‬‫پدر‬،‫وب‬‫وب‬‫معنایی‬‫را‬‫تعریف‬‫میکند‬: «‫قرار‬ ‫پردازش‬ ‫مورد‬ ‫ماشین‬ ‫توسط‬ ‫مسقیم‬ ‫غیر‬ ‫و‬ ‫مستقیم‬ ‫تواند‬‫می‬ ‫که‬ ‫داده‬ ‫از‬ ‫تارنمایی‬‫بگیرد‬.» ‫وب‬‫فهم‬ ‫قابل‬ ‫انسان‬ ‫توسط‬ ‫فقط‬ ‫کنونی‬ ‫وب‬ ‫برخالف‬ ‫که‬ ‫است‬ ‫وبی‬ ‫آینده‬،‫نباشد‬‫ماشین‬ ‫توسط‬ ‫بلکه‬‫ها‬‫پ‬ ‫و‬ ‫درک‬ ‫قابل‬ ‫نیز‬‫باشد‬ ‫ردازش‬. Off-Topic
  • 19. ‫معنایی‬ ‫وب‬ ‫و‬ ‫آنتولوژی‬ ‫وب‬‫معنایی‬‫یک‬‫جنبش‬‫مشترک‬‫است‬‫که‬‫توسط‬w3c ‫رهبری‬‫شود‬‫می‬‫و‬‫های‬‫فرمت‬‫رایج‬‫داده‬‫را‬‫روی‬‫شبکه‬ ‫گسترده‬‫جهانی‬‫ترویج‬‫کند‬‫می‬. ‫وب‬‫معنایی‬‫با‬‫تشویق‬‫به‬‫گنجاندن‬‫محتوای‬‫معنا‬‫یی‬‫در‬ ‫صفحات‬،‫وب‬‫به‬‫تبدیل‬‫شدن‬‫وب‬‫کنونی‬(‫که‬‫شامل‬ ‫اسناد‬‫ساختار‬‫نایافته‬‫است‬)‫به‬«‫وبی‬‫از‬‫داده‬‫ها‬»‫ک‬‫مک‬ ‫کند‬‫می‬. ‫در‬‫چارچوب‬‫شرح‬‫منابع‬(RDF)‫ساخته‬‫می‬‫شود‬. XML/XMLS RDF/RDFS OWL SPARQL ‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬ Off-Topic
  • 21. ‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬ RDF:‫زبان‬‫هستان‬‫شناسی‬‫مورد‬‫استفاده‬‫برای‬‫نمایش‬‫اطالعات‬‫دربارها‬‫منابع‬‫موجود‬‫روی‬‫وب‬ ‫منابع‬‫در‬‫قالب‬‫جمالتی‬‫شامل‬‫صفت‬‫ها‬‫و‬‫مقادیر‬‫صفت‬‫بیان‬‫می‬‫شوند‬. ‫عبارت‬RDF‫به‬‫صورت‬‫سه‬‫تایی‬‫متشکل‬‫از‬subject> predicate >object‫نمایش‬‫می‬‫یابند‬ ‫الگوی‬RDF‫یا‬RDFS:‫از‬‫لحاظ‬‫نحوی‬/‫دستوری‬RDF‫را‬‫قادر‬‫می‬‫سازد‬‫که‬‫درباره‬‫کالس‬‫های‬‫منابع‬‫و‬‫صفاتی‬‫که‬‫قرار‬ ‫است‬‫در‬‫آن‬‫ها‬‫استفاده‬‫شود‬‫ها‬‫صحبت‬‫گردد‬.‫امکان‬‫تعریف‬‫واژه‬‫نامه‬‫های‬RDF‫مبتنی‬‫بر‬‫یک‬‫کاربرد‬‫خاص‬‫را‬‫می‬ ‫دهد‬ Subject (Resource) http://www.w3.org/Home/Lassila Predicate (Property) Creator Object (literal) "Ora Lassila" Ora Lassila is the creator of the resource http://www.w3.org/Home/Lassila http://www.w3.org/ Home/Lassila Ora Lassila Creator Off-Topic
  • 22. SPARQL:‫جوی‬ ‫و‬ ‫پرس‬ ‫زبان‬ ‫یک‬RDF‫است‬ ‫داده‬ ‫پایگاه‬ ‫و‬ ‫آنتولوژی‬ ‫های‬ ‫مدل‬ ‫برای‬. .1‫قالب‬ ‫در‬ ‫شده‬ ‫ذخیره‬ ‫اطالعات‬ ‫دستکاری‬ ‫و‬ ‫استخراج‬ ‫قابلیت‬RDF‫دارد‬ ‫را‬. .2‫گراف‬ ‫بر‬ ‫مبتنی‬ ‫جوی‬ ‫و‬ ‫پرس‬ ‫زبان‬(graph-matching)‫دارد‬ ‫را‬ ‫مدل‬ ‫روی‬ ‫از‬ ‫دانش‬ ‫استخراج‬ ‫قابلیت‬ ‫است‬. .3‫شده‬ ‫تگ‬ ،‫یافته‬ ‫ساخت‬ ‫نیمه‬ ‫های‬ ‫داده‬ ‫از‬ ‫پشتیبانی‬(‫یافته‬ ‫غیرساخت‬)‫وب‬ ‫و‬ ‫شبکه‬ ‫داده‬ ‫منابع‬ ‫در‬ ‫جو‬ ‫و‬ ‫پرس‬ ‫و‬(‫نشان‬ ‫با‬ ‫شده‬URI) OWL:‫ها‬ ‫شناسی‬ ‫هستان‬ ‫نوشتن‬ ‫برای‬ ‫دانش‬ ‫نمایش‬ ‫های‬ ‫زبان‬ ‫از‬ ‫ای‬ ‫خانواده‬(‫یافت‬ ‫تعمیم‬‫ه‬RDF ‫و‬RDFS) ‫ها‬ ‫کالس‬ ‫و‬ ‫ها‬ ‫ویژگی‬ ‫توصیف‬ ‫برای‬ ‫بیشتر‬ ‫واژگان‬ ‫نمودن‬ ‫اضافه‬ ‫ها‬ ‫کالس‬ ‫بین‬ ‫ارتباط‬(disjointedness)،cardinality‫صفات‬ ‫از‬ ‫تر‬ ‫بهینه‬ ‫انواع‬ ،‫تساوی‬ ، OWL-DL:‫از‬ ‫ای‬ ‫گونه‬OWA‫توصیف‬ ‫منطق‬ ‫یافته‬ ‫تغییر‬ ،SHOIN/‫بر‬ ‫مبتنی‬RDFS ‫کند‬ ‫می‬ ‫پشتیانی‬ ‫داده‬ ‫نوع‬ ‫صفات‬ ‫و‬ ‫داده‬ ‫انواع‬ ،‫داده‬ ‫مقادیر‬ ‫از‬ ‫معنایی‬ ‫وب‬ ‫های‬ ‫مولفه‬ Off-Topic
  • 23. ‫مثال‬:RDF‫و‬SPARQL PREFIX ex: <http://example.com/exampleOntology#> SELECT ?capital ?country WHERE { ?x ex:cityname ?capital ; ex:isCapitalOf ?y . ?y ex:countryname ?country ; ex:isInContinent ex:Africa . } Off-Topic
  • 25. ‫پیشنهادی‬ ‫راهکار‬:‫تشریح‬‫مدل‬ ‫الیه‬1:‫داده‬ ‫های‬ ‫منبع‬ ‫الیه‬2:‫داده‬ ‫انباره‬ ‫زیرساخت‬ ‫الیه‬3:‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ ‫الیه‬4:‫نمایش‬
  • 26. ‫پیشنهادی‬ ‫راهکار‬:‫مدل‬ ‫تشریح‬ ‫شناسی‬ ‫هستان‬ ‫وب‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ (OWA) ‫نگاشت‬ ‫توابع‬ ‫های‬ ‫داده‬ ‫مخزن‬ ‫معنایی‬ (RDF Repos.)
  • 27. ‫راهکار‬‫پیشنهادی‬:‫اف‬ ‫نرم‬ ‫حل‬ ‫راه‬ ‫با‬ ‫سازی‬ ‫پیاده‬‫زاری‬ ‫پروژه‬ ‫فنی‬ ‫شرایط‬(‫ه‬ ‫الگ‬‫ا‬ ‫پروژه‬ ‫مسئله‬ ‫و‬) •‫سرور‬ ‫وب‬ ‫الگ‬(‫اسکریپ‬) •‫اینترنتی‬ ‫اوپراتور‬ ‫الگ‬(‫ش‬‫بکه‬) •‫نرم‬ ‫های‬ ‫حل‬ ‫راه‬ ‫بررسی‬ ‫افزاری‬ ‫راهکار‬ ‫جزئیات‬ ‫پیشنهادی‬ •‫وب‬ ‫داده‬ ‫انباره‬(ETL) •‫داده‬ ‫ادغام‬(‫و‬ ‫پردازش‬ ‫سطوح‬ ‫مختلف‬ ‫معماری‬) ‫سنجی‬ ‫تطابق‬‫با‬‫ها‬ ‫نیازمندی‬ ‫سنجی‬ ‫تطابق‬‫با‬‫ها‬ ‫نیازمندی‬
  • 28. ‫پیشنهادی‬ ‫راهکار‬:‫با‬ ‫سازی‬ ‫پیاده‬‫افزاری‬ ‫نرم‬ ‫حل‬ ‫راه‬
  • 29. ‫پیشنهادی‬ ‫راهکار‬:‫افزاری‬ ‫نرم‬ ‫بستر‬ ‫های‬ ‫مؤلفه‬ Hadoop HDFS APACHE ZOOKEEPER APACHE SOLR APACHE JENA SPARQL APACHE SPARK APACHE HBASE
  • 30. ‫گیری‬ ‫نتیجه‬ ‫و‬ ‫بندی‬ ‫جمع‬ ‫پیشنهادی‬ ‫حل‬ ‫راه‬ ‫داده‬ ‫انباره‬ ‫پایه‬ ‫بر‬‫ادغام‬ ‫فرآیند‬ ‫انجام‬ ‫قابلیت‬ ‫با‬ ‫ها‬ ‫داده‬ ‫ادغام‬ ‫معماری‬ ‫سه‬ ‫از‬ ‫پشتیبانی‬Redundant،Complementary‫و‬Cooperative ‫چندسطح‬ ‫در‬ ‫تحلیل‬ ‫و‬ ‫پردازش‬ ‫قابلیت‬(‫داده‬ ‫سطح‬/‫تصمیم‬ ‫سطح‬ ‫و‬ ‫ویژگی‬ ‫سطح‬ ،‫اندازه‬) ‫عظیم‬ ‫های‬ ‫داده‬ ‫پردازش‬ ‫مناسب‬ ‫و‬ ‫سریع‬ ،‫پذیری‬ ‫توسعه‬ ‫معماری‬ ‫آینده‬ ‫کارهای‬: ‫امنیتی‬ ‫تهدیدات‬ ‫و‬ ‫ها‬ ‫ربات‬ ،‫ناهنجاری‬ ‫کشف‬ ‫برای‬ ‫الگ‬ ‫همبستگی‬ ‫های‬ ‫شیوه‬ ‫از‬ ‫استفاده‬ ‫شیوه‬ ‫بنیادی‬ ‫توسعه‬‫همبستگی‬ ‫و‬ ‫ادغام‬ ‫های‬ ‫کارگیری‬ ‫به‬‫جمع‬ ‫بستر‬‫آوری‬‫جریانی‬ ‫های‬ ‫داده‬ ‫کالن‬ ‫تحلیل‬ ‫و‬ ‫ادغام‬ ،(Stream Big Data) ‫نتای‬ ‫سازی‬ ‫شخصی‬ ‫و‬ ‫تجمیع‬ ‫برای‬ ‫مشترک‬ ‫صورت‬ ‫به‬ ‫ها‬ ‫الگ‬ ‫همبستگی‬ ‫و‬ ‫ها‬ ‫داده‬ ‫ادغام‬ ‫های‬ ‫تکنیک‬ ‫کارگیری‬ ‫به‬‫و‬ ‫پرس‬ ‫ج‬ ‫جستجو‬ ‫موتورهای‬ ‫در‬ ‫کاربر‬ ‫جوی‬