1. Πρόβλεψη Δημοτικότητας
Ειδησεογραφικών Άρθρων από δεδομένα
κειμένου και εικόνας.
Διπλωματική εργασία του
Γεωργιάδη Ορέστη
ΑΕΜ: 6630
υπό την επίβλεψη του
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ
ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ
ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ
ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ
κ. Ανδρέα Λ. Συμεωνίδη
Αναπληρωτής Καθηγητής - ΑΠΘ
Θεσσαλονίκη – 4 Ιουλίου 2019
3. Σκοπός της διπλωματικής εργασίας
• Δημιουργία ενός συστήματος πρόβλεψης της
δημοτικότητας ειδησεογραφικών άρθρων
Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 3
Σύνολο
εκπαίδευσης
Αριθμός προβολών
άρθρου
Νευρωνικό Δίκτυο
4. Γνώσεις που αποκτήθηκαν
• Επεξεργασία δεδομένων σε Python (numpy,
pandas)
• Λειτουργία deep learning αλγορίθμων
• Υλοποίηση Νευρωνικών Δικτύων (Keras,
Tensorflow)
• Ερευνητική διαδικασία!!!
Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 4
10. Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 10
• Παράδειγμα ελαχιστοποίησης συνάρτησης κόστους με 2
ανεξάρτητες μεταβλητές
• Το Νευρωνικό Δίκτυο έχει περίπου 81,000 μεταβλητές
14. Συμπεράσματα
• Μοντέλο παλινδρόμησης – όλα τα αποτελέσματα δείχνουν
βελτίωση συγκριτικά με τις κλασικές μεθόδους
• Μοντέλο ταξινόμησης – τα αποτελέσματα δεν φαίνεται να
βελτιώνουν σε ικανοποιητικό βαθμό τις κλασικές μεθόδους
• Συμπληρωματικά πειράματα έδειξαν ότι οι τίτλοι και ο
εκδότης των άρθρων επηρεάζουν σε μεγαλύτερο βαθμό τα
αποτελέσματα του δικτύου
• Ο ρυθμός εκμάθησης δεν επηρεάζει την ταχύτητα
εκπαίδευσης των μοντέλων
Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 14
15. Μελλοντική Εργασία
• Έλεγχος και πειραματισμός με διαφορετικές παραμέτρους
του δικτύου όπως π.χ. αριθμός και μέγεθος φίλτρων,
αριθμός κρυμμένων επιπέδων, αριθμός νευρώνων κάθε
επιπέδου
• Αξιοποίηση μεθόδων ανάλυσης εικόνων και όχι μόνο
ετικετών που παράγονται από annotators
• Προσαρμογή του δικτύου για βελτιστοποίηση του μοντέλου
ταξινόμησης
Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 15
16. Ευχαριστώ για την προσοχή σας!
Γεωργιάδης Ορέστης - ΤΗΜΜΥ ΑΠΘ 2019 16