Neo4j, Inc. All rights reserved 2023
1
Graph Data Science
Pierre Halftermeyer
Field Engineer @ Neo4j
Neo4j, Inc. All rights reserved 2023
Technologie de graphes pour les
applications et analyses
2
Outils
d’analyse
Transactions de graphes
Intégration de données
Dev.
& Admin
Pilotes & APIs Découverte & Visualisation
Analyses et data
science
Développeurs
Admins
Applications Utilisateurs métier
Data
Analysts
Data
Scientists
Neo4j, Inc. All rights reserved 2023
Les domaines de la Graph Data Science
Graph Native
Machine Learning
Découvrir de nouveaux
patterns
Prédire liens, labels, et valeurs
avec des modèles ML
optimisés pour le graphe.
Identifier des associations,
anomalies, et tendances à l’aide
de ML non supervisé.
Algorithmes de graphes
Graphes de connaissance
Trouver des motifs dans vos
données connectées
3
Neo4j, Inc. All rights reserved 2023
Principaux cas d’usages de la Graph Data Science
4
Recommendations
• Parcours de soin archétypes et patterns
• Révéler les similarities à travers le temps
• Trouver les points d’inflexion
Détection de fraude
• 300%+ augmentation de la detection
• 10% vrais positifs escaladés (industry is <1%)
• ~150% augmentation en gain de payment
K-360
• 1621% augmentation contact client
• 500% augmentation visites par profil
• 20-30% amélioration de la connaissance du
client
• Prédiction de l'attrition
Logistique / ch. d’appr..
• Planification < seconde des routes
• Reduction de l’emission CO2 60,000 tonness
• 12-16M ROI pour les clients de OrbitMI
Neo4j, Inc. All rights reserved 2023
6
La bibliothèque Neo4j GraphDataScience
Graphe Mutable
en-mémoire
Computational Graph
SGBD graphe natif
Neo4j, Inc. All rights reserved 2023
60+ algorithmes de graphes dans Neo4j
7
• Centralité de degré
• Centralité de proximité
• Centralité harmonique
• Betweenness Centrality & Approx.
• PageRank
• Personalized PageRank
• ArticleRank
• Eigenvector Centrality
• Plus court chemin
• A* Shortest Path
• Yen’s K Shortest Path
• Minimum Weight Spanning Tree
• K-Spanning Tree (MST)
• Random Walk
• Breadth & Depth First Search
• Euclidean Distance
• Cosine Similarity
• Node Similarity (Jaccard)
• Overlap Similarity
• Pearson Similarity
• Approximate KNN
Recherche et
cheminement
Centralité /
Importance
Similarité
Prédiction de lien
• Adamic Adar
• Common Neighbors
• Preferential Attachment
• Resource Allocations
• Same Community
• Total Neighbors
... Fonctions auxiliaires:
• Génération de graphes aléatoires
• Export de graphes
• Encodage à chaud
• Distributions & métriques
Embedding
(vectorisation)
• Node2Vec
• Random Projections
• GraphSAGE
Détection de
communautés
• Triangle Count
• Local Clustering Coefficient
• Connected Components (Union
Find)
• Strongly Connected Components
• Label Propagation
• Louvain Modularity
• K-1 Coloring
• Modularity Optimization
Neo4j, Inc. All rights reserved 2023
Vectorisation:
Enrichir vos données :
La topologie du graphe
contient de l’information
exploitable pour le ML.
Graph Embeddings summarize the enhanced
explicit knowledge of a graph
8
Neo4j, Inc. All rights reserved 2023
Architecture hybride
● Ajouter un membre
dédié à GDS à votre
cluster
● L’écriture en base est
supportée nativement
Neo4j, Inc. All rights reserved 2023
Nouveau: API Python pour la Graph Data Science
● Client python natif
● Exécuter GDS tout
simplement depuis un
notebook
● Support d’AuraDS
● Dataframe pandas supportés
● Porte d’entrée vers GDS pour les
data scientists
Neo4j, Inc. All rights reserved 2023
Nouveau: Invocation d’algorithmes GDS depuis Bloom
Neo4j, Inc. All rights reserved 2023
12
Merci !
pierre.halftermeyer@neo4j
Neo4j, Inc. All rights reserved 2023
New: AuraDS - data science as a service
Automated Operability
We deploy your instance, we keep it up to date
and running. You don’t have to do anything!
ML Ops Support
GDS EE Access means you can persist, publish,
and restore models - no interruptions from restarts
Secure in-flight and at rest
We automatically apply patches - workloads are
monitored and backed up to prevent interruptions.
Backup with one click
Take a snapshot of your instance, models and
in-memory graphs in one click
Scale on demand
Access to large hardware that you can scale up
and down on demand
Enterprise Graph Data Science
AuraDS includes GDS EE licensing plus early
access to new GDS algorithms and features.
Pause when you need
Data scientists expect to pause unused instances;
we support pausing according to tier.
Pay the way you want
Customers can select pay-as-you-go pricing with
the self start tier or annual contracts.