SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
Yahoo! Pipes : présentation
Erwan Tanguy
Présentation
Yahoo! Pipes est une plateforme assez novatrice
puisqu’elle permet gratuitement de modifier ou de créer
des flux de contenus sans programmation.
Pourtant, monter des pipes n’est pas si facile dès qu’on
veut y ajouter quelques subtilités.
Pour nos formations sur Yahoo! Pipes, il est indispensable
que les stagiaires est un compte chez Yahoo! Pour pouvoir
accéder à la plateforme et créer des pipes.
Nous allons voir :

Les modules

Comment créer des filtres

Comment créer des flux à partir d’une page html

Comment créer des requêtes

Comment créer des pipes complexes
Sur ce document vous trouverez les détails essentiels sur la
plupart des modules de la plateforme Yahoo! Pipes.

Source : Yahoo! Pipes de Mark Pruett,
ed. O’Reilly
Les sources












Find First Site Feed
Yahoo! Local
Xpath Fetch Page
Fetch Feed
YQL
Item Builder
Flickr
Fetch CSV
Fetch Data
RSS Item Builder
Feed Auto-Discover
Les sources
Find First Site Feed

Yahoo! Local

Ce module est simple. Il permet
de récupérer le premier flux
déclarer d’un site. Si aucun flux
RSS n’est présent, il n’y aura pas
de réponse.

Ce module est peu utilisable en
France. Il permet de créer une
carte sur une ville autour d’un
thème. (Je n’aborderai pas ce
module.)
Les sources
Xpath Fetch Page

Ce module est un des outils les
plus puissant de YP. Il va vous
permettre de générer un flux sur
une page en ciblant une zone
précise. Généralement, on ajoute
un module Regex ensuite pour
déterminer quels seront les
contenus Titre, Description,
Lien…
Ce module nécessite une bonne
connaissance du HTML.

Syntaxe XPath :
 Nodename : (ex : paragraphe ou body) sélectionner tous
les nœuds enfants du nœud nommé
 / : Sélectionner à partir du nœud racine
 // : Sélectionner les nœuds présents dans le document qui
correspondent quel que soit leur emplacement à la
sélection
 . : Sélectionner le nœud courant
 .. : Sélectionner le parent du nœud courant
 @ : Sélectionner des attributs
 //* : Sélectionner tous les éléments
 //p : Sélectionner tous les éléments de p
 P>* : Sélectionner tous les nœuds enfants de p
 //*[@id=’page’] : Sélectionner tous les éléments par id
 //*[@title] : Sélectionner les éléments avec attributs
source : http://www.stratieo.com/les-modules-de-yahoo-pipesfonctionnalites-niveau-1/
Les sources
Fetch Feed

YQL

Ce module est un des plus utilisés.
Il permet de récupérer des flux
RSS et de les mélanger pour
générer en sortie un unique flux.
Généralement, on utilise ensuite
un filtre pour ne récupérer des
flux que les contenus qui nous
intéressent.

Ce module est assez complexe. Il
permet de récupérer des données
via une requête en YQL, c’est-àdire une forme de langage très
proche du SQL propre à Yahoo!.
(Je n’aborderai pas ce module.)
Les sources
Item Builder

Flickr

Ce module permet de créer un
item avec ses différents champs. Il
peut être utile pour reformuler
certains flux.
Pourrons l’utiliser dans un
module Loop par exemple et ainsi
créer des modifications en chaine.

Ce module permet, avec une clé
API à obtenir sur le site de Flickr,
de récupérer des images autour
d’un mot clé et d’une
géolocalisation.
Les sources
Fetch CSV

Fetch Data

Ce module permet de récupérer
des données à partir d’un fichier
CSV en ligne (sur Google Drive
par exemple). Ces données
pourront être ensuite récupérer
en RSS ou en CSV.

Ce module permet de récupérer
des données à partir d’un fichier
RSS ou Atom en. Il faut ensuite
indiquer les données à récupérer.
Cela ne propose pas comme Fetch
Feed un résultat pré organisé.
Les sources
RSS Item Builder

Ce module est assez proche de
Item Builder mais orienté RSS. Il
va permettre de bien organiser les
données pour qu’elles puissent
bien être interprétées ensuite.

Fetch Auto-Discover

Ce module permet de récupérer
tous les flux RSS répertoriés sur
une page à la différence de Find
First Site Feed qui ne prend que le
premier. Attention, comme Fetch
Data, le résultat n’est pas
organisé, il faudra d’autres
modules (Loop + Fetch Feed)
ensuite pour structurer la version
finale de votre pipe.
User Inputs
Les modules de User inputs permettent de créer des
formulaires dans votre pipe, pour ainsi proposer des résultats
différents à partir d’un même montage.
Les différents modules sont destinés à des formats de données
différents :






Date
URL
Nombre
Texte
Données de localisation

Pour aller au-delà, il vous permettra d’utiliser un pipe modèle
à l’intérieur d’un ou plusieurs autres pipes. Le pipe enverra
des données via les inputs grâce au module Loop dans le
second pipe puis récupèrera les données à exploiter.
Operators
Count

Ce module permet de compter le
nombre d’items dans un flux.
Renanme

Ce module permet de copier ou de
renommer des champs dans un
item.
Operators
Create RSS

Ce module est assez proche de
RSS Item Builder mais ne
nécessite pas l’utilisation d’un
Loop pour fonctionner. Vous allez
pouvoir améliorer les placements
des données (des contenus d’un
flux RSS mal formé par exemple)
dans des champs reconnus.
Operators
Regex

Ce module est très puissant. Il
permet de reformer les contenus à
partir de formule, de les modifier
en les réduisant ou en les
augmentant. Il peut mémoriser
temporairement des données.
Operators
Regex
Ce module utilise les expressions régulières pour la manipulation.
Les expressions régulières sous Yahoo! Pipes demandent un peu de pratique. « [dD]* » indique
un contenu a ne pas prendre en compte – il précède ou suit les contenu recherchés. « (.*) » indique un
contenu à retenir. Il est possible d’en retenir plusieurs qui pourront se faire appeler ensuite $1, $2, etc.
Parfois « (.*) » ne permet pas de récupérer les contenus en raison de saut de ligne par exemple. Il est
possible d’utiliser alors « ([^>]*) », de même pour les liens avec « ([^"]*) ».
Si vous indiquez ^http://(.*), la valeur $1 sera égale à une url sans http://.
+ http://www.stratieo.com/les-modules-de-yahoo-pipes-fonctionnalites-niveau-2-3-et-4/yahoo-pipes-regex-2/
Pas simple à utiliser, mais impressionnant quand ça marche !
En complément de Xpath Fetch Page, le résultat sera définit en fonction de sa place dans l’item (${td.0.span.0.a.href} par exemple pour aller
chercher un lien dans un élément précis).
Voir aussi :
http://bibliotheques.wordpress.com/2009/05/13/yahoo-pipes-tutoriel-6-expressions-regulieres/
http://fr.wikipedia.org/wiki/Expression_rationnelle
http://www.siteduzero.com/informatique/tutoriels/concevez-votre-site-web-avec-php-et-mysql/les-expressions-regulieres-partie-1-2
Operators
Regex
Voir aussi :
 http://bibliotheques.wordpress.com/2009/05/13/yahoo-pipes-tutoriel-6-expressions-regulieres/
 http://fr.wikipedia.org/wiki/Expression_rationnelle
 http://www.siteduzero.com/informatique/tutoriels/concevez-votre-site-web-avec-php-et-mysql/les-expressionsregulieres-partie-1-2

Source : Yahoo! Pipes de Mark Pruett, ed. O’Reilly
Operators
Tail & Truncate

Split & Union

Ces deux modules servent à ne
sélectionner qu’une partie des
résultats d’un flux ou d’une
addition de flux. Tail prend le
nombre indiqué en partant du
dernier et Truncate à partir du
premier.

Ces deux modules permettent de
séparer (Split) un flux pour en
faire différentes choses ensuite ou
de réunir des flux ensemble
(Union).
Operators
Sub-element

Sort

Ce module est utilisé lorsqu’une
seule donnée est à garder. Si on
choisit « item.title », les résultats
n’afficheront plus dans chaque
item que le titre dans un élément
« content ».

Ce module permet de changer
l’ordre des items en fonction de
leur date par exemple. Deux choix
sont possibles : ascending (du
plus ancien au plus récent) et
descending (inverse).
Operators
Filter

Ce module est très utilisé puisqu’il
permet de sélectionner des
contenus à garder ou à exclure.
Son utilisation n’est pas très
complexe mais il peut arriver que
ça ne fonctionne pas comme
prévu.

Options :
 Permit/Block : vous choisissez de
bloquer ou de permettre
 All/Any : Toutes les conditions
doivent être présentes (très
restrictif) ou seulement une des
règles
 Contains/Does not contain/Matches
regex/is greater than/is/is less
than/is after/is before : définit la
règle d’un contenu pour un
contenant. Matches regex permet
d’utiliser des expressions régulières.
Operators
Loop

Ce module est utilisé pour générer
à partir d’un flux de données une
boucle d’effets. Pratiquement tous
les modules peuvent être utilisé
dans un loop. Il est même
possible, et c’est là-aussi qu’il est
puissant, de récupérer un autre
pipe avec par exemple des inputs
et boucler sur son montage avant
de continuer le pipe.
Operators
Location Extractor

Reverse

Ce module est utilisé lorsque des
données de géolocalisation sont
présentes dans les flux. Il les
organise alors dans un élément
y:location où vous retrouverez les
valeurs de latitude, de longitude…
Les données de localisation
peuvent se trouver dans un fichier
CSV par exemple et vous avez
besoin de les exporter vers une
carte.

Ce module d’inverser l’ordre des
items, moins précis Sort puisque
cela se fait à la voler sans référent
autre que l’ordre au départ.
Operators
Unique

Web service

Ce module permet d’enlever des
doublons. Il est possible de choisir
l’élément de référence qui peut
être donc un lien, un titre ou une
description. Ce module est limité
au fait qu’un titre légèrement
différent ne sera pas pris en
compte. Pour les liens, le
problème peut venir des
réductions d’URL qui cachent
l’URL originale.

Ce module permet d’envoyer des
données en JSON d’un serveur
externe et de l’insérer dans un
flux. Il est indispensable de
vérifier que le serveur accepte de
recevoir des données via HTTP
POST. (Je n’aborderai pas ce
module.)
URL
URL Builder

Ce module permet de générer des
URLs qui peuvent être parfois
complexe et intégrer des parties
variables avec des inputs.

Options :
 Base : l’URL principale
 Port : si un port est nécessaire (si
vous insérer 12, cela affichera
http://nomdedomaine.com:12/)
 Path elements : correspond aux
éventuels dossiers et fichier
 Query parameters : pour ajouter des
valeurs dans l’URL (pratique pour des
moteurs de recherche par exemple)
Sting
Les modules de String permettent de
travailler le contenus des éléments.
Certaines particularités sont assez
proches du Regex. Généralement, ils
sont utilisés dans un Loop ou dans la
suite d’un input.

 Yahoo! Shortcuts : classifier des mots
ou expressions courantes (surtout
USA)
 String Replace : remplacer des
termes par d’autres
 String Builder : construire des
contenus en les imbriquant
 String Tokenizer : sépare des
contenus à partir d’un élément
récurrent (des virgules, tirets…)
 Sub String : couper la longueur d’un
élément en nombre de caractères
 Term Extractor : extraire d’un
élément les thématiques principales
(mots clés)
 String Regex : sur le principe de
Regex
 Private String : permet de mettre des
données sécurisées
Date



Les modules de Date permettent de
sur les dates, sur leurs formats.



Data Builder : limiter un flux en fonction
de date et de requête (en anglais).
L’expression « 2 days ago » enlevera tous
les contenus plus vieux de deux jours.
Options (exemples) :
 Tomorrow, Yesterday, Now
 X days ago
 As welle as « xx/xx/20xx » and
« xx:xx EST »
 Jan. 12, 2001
 10/21/2012
 01 March 13
 +5 hours
 -10 days
Date Formatter : modifier le format de
présentation des dates.
Options (exemples) :
 02-12-2013 : %m-%d-%Y
 Tuesday, Feb 12, 13 at 08:45 PM :
%A, %b %d, %y at §I:%M %p
 02/12/13 : %D
 20:45 : %R
 February : %B
Date

Source : Yahoo! Pipes de Mark Pruett, ed. O’Reilly
Location & Number
Location Builder

Simple Math

Le module Location Builder
permet de générer des données de
géolocalisation. Avec ensuite le
module Location Extractor il sera
possible de générer un élément
y:location dans un flux.

Le module Simple Math permet
de faire des opérations (additions,
soustractions, multiplications,
divisions, pourcentage…). Peutêtre utilisé avec un module Count
par exemple.
Et aussi
Dans Favorites et My pipes se trouve les pipes qui ont déjà été
enregistrés sur un compte. Il est possible de les réutiliser dans un
nouveau pipe via un Loop. Le pipe devra comporter des inputs
pour que des données puissent y être injectées.
Dans Deprecated se trouve des modules anciens qui sont
encore fonctionnel mais qui ne sont pas conseillés et risque de ne
plus apparaître.
Le module Fetch Page, qui a été remplacé par le module Xpath
Fetch Page, est utilisé pour scanner des pages HTML et générer
un flux RSS.
Voir : http://blog.voyelle.me/veille/des-flux-rss-a-une-veille-desurface-5
Suivre notre veille






Sur Diigo : https://www.diigo.com/user/erwantanguy/pipes
Sur notre blog http://www.digital-strategy.fr/
Retrouver ce document ainsi que d’autres slides sur
http://www.slideshare.net/erwantanguy/
http://www.stratieo.com/mot-cle/yahoo-pipes/
Ouvrage : Yahoo! Pipes de Mark Pruett, ed. O’Reilly

Weitere ähnliche Inhalte

Was ist angesagt?

Presentation Lucene / Solr / Datafari - Nantes JUG
Presentation Lucene / Solr / Datafari - Nantes JUGPresentation Lucene / Solr / Datafari - Nantes JUG
Presentation Lucene / Solr / Datafari - Nantes JUGfrancelabs
 
Affichage d'un document Office sous Android
Affichage d'un document Office sous AndroidAffichage d'un document Office sous Android
Affichage d'un document Office sous AndroidStéphane Liétard
 
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014francelabs
 
Les Streams sont parmi nous
Les Streams sont parmi nousLes Streams sont parmi nous
Les Streams sont parmi nousJosé Paumard
 
Presentation solr 10 Aout 2011 (french)
Presentation solr 10 Aout 2011 (french)Presentation solr 10 Aout 2011 (french)
Presentation solr 10 Aout 2011 (french)Thibaud Vibes
 
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...Mathieu Saby
 
Moteurs de recherche : un oeil sous le capot avec Elastic Search
Moteurs de recherche : un oeil sous le capot avec Elastic SearchMoteurs de recherche : un oeil sous le capot avec Elastic Search
Moteurs de recherche : un oeil sous le capot avec Elastic SearchAudrey Neveu
 
Stratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneStratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneErwan Tanguy
 
Extraire et trier des données en ligne 2015
Extraire et trier des données en ligne 2015Extraire et trier des données en ligne 2015
Extraire et trier des données en ligne 2015Erwan Tanguy
 

Was ist angesagt? (10)

Presentation Lucene / Solr / Datafari - Nantes JUG
Presentation Lucene / Solr / Datafari - Nantes JUGPresentation Lucene / Solr / Datafari - Nantes JUG
Presentation Lucene / Solr / Datafari - Nantes JUG
 
Affichage d'un document Office sous Android
Affichage d'un document Office sous AndroidAffichage d'un document Office sous Android
Affichage d'un document Office sous Android
 
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014
Solr, c'est simple et Big Data ready - prez au Lyon jug Fév 2014
 
Les Streams sont parmi nous
Les Streams sont parmi nousLes Streams sont parmi nous
Les Streams sont parmi nous
 
Presentation solr 10 Aout 2011 (french)
Presentation solr 10 Aout 2011 (french)Presentation solr 10 Aout 2011 (french)
Presentation solr 10 Aout 2011 (french)
 
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
Découvrez OpenRefine: un outil gratuit pour nettoyer, préparer et enrichir vo...
 
Introduction à ajax
Introduction à ajaxIntroduction à ajax
Introduction à ajax
 
Moteurs de recherche : un oeil sous le capot avec Elastic Search
Moteurs de recherche : un oeil sous le capot avec Elastic SearchMoteurs de recherche : un oeil sous le capot avec Elastic Search
Moteurs de recherche : un oeil sous le capot avec Elastic Search
 
Stratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligneStratégie et veille : Extraire et trier des données en ligne
Stratégie et veille : Extraire et trier des données en ligne
 
Extraire et trier des données en ligne 2015
Extraire et trier des données en ligne 2015Extraire et trier des données en ligne 2015
Extraire et trier des données en ligne 2015
 

Andere mochten auch

Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...
Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...
Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...ACSG Section Montréal
 
Atelier RCIP - Bloggage - BCMA 2009
Atelier RCIP - Bloggage - BCMA 2009Atelier RCIP - Bloggage - BCMA 2009
Atelier RCIP - Bloggage - BCMA 2009Heather Dunn
 
Pptfotospasoadelante
PptfotospasoadelantePptfotospasoadelante
Pptfotospasoadelantegvmoor
 
Open Source Geospatial Foundation (OSGeo)
Open Source Geospatial Foundation (OSGeo)Open Source Geospatial Foundation (OSGeo)
Open Source Geospatial Foundation (OSGeo)ACSG Section Montréal
 
Organizacion politica griega
Organizacion politica griegaOrganizacion politica griega
Organizacion politica griegaElisabett Nuñez
 
Ftcr calderon maria roxinia
Ftcr calderon maria roxiniaFtcr calderon maria roxinia
Ftcr calderon maria roxiniaMariaRoxCalderon
 
Historieta 01 de Zoe
Historieta 01 de ZoeHistorieta 01 de Zoe
Historieta 01 de ZoeZoe17122003
 
Videoconferencia
VideoconferenciaVideoconferencia
VideoconferenciaCen Snte
 
Le Web2
Le Web2Le Web2
Le Web2Ledjit
 
Paysages D Aliments
Paysages D AlimentsPaysages D Aliments
Paysages D Alimentsguest6498e7
 
La coopération en information géographique au gouvernement du Québec
La coopération en information géographique au gouvernement du QuébecLa coopération en information géographique au gouvernement du Québec
La coopération en information géographique au gouvernement du QuébecACSG Section Montréal
 
Presentacion Jonatan
Presentacion  JonatanPresentacion  Jonatan
Presentacion JonatanJonatan
 
Comparatif entre certains entrepôts de données géospatiales
Comparatif entre certains entrepôts de données géospatialesComparatif entre certains entrepôts de données géospatiales
Comparatif entre certains entrepôts de données géospatialesACSG Section Montréal
 
Tutorial de netvibes
Tutorial de netvibesTutorial de netvibes
Tutorial de netvibesalexandra4321
 
Louis Xiv
Louis XivLouis Xiv
Louis Xivhaoling
 
Procesador de texto
Procesador de textoProcesador de texto
Procesador de textojesus2028
 
Louis Xiv
Louis XivLouis Xiv
Louis Xivhaoling
 

Andere mochten auch (20)

Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...
Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...
Réalité Augmentée Mobile dans un contexte de géo-ingénierie : défis et perspe...
 
software libre
software libresoftware libre
software libre
 
Atelier RCIP - Bloggage - BCMA 2009
Atelier RCIP - Bloggage - BCMA 2009Atelier RCIP - Bloggage - BCMA 2009
Atelier RCIP - Bloggage - BCMA 2009
 
Pptfotospasoadelante
PptfotospasoadelantePptfotospasoadelante
Pptfotospasoadelante
 
Open Source Geospatial Foundation (OSGeo)
Open Source Geospatial Foundation (OSGeo)Open Source Geospatial Foundation (OSGeo)
Open Source Geospatial Foundation (OSGeo)
 
Organizacion politica griega
Organizacion politica griegaOrganizacion politica griega
Organizacion politica griega
 
Ftcr calderon maria roxinia
Ftcr calderon maria roxiniaFtcr calderon maria roxinia
Ftcr calderon maria roxinia
 
Historieta 01 de Zoe
Historieta 01 de ZoeHistorieta 01 de Zoe
Historieta 01 de Zoe
 
Videoconferencia
VideoconferenciaVideoconferencia
Videoconferencia
 
Le Web2
Le Web2Le Web2
Le Web2
 
Paysages D Aliments
Paysages D AlimentsPaysages D Aliments
Paysages D Aliments
 
Ada 2
Ada 2Ada 2
Ada 2
 
La coopération en information géographique au gouvernement du Québec
La coopération en information géographique au gouvernement du QuébecLa coopération en information géographique au gouvernement du Québec
La coopération en information géographique au gouvernement du Québec
 
Presentacion Jonatan
Presentacion  JonatanPresentacion  Jonatan
Presentacion Jonatan
 
Catedra Upecista
Catedra Upecista Catedra Upecista
Catedra Upecista
 
Comparatif entre certains entrepôts de données géospatiales
Comparatif entre certains entrepôts de données géospatialesComparatif entre certains entrepôts de données géospatiales
Comparatif entre certains entrepôts de données géospatiales
 
Tutorial de netvibes
Tutorial de netvibesTutorial de netvibes
Tutorial de netvibes
 
Louis Xiv
Louis XivLouis Xiv
Louis Xiv
 
Procesador de texto
Procesador de textoProcesador de texto
Procesador de texto
 
Louis Xiv
Louis XivLouis Xiv
Louis Xiv
 

Ähnlich wie Support de formation : Yahoo! pipes les modules

Créer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathCréer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathErwan Tanguy
 
Formation PHP avancé - Cake PHP
Formation PHP avancé - Cake PHPFormation PHP avancé - Cake PHP
Formation PHP avancé - Cake PHPkemenaran
 
Presentation Spring, Spring MVC
Presentation Spring, Spring MVCPresentation Spring, Spring MVC
Presentation Spring, Spring MVCNathaniel Richand
 
Les concepts de la programmation fonctionnelle illustrés avec java 8
Les concepts de la programmation fonctionnelle illustrés avec java 8Les concepts de la programmation fonctionnelle illustrés avec java 8
Les concepts de la programmation fonctionnelle illustrés avec java 8Yannick Chartois
 
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4Olivier Pinette
 
Introduction à ERRest
Introduction à ERRestIntroduction à ERRest
Introduction à ERRestWO Community
 
Synchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementSynchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementgplanchat
 
Tutoriel TaDaweb
Tutoriel TaDawebTutoriel TaDaweb
Tutoriel TaDawebCell'IE
 
BordeauxJUG : Portails & Portlets Java
BordeauxJUG : Portails & Portlets JavaBordeauxJUG : Portails & Portlets Java
BordeauxJUG : Portails & Portlets JavaCamblor Frédéric
 
Support de formation : Filtrer des flux rss
Support de formation : Filtrer des flux rssSupport de formation : Filtrer des flux rss
Support de formation : Filtrer des flux rssErwan Tanguy
 
JUG Nantes - Telosys Tools - Avril 2014
JUG Nantes - Telosys Tools - Avril 2014 JUG Nantes - Telosys Tools - Avril 2014
JUG Nantes - Telosys Tools - Avril 2014 telosys
 
Telosys tools jug-nantes-2014-v1.2
Telosys tools jug-nantes-2014-v1.2Telosys tools jug-nantes-2014-v1.2
Telosys tools jug-nantes-2014-v1.2Laurent Guérin
 
Pratique de la programmation en go
Pratique de la programmation en goPratique de la programmation en go
Pratique de la programmation en goAbdoul Kader Sarambe
 
Pratique de la programmation en go
Pratique de la programmation en goPratique de la programmation en go
Pratique de la programmation en gokader15
 
Quelle place pour le framework Rails dans le développement d'application web
Quelle place pour le framework Rails dans le développement d'application webQuelle place pour le framework Rails dans le développement d'application web
Quelle place pour le framework Rails dans le développement d'application web5pidou
 
laravel.sillo.org-Cours Laravel 10 les bases artisan et les contrôleurs_2.pdf
laravel.sillo.org-Cours Laravel 10  les bases  artisan et les contrôleurs_2.pdflaravel.sillo.org-Cours Laravel 10  les bases  artisan et les contrôleurs_2.pdf
laravel.sillo.org-Cours Laravel 10 les bases artisan et les contrôleurs_2.pdfHeartKing10
 
Symfony2 - Un Framework PHP 5 Performant
Symfony2 - Un Framework PHP 5 PerformantSymfony2 - Un Framework PHP 5 Performant
Symfony2 - Un Framework PHP 5 PerformantHugo Hamon
 

Ähnlich wie Support de formation : Yahoo! pipes les modules (20)

Créer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPathCréer des flux RSS avec Yahoo! Pipes et son module xPath
Créer des flux RSS avec Yahoo! Pipes et son module xPath
 
Formation PHP avancé - Cake PHP
Formation PHP avancé - Cake PHPFormation PHP avancé - Cake PHP
Formation PHP avancé - Cake PHP
 
Presentation Spring, Spring MVC
Presentation Spring, Spring MVCPresentation Spring, Spring MVC
Presentation Spring, Spring MVC
 
Serveur node red
Serveur node redServeur node red
Serveur node red
 
Les concepts de la programmation fonctionnelle illustrés avec java 8
Les concepts de la programmation fonctionnelle illustrés avec java 8Les concepts de la programmation fonctionnelle illustrés avec java 8
Les concepts de la programmation fonctionnelle illustrés avec java 8
 
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4
Nouveautés de DataDrill EXPRESS 4.1, 4.2, 4.3 et 4.4
 
Introduction à ERRest
Introduction à ERRestIntroduction à ERRest
Introduction à ERRest
 
Synchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplementSynchroniser ses applications (plus) simplement
Synchroniser ses applications (plus) simplement
 
SPIP
SPIPSPIP
SPIP
 
Tutoriel TaDaweb
Tutoriel TaDawebTutoriel TaDaweb
Tutoriel TaDaweb
 
BordeauxJUG : Portails & Portlets Java
BordeauxJUG : Portails & Portlets JavaBordeauxJUG : Portails & Portlets Java
BordeauxJUG : Portails & Portlets Java
 
Support de formation : Filtrer des flux rss
Support de formation : Filtrer des flux rssSupport de formation : Filtrer des flux rss
Support de formation : Filtrer des flux rss
 
JUG Nantes - Telosys Tools - Avril 2014
JUG Nantes - Telosys Tools - Avril 2014 JUG Nantes - Telosys Tools - Avril 2014
JUG Nantes - Telosys Tools - Avril 2014
 
Telosys tools jug-nantes-2014-v1.2
Telosys tools jug-nantes-2014-v1.2Telosys tools jug-nantes-2014-v1.2
Telosys tools jug-nantes-2014-v1.2
 
Pratique de la programmation en go
Pratique de la programmation en goPratique de la programmation en go
Pratique de la programmation en go
 
Pratique de la programmation en go
Pratique de la programmation en goPratique de la programmation en go
Pratique de la programmation en go
 
Quelle place pour le framework Rails dans le développement d'application web
Quelle place pour le framework Rails dans le développement d'application webQuelle place pour le framework Rails dans le développement d'application web
Quelle place pour le framework Rails dans le développement d'application web
 
laravel.sillo.org-Cours Laravel 10 les bases artisan et les contrôleurs_2.pdf
laravel.sillo.org-Cours Laravel 10  les bases  artisan et les contrôleurs_2.pdflaravel.sillo.org-Cours Laravel 10  les bases  artisan et les contrôleurs_2.pdf
laravel.sillo.org-Cours Laravel 10 les bases artisan et les contrôleurs_2.pdf
 
Symfony2 - Un Framework PHP 5 Performant
Symfony2 - Un Framework PHP 5 PerformantSymfony2 - Un Framework PHP 5 Performant
Symfony2 - Un Framework PHP 5 Performant
 
Cours php bac info
Cours php bac infoCours php bac info
Cours php bac info
 

Mehr von Erwan Tanguy

Sendinblue freelance fair tour
Sendinblue freelance fair tourSendinblue freelance fair tour
Sendinblue freelance fair tourErwan Tanguy
 
Sendinblue : la plateforme française pour l'emailing et la newsletter
Sendinblue : la plateforme française pour l'emailing et la newsletterSendinblue : la plateforme française pour l'emailing et la newsletter
Sendinblue : la plateforme française pour l'emailing et la newsletterErwan Tanguy
 
Outils collaboratifs en formation
Outils collaboratifs en formationOutils collaboratifs en formation
Outils collaboratifs en formationErwan Tanguy
 
Automation et réseaux sociaux
Automation et réseaux sociauxAutomation et réseaux sociaux
Automation et réseaux sociauxErwan Tanguy
 
Meetup cssflip : shapes et clip-path
Meetup cssflip : shapes et clip-pathMeetup cssflip : shapes et clip-path
Meetup cssflip : shapes et clip-pathErwan Tanguy
 
Automation : publier sur les réseaux sociaux quand on a pas le temps
Automation : publier sur les réseaux sociaux quand on a pas le tempsAutomation : publier sur les réseaux sociaux quand on a pas le temps
Automation : publier sur les réseaux sociaux quand on a pas le tempsErwan Tanguy
 
Creer un site internet sous WordPress
Creer un site internet sous WordPress Creer un site internet sous WordPress
Creer un site internet sous WordPress Erwan Tanguy
 
Organiser une veille digitale
Organiser une veille digitaleOrganiser une veille digitale
Organiser une veille digitaleErwan Tanguy
 
Diigo – social bookmarking
Diigo – social bookmarkingDiigo – social bookmarking
Diigo – social bookmarkingErwan Tanguy
 
Video social marketing et cv - les bases
Video social marketing et cv - les basesVideo social marketing et cv - les bases
Video social marketing et cv - les basesErwan Tanguy
 
Référencement naturel (SEO) - les bases
Référencement naturel (SEO) - les basesRéférencement naturel (SEO) - les bases
Référencement naturel (SEO) - les basesErwan Tanguy
 
Sociallymap didacticiel
Sociallymap   didacticielSociallymap   didacticiel
Sociallymap didacticielErwan Tanguy
 
Animer un site web - web café
Animer un site web - web caféAnimer un site web - web café
Animer un site web - web caféErwan Tanguy
 
Google+ - présentation du média social
Google+ - présentation du média socialGoogle+ - présentation du média social
Google+ - présentation du média socialErwan Tanguy
 

Mehr von Erwan Tanguy (20)

Sendinblue freelance fair tour
Sendinblue freelance fair tourSendinblue freelance fair tour
Sendinblue freelance fair tour
 
Sendinblue : la plateforme française pour l'emailing et la newsletter
Sendinblue : la plateforme française pour l'emailing et la newsletterSendinblue : la plateforme française pour l'emailing et la newsletter
Sendinblue : la plateforme française pour l'emailing et la newsletter
 
Outils collaboratifs en formation
Outils collaboratifs en formationOutils collaboratifs en formation
Outils collaboratifs en formation
 
Automation et réseaux sociaux
Automation et réseaux sociauxAutomation et réseaux sociaux
Automation et réseaux sociaux
 
Meetup cssflip : shapes et clip-path
Meetup cssflip : shapes et clip-pathMeetup cssflip : shapes et clip-path
Meetup cssflip : shapes et clip-path
 
Automation : publier sur les réseaux sociaux quand on a pas le temps
Automation : publier sur les réseaux sociaux quand on a pas le tempsAutomation : publier sur les réseaux sociaux quand on a pas le temps
Automation : publier sur les réseaux sociaux quand on a pas le temps
 
Creer un site internet sous WordPress
Creer un site internet sous WordPress Creer un site internet sous WordPress
Creer un site internet sous WordPress
 
Organiser une veille digitale
Organiser une veille digitaleOrganiser une veille digitale
Organiser une veille digitale
 
Slack
SlackSlack
Slack
 
Wordpress meetup
Wordpress meetupWordpress meetup
Wordpress meetup
 
Diigo – social bookmarking
Diigo – social bookmarkingDiigo – social bookmarking
Diigo – social bookmarking
 
Video social marketing et cv - les bases
Video social marketing et cv - les basesVideo social marketing et cv - les bases
Video social marketing et cv - les bases
 
Référencement naturel (SEO) - les bases
Référencement naturel (SEO) - les basesRéférencement naturel (SEO) - les bases
Référencement naturel (SEO) - les bases
 
Les base du Html5
Les base du Html5Les base du Html5
Les base du Html5
 
Newsletters rwd
Newsletters rwdNewsletters rwd
Newsletters rwd
 
Les bases du CSS3
Les bases du CSS3Les bases du CSS3
Les bases du CSS3
 
Sociallymap didacticiel
Sociallymap   didacticielSociallymap   didacticiel
Sociallymap didacticiel
 
Animer un site web - web café
Animer un site web - web caféAnimer un site web - web café
Animer un site web - web café
 
Twitter
TwitterTwitter
Twitter
 
Google+ - présentation du média social
Google+ - présentation du média socialGoogle+ - présentation du média social
Google+ - présentation du média social
 

Support de formation : Yahoo! pipes les modules

  • 1. Yahoo! Pipes : présentation Erwan Tanguy
  • 2. Présentation Yahoo! Pipes est une plateforme assez novatrice puisqu’elle permet gratuitement de modifier ou de créer des flux de contenus sans programmation. Pourtant, monter des pipes n’est pas si facile dès qu’on veut y ajouter quelques subtilités. Pour nos formations sur Yahoo! Pipes, il est indispensable que les stagiaires est un compte chez Yahoo! Pour pouvoir accéder à la plateforme et créer des pipes. Nous allons voir :  Les modules  Comment créer des filtres  Comment créer des flux à partir d’une page html  Comment créer des requêtes  Comment créer des pipes complexes Sur ce document vous trouverez les détails essentiels sur la plupart des modules de la plateforme Yahoo! Pipes. Source : Yahoo! Pipes de Mark Pruett, ed. O’Reilly
  • 3. Les sources            Find First Site Feed Yahoo! Local Xpath Fetch Page Fetch Feed YQL Item Builder Flickr Fetch CSV Fetch Data RSS Item Builder Feed Auto-Discover
  • 4. Les sources Find First Site Feed Yahoo! Local Ce module est simple. Il permet de récupérer le premier flux déclarer d’un site. Si aucun flux RSS n’est présent, il n’y aura pas de réponse. Ce module est peu utilisable en France. Il permet de créer une carte sur une ville autour d’un thème. (Je n’aborderai pas ce module.)
  • 5. Les sources Xpath Fetch Page Ce module est un des outils les plus puissant de YP. Il va vous permettre de générer un flux sur une page en ciblant une zone précise. Généralement, on ajoute un module Regex ensuite pour déterminer quels seront les contenus Titre, Description, Lien… Ce module nécessite une bonne connaissance du HTML. Syntaxe XPath :  Nodename : (ex : paragraphe ou body) sélectionner tous les nœuds enfants du nœud nommé  / : Sélectionner à partir du nœud racine  // : Sélectionner les nœuds présents dans le document qui correspondent quel que soit leur emplacement à la sélection  . : Sélectionner le nœud courant  .. : Sélectionner le parent du nœud courant  @ : Sélectionner des attributs  //* : Sélectionner tous les éléments  //p : Sélectionner tous les éléments de p  P>* : Sélectionner tous les nœuds enfants de p  //*[@id=’page’] : Sélectionner tous les éléments par id  //*[@title] : Sélectionner les éléments avec attributs source : http://www.stratieo.com/les-modules-de-yahoo-pipesfonctionnalites-niveau-1/
  • 6. Les sources Fetch Feed YQL Ce module est un des plus utilisés. Il permet de récupérer des flux RSS et de les mélanger pour générer en sortie un unique flux. Généralement, on utilise ensuite un filtre pour ne récupérer des flux que les contenus qui nous intéressent. Ce module est assez complexe. Il permet de récupérer des données via une requête en YQL, c’est-àdire une forme de langage très proche du SQL propre à Yahoo!. (Je n’aborderai pas ce module.)
  • 7. Les sources Item Builder Flickr Ce module permet de créer un item avec ses différents champs. Il peut être utile pour reformuler certains flux. Pourrons l’utiliser dans un module Loop par exemple et ainsi créer des modifications en chaine. Ce module permet, avec une clé API à obtenir sur le site de Flickr, de récupérer des images autour d’un mot clé et d’une géolocalisation.
  • 8. Les sources Fetch CSV Fetch Data Ce module permet de récupérer des données à partir d’un fichier CSV en ligne (sur Google Drive par exemple). Ces données pourront être ensuite récupérer en RSS ou en CSV. Ce module permet de récupérer des données à partir d’un fichier RSS ou Atom en. Il faut ensuite indiquer les données à récupérer. Cela ne propose pas comme Fetch Feed un résultat pré organisé.
  • 9. Les sources RSS Item Builder Ce module est assez proche de Item Builder mais orienté RSS. Il va permettre de bien organiser les données pour qu’elles puissent bien être interprétées ensuite. Fetch Auto-Discover Ce module permet de récupérer tous les flux RSS répertoriés sur une page à la différence de Find First Site Feed qui ne prend que le premier. Attention, comme Fetch Data, le résultat n’est pas organisé, il faudra d’autres modules (Loop + Fetch Feed) ensuite pour structurer la version finale de votre pipe.
  • 10. User Inputs Les modules de User inputs permettent de créer des formulaires dans votre pipe, pour ainsi proposer des résultats différents à partir d’un même montage. Les différents modules sont destinés à des formats de données différents :      Date URL Nombre Texte Données de localisation Pour aller au-delà, il vous permettra d’utiliser un pipe modèle à l’intérieur d’un ou plusieurs autres pipes. Le pipe enverra des données via les inputs grâce au module Loop dans le second pipe puis récupèrera les données à exploiter.
  • 11. Operators Count Ce module permet de compter le nombre d’items dans un flux. Renanme Ce module permet de copier ou de renommer des champs dans un item.
  • 12. Operators Create RSS Ce module est assez proche de RSS Item Builder mais ne nécessite pas l’utilisation d’un Loop pour fonctionner. Vous allez pouvoir améliorer les placements des données (des contenus d’un flux RSS mal formé par exemple) dans des champs reconnus.
  • 13. Operators Regex Ce module est très puissant. Il permet de reformer les contenus à partir de formule, de les modifier en les réduisant ou en les augmentant. Il peut mémoriser temporairement des données.
  • 14. Operators Regex Ce module utilise les expressions régulières pour la manipulation. Les expressions régulières sous Yahoo! Pipes demandent un peu de pratique. « [dD]* » indique un contenu a ne pas prendre en compte – il précède ou suit les contenu recherchés. « (.*) » indique un contenu à retenir. Il est possible d’en retenir plusieurs qui pourront se faire appeler ensuite $1, $2, etc. Parfois « (.*) » ne permet pas de récupérer les contenus en raison de saut de ligne par exemple. Il est possible d’utiliser alors « ([^>]*) », de même pour les liens avec « ([^"]*) ». Si vous indiquez ^http://(.*), la valeur $1 sera égale à une url sans http://. + http://www.stratieo.com/les-modules-de-yahoo-pipes-fonctionnalites-niveau-2-3-et-4/yahoo-pipes-regex-2/ Pas simple à utiliser, mais impressionnant quand ça marche ! En complément de Xpath Fetch Page, le résultat sera définit en fonction de sa place dans l’item (${td.0.span.0.a.href} par exemple pour aller chercher un lien dans un élément précis). Voir aussi : http://bibliotheques.wordpress.com/2009/05/13/yahoo-pipes-tutoriel-6-expressions-regulieres/ http://fr.wikipedia.org/wiki/Expression_rationnelle http://www.siteduzero.com/informatique/tutoriels/concevez-votre-site-web-avec-php-et-mysql/les-expressions-regulieres-partie-1-2
  • 15. Operators Regex Voir aussi :  http://bibliotheques.wordpress.com/2009/05/13/yahoo-pipes-tutoriel-6-expressions-regulieres/  http://fr.wikipedia.org/wiki/Expression_rationnelle  http://www.siteduzero.com/informatique/tutoriels/concevez-votre-site-web-avec-php-et-mysql/les-expressionsregulieres-partie-1-2 Source : Yahoo! Pipes de Mark Pruett, ed. O’Reilly
  • 16. Operators Tail & Truncate Split & Union Ces deux modules servent à ne sélectionner qu’une partie des résultats d’un flux ou d’une addition de flux. Tail prend le nombre indiqué en partant du dernier et Truncate à partir du premier. Ces deux modules permettent de séparer (Split) un flux pour en faire différentes choses ensuite ou de réunir des flux ensemble (Union).
  • 17. Operators Sub-element Sort Ce module est utilisé lorsqu’une seule donnée est à garder. Si on choisit « item.title », les résultats n’afficheront plus dans chaque item que le titre dans un élément « content ». Ce module permet de changer l’ordre des items en fonction de leur date par exemple. Deux choix sont possibles : ascending (du plus ancien au plus récent) et descending (inverse).
  • 18. Operators Filter Ce module est très utilisé puisqu’il permet de sélectionner des contenus à garder ou à exclure. Son utilisation n’est pas très complexe mais il peut arriver que ça ne fonctionne pas comme prévu. Options :  Permit/Block : vous choisissez de bloquer ou de permettre  All/Any : Toutes les conditions doivent être présentes (très restrictif) ou seulement une des règles  Contains/Does not contain/Matches regex/is greater than/is/is less than/is after/is before : définit la règle d’un contenu pour un contenant. Matches regex permet d’utiliser des expressions régulières.
  • 19. Operators Loop Ce module est utilisé pour générer à partir d’un flux de données une boucle d’effets. Pratiquement tous les modules peuvent être utilisé dans un loop. Il est même possible, et c’est là-aussi qu’il est puissant, de récupérer un autre pipe avec par exemple des inputs et boucler sur son montage avant de continuer le pipe.
  • 20. Operators Location Extractor Reverse Ce module est utilisé lorsque des données de géolocalisation sont présentes dans les flux. Il les organise alors dans un élément y:location où vous retrouverez les valeurs de latitude, de longitude… Les données de localisation peuvent se trouver dans un fichier CSV par exemple et vous avez besoin de les exporter vers une carte. Ce module d’inverser l’ordre des items, moins précis Sort puisque cela se fait à la voler sans référent autre que l’ordre au départ.
  • 21. Operators Unique Web service Ce module permet d’enlever des doublons. Il est possible de choisir l’élément de référence qui peut être donc un lien, un titre ou une description. Ce module est limité au fait qu’un titre légèrement différent ne sera pas pris en compte. Pour les liens, le problème peut venir des réductions d’URL qui cachent l’URL originale. Ce module permet d’envoyer des données en JSON d’un serveur externe et de l’insérer dans un flux. Il est indispensable de vérifier que le serveur accepte de recevoir des données via HTTP POST. (Je n’aborderai pas ce module.)
  • 22. URL URL Builder Ce module permet de générer des URLs qui peuvent être parfois complexe et intégrer des parties variables avec des inputs. Options :  Base : l’URL principale  Port : si un port est nécessaire (si vous insérer 12, cela affichera http://nomdedomaine.com:12/)  Path elements : correspond aux éventuels dossiers et fichier  Query parameters : pour ajouter des valeurs dans l’URL (pratique pour des moteurs de recherche par exemple)
  • 23. Sting Les modules de String permettent de travailler le contenus des éléments. Certaines particularités sont assez proches du Regex. Généralement, ils sont utilisés dans un Loop ou dans la suite d’un input.  Yahoo! Shortcuts : classifier des mots ou expressions courantes (surtout USA)  String Replace : remplacer des termes par d’autres  String Builder : construire des contenus en les imbriquant  String Tokenizer : sépare des contenus à partir d’un élément récurrent (des virgules, tirets…)  Sub String : couper la longueur d’un élément en nombre de caractères  Term Extractor : extraire d’un élément les thématiques principales (mots clés)  String Regex : sur le principe de Regex  Private String : permet de mettre des données sécurisées
  • 24. Date  Les modules de Date permettent de sur les dates, sur leurs formats.  Data Builder : limiter un flux en fonction de date et de requête (en anglais). L’expression « 2 days ago » enlevera tous les contenus plus vieux de deux jours. Options (exemples) :  Tomorrow, Yesterday, Now  X days ago  As welle as « xx/xx/20xx » and « xx:xx EST »  Jan. 12, 2001  10/21/2012  01 March 13  +5 hours  -10 days Date Formatter : modifier le format de présentation des dates. Options (exemples) :  02-12-2013 : %m-%d-%Y  Tuesday, Feb 12, 13 at 08:45 PM : %A, %b %d, %y at §I:%M %p  02/12/13 : %D  20:45 : %R  February : %B
  • 25. Date Source : Yahoo! Pipes de Mark Pruett, ed. O’Reilly
  • 26. Location & Number Location Builder Simple Math Le module Location Builder permet de générer des données de géolocalisation. Avec ensuite le module Location Extractor il sera possible de générer un élément y:location dans un flux. Le module Simple Math permet de faire des opérations (additions, soustractions, multiplications, divisions, pourcentage…). Peutêtre utilisé avec un module Count par exemple.
  • 27. Et aussi Dans Favorites et My pipes se trouve les pipes qui ont déjà été enregistrés sur un compte. Il est possible de les réutiliser dans un nouveau pipe via un Loop. Le pipe devra comporter des inputs pour que des données puissent y être injectées. Dans Deprecated se trouve des modules anciens qui sont encore fonctionnel mais qui ne sont pas conseillés et risque de ne plus apparaître. Le module Fetch Page, qui a été remplacé par le module Xpath Fetch Page, est utilisé pour scanner des pages HTML et générer un flux RSS. Voir : http://blog.voyelle.me/veille/des-flux-rss-a-une-veille-desurface-5
  • 28. Suivre notre veille      Sur Diigo : https://www.diigo.com/user/erwantanguy/pipes Sur notre blog http://www.digital-strategy.fr/ Retrouver ce document ainsi que d’autres slides sur http://www.slideshare.net/erwantanguy/ http://www.stratieo.com/mot-cle/yahoo-pipes/ Ouvrage : Yahoo! Pipes de Mark Pruett, ed. O’Reilly