Préambule
Dans le cadre d’un travail de compilation de sources d’information au format RSS et à destination de jeunes adolescents, j’ai été amené à fouiner un peu dans le code source des pages du site web de la radio France-inter et à jouer un peu avec les URL du site.
Premiers constats
Le flux RSS de la page d’accueil n’est pas détecté par le navigateur.
Une recherche dans RSS tracker confirme l’absence de mention à un flux RSS dans le code source de la page.
Après recherche sur la page, on constate qu’un lien « Flux Rss » est proposé dans la section « Abonnez-vous ». En le suivant c’est la déception puisqu’il redirige vers la page d’accueil.
Premier indice
Ce lien inutile est malgré tout source d’espoir puisqu’il nous donne une piste à explorer quant à la structure attendue par le Système de Gestion de Contenu (CMS) de ce site :
https://www.franceinter.fr/rss/a-la-une.xml
En observant les liens vers les catégories du site (info, Politique, Société, etc), on peut supposer qu’en reproduisant la structure ci-dessus, nous obtiendrons le flux de la catégories. Tentons l’expérience avec la catégorie « humour » :
https://www.franceinter.fr/humour devient https://www.franceinter.fr/rss/humour.xml
Il est ainsi possible de générer le flux de toutes les catégories du site en suivant ce même principe, comme par exemple https://www.franceinter.fr/rss/info.xml
Aller plus loin avec les thèmes
Pour ma part, cette étape n’était toujours pas satisfaisante puisque mon objectif initial consistait à cibler une thématique précise concernant les jeunes : la littérature jeunesse
https://www.franceinter.fr/theme/litterature-jeunesse
Qu’à cela ne tienne, tentons notre chance avec les thématiques. En reproduisant le principe précédent adapté à ce nouveau type d’URL, on obtient également le flux RSS de la thématique désirée :
https://www.franceinter.fr/rss/theme/litterature-jeunesse.xml
Aller encore plus loin avec les dossiers
En observant les liens affichés sous les réponses proposées lors d’une recherche sur le site, on constate 3 structures d’URL :
- les catégories principales du site de type : https://www.franceinter.fr/monde
- les thèmes du site du type : https://www.franceinter.fr/theme/litterature-jeunesse
- les dossiers du site du type : https://www.franceinter.fr/dossier/guerre-en-syrie
Pour ce dernier type, on pourra également reproduire la structure en construisant l’URL selon le principe dégagé dans cet article : https://www.franceinter.fr/rss/dossier/guerre-en-syrie.xml