Portage index vers XML et JSON

4.6/5 - (5 votes)

Portage des index vers des fichiers à données structurées XML et JSON

Conscients que cela était nécessaire nous venons de porter nos différents index : l’index principal (le plus consulté), celui des « Opéras », celui des « incompatibilités potentielles avec les platines platines Panasonic » et celui des titres « Criterion » vers deux types de fichiers : XML et JSON

MAJ du 30/05/23 : tous les EAN/UPC présents ont été importés + ajout d’une notice.

 

XML-JSON

XML ? JSON ? C’est vous qui voyez !

XML (Extensible Markup Language) ou JSON (javaScript Object Notation, prononcer « Jason » à l’anglaise) ? Les deux sont utilisés pour transmettre et représenter des données structurées, tout dépend de l’utilisation qu’on veut en faire. Ils peuvent être « parsés », c’est à dire parcourus pour en extraire des données,  JSON étant, à priori, plus facile à parser (à l’aide d’un parser/parseur : une fonction, un applicatif etc…)

Structure des fichiers :

L’exemple concerne les deux premiers titres de l’index principal, la représentation, ou l’affichage des données « structurées » se fait très bien avec Mozilla Firefox (il est possible également d’afficher les données brutes du fichier JSON) :

La structure respecte la chaîne de traçabilité des titres (employée sur le forum dans le titre des thread : « Titre »+[Editeur,Presseur]+[Mould]+[Capacité:Volume]+année+[EAN/UPC] ). Ont été ajoutés: un « ID » ainsi que la « provenance ».

Les liens vers ces fichiers se trouvent dans le menu « INDEX » du blog, puis les sous menus correspondants « XML » et « JSON »

 

Importation dans un tableur

En tous les cas si vous souhaitez importer de manière simple nos index dans un tableur il faut utiliser les URL des fichiers  ou les fichiers XML correspondants.

À noter : qu’en ce qui concerne les EAN-UPC, il y a un problème technique car à l’importation les tableurs détectent ceux-ci comme étant des grands nombres, et occasionnent donc une perte d’information : si un UPC commence par exemple par « 0 », celui-ci est supprimé, car il est considéré comme étant un « 0 non significatif » (ex: 01=1), de plus ces codes-barres sont convertis en notation scientifique ! Même si on redéfini le format des cellules en ‘TEXTE’  pour la colonne « EAN-UPC » on ne récupérera jamais les « 0 » manquants, quant à la notation scientifique elle s’annule et on peut récupérer tous les chiffres ‘dissimulés’ dans l’exposant. Normalement ces « EAN-UPC » devraient être traités comme du texte. Pour le moment les « EAN-UPC » prennent la valeur « 0 ».

 

Dans l’avenir

Nous avons créé une base de données SQL,  et devrait être développée par la suite une API (une interface logicielle mettant en relation deux entités) permettant d’interroger cette base de données afin de pouvoir afficher et partager les résultats retournés. Les fichiers XML, JSON sont les prémices de ce projet, cela dépendra également des quotas (en terme de requêtes) imposés par notre hébergeur.

 

Une petite ‘discordance’

Il y a une différence de +1 titre entre les fichiers XML,JSON et l’index, cela vient du titre « Exodus Gods and Kings » où, apparemment, après relecture, le BD 3D en plus du  BD standard pourrait être potentiellement problématique, ainsi 1 ligne a été ajoutée pour les différencier.

 

Bien évidemment ces fichiers seront mis à jour au gré des corrections (si elles sont nécessaires) et des indexations.

Partager

Bluraydefectueux (Xavier L.)

Passionné de cinéma, home-cinema, et amoureux du support physique de la belle image et du beau son, depuis de nombreuses années, C'est naturellement avec passion et conviction qu'il s'est lancé dans ce projet. Bluraydefectueux.com (BRDEF)

2 réflexions sur “Portage index vers XML et JSON

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *