Portage index vers XML et JSON
Portage des index vers des fichiers à données structurées XML et JSON
Conscients que cela était nécessaire nous venons de porter nos différents index : l’index principal (le plus consulté), celui des « Opéras », celui des « incompatibilités potentielles avec les platines platines Panasonic » et celui des titres « Criterion » vers deux types de fichiers : XML et JSON
MAJ du 30/05/23 : tous les EAN/UPC présents ont été importés + ajout d’une notice.
XML-JSON
XML ? JSON ? C’est vous qui voyez !
XML (Extensible Markup Language) ou JSON (javaScript Object Notation, prononcer « Jason » à l’anglaise) ? Les deux sont utilisés pour transmettre et représenter des données structurées, tout dépend de l’utilisation qu’on veut en faire. Ils peuvent être « parsés », c’est à dire parcourus pour en extraire des données, JSON étant, à priori, plus facile à parser (à l’aide d’un parser/parseur : une fonction, un applicatif etc…)
Structure des fichiers :
L’exemple concerne les deux premiers titres de l’index principal, la représentation, ou l’affichage des données « structurées » se fait très bien avec Mozilla Firefox (il est possible également d’afficher les données brutes du fichier JSON) :
La structure respecte la chaîne de traçabilité des titres (employée sur le forum dans le titre des thread : « Titre »+[Editeur,Presseur]+[Mould]+[Capacité:Volume]+année+[EAN/UPC] ). Ont été ajoutés: un « ID » ainsi que la « provenance ».
Les liens vers ces fichiers se trouvent dans le menu « INDEX » du blog, puis les sous menus correspondants « XML » et « JSON »
Importation dans un tableur
En tous les cas si vous souhaitez importer de manière simple nos index dans un tableur il faut utiliser les URL des fichiers ou les fichiers XML correspondants.
À noter : qu’en ce qui concerne les EAN-UPC, il y a un problème technique car à l’importation les tableurs détectent ceux-ci comme étant des grands nombres, et occasionnent donc une perte d’information : si un UPC commence par exemple par « 0 », celui-ci est supprimé, car il est considéré comme étant un « 0 non significatif » (ex: 01=1), de plus ces codes-barres sont convertis en notation scientifique ! Même si on redéfini le format des cellules en ‘TEXTE’ pour la colonne « EAN-UPC » on ne récupérera jamais les « 0 » manquants, quant à la notation scientifique elle s’annule et on peut récupérer tous les chiffres ‘dissimulés’ dans l’exposant. Normalement ces « EAN-UPC » devraient être traités comme du texte. Pour le moment les « EAN-UPC » prennent la valeur « 0 ».
Dans l’avenir
Nous avons créé une base de données SQL, et devrait être développée par la suite une API (une interface logicielle mettant en relation deux entités) permettant d’interroger cette base de données afin de pouvoir afficher et partager les résultats retournés. Les fichiers XML, JSON sont les prémices de ce projet, cela dépendra également des quotas (en terme de requêtes) imposés par notre hébergeur.
Une petite ‘discordance’
Il y a une différence de +1 titre entre les fichiers XML,JSON et l’index, cela vient du titre « Exodus Gods and Kings » où, apparemment, après relecture, le BD 3D en plus du BD standard pourrait être potentiellement problématique, ainsi 1 ligne a été ajoutée pour les différencier.
Ping : Retour des statistiques - BLURAYDEFECTUEUX.COM
Ping : Exploitation fichier XML, recherche à l'aide des codes-barres - BLURAYDEFECTUEUX.COM