L’année 2021 s’est terminée récemment et c’est le moment pour le bilan des nouveautés dans la plateforme TAMIS. Cette année a été marquée par le souhait de sortir des sentiers battus de l’utilisation des métadonnées descriptives de livres.
Ce souhait s’est exprimé sur deux axes de développement. Le premier consiste à aller encore plus loin dans l’exploration des données générées par les intelligences artificielles de TAMIS. Le deuxième porte quant à lui sur la création d’outils concrets qui vont permettre aux livres d’être plus présents et découvrables dans le web de façon de générale, et pas seulement dans les canaux traditionnels.
Au menu (et en résumé si vous n’avez pas le temps de lire le reste!) :
- l’exploration des entités présentes dans les livres ;
- les liens entre les livres et Wikidata ;
- un outil pour générer des données structurées utilisant le vocabulaire Schema.org, au format JSON-LD ;
- des partenariats pour améliorer la visibilité des livres présents dans TAMIS avec l’Institut canadien de Québec et la coopérative des Librairies indépendantes du Québec.
Explorer grâce aux entités
Nous avons abordé le concept des entités en juin dernier. Pour rappel, une entité est une référence explicite, dans un texte, à un concept ou une chose. Par exemple, dans le passage « Voir Montmartre peut être considéré comme de la chance. Pas pour moi, car je suis né à Paris » (tiré de Confidences à l’aveugle de Alain Raimbault, aux Éditions Hurtubise), « Montmartre », « chance » et « Paris » sont des entités.
Lorsqu’elles sont bien identifiées, les entités sont utiles, parce qu’elles permettent de faire des liens.
D’abord, des liens entre les oeuvres, par exemple en trouvant qu’un personnage d’un autre bouquin, complètement distinct du premier, semble répondre au passage cité précédemment : « As-tu vu ça, Paul ? C’est ben beau Montmartre… » (Les héritiers du fleuve, tome 4, de Louise-Tremblay d’Essiambre, chez Saint-Jean Éditeur).
Mais également, des liens entre une oeuvre et le web (plus de détails un peu plus bas !).
TAMIS offre donc désormais plusieurs outils associés aux entités.
Dans la page d’un texte, des boutons permettent d’accéder à des écrans affichant les entités identifiées, à la section « Entités».
Le premier bouton permet d’accéder à une page qui contient l’ensemble des entités mentionnées dans un texte:

La liste est énorme! Elle présente en effet l’exhaustivité des entités mentionnées dans le texte. Le deuxième bouton de la page des textes, nommé «Les essentiels», permet quant à lui d’accéder à une liste des entités les plus fréquemment mentionnées, et regroupées selon qu’il s’agisse d’un lieu, d’une personne, ou d’autre chose.

Ces deux listes demandent quelques secondes d’affichages… vous constaterez qu’il y a plusieurs entités dans un livre !
Dans les deux cas, un clic sur l’icône de l’étiquette permet d’arriver à une page qui donne de l’information sur l’entité en question, dans le contexte d’un livre, notamment des extraits du texte qui la mentionnent :

Cette page contient également un lien vers l’entrée correspondant à l’entité dans Wikipédia et Wikidata, et des boutons qui permettent d’indiquer si l’entité en question représente le sujet principal du texte, un sujet d’intérêt (ou un sujet rejeté, parce qu’il n’est pas pertinent ou qu’il s’agit d’une erreur d’identification de l’IA).
Un lien permet de naviguer pour voir les autres livres mentionnant l’entité :

Un outil de navigation et de recherche est également disponible dans le menu de gauche. Il permet de faire des recherches par nom d’entité, ou de lister toutes les entités associées à une catégorie en particulier:

Et les autres entités associées aux oeuvres ?
Au-delà du contenu du texte, d’autres entités très importantes sont associées à une oeuvre, notamment l’auteur ou l’autrice, les autres personnes ayant contribué (pour la traduction, les illustrations, la préface…), le lieu de publication, les éditions et leurs ISBN, la maison d’édition…
TAMIS contient désormais, dans la page d’un texte, des sections qui présentent les contributeurs, ou les éditions. Dans la page dédiée à chacune de ces entrées, par exemple un auteur, on peut même créer un lien vers l’entrée correspondante dans Wikidata sans avoir à quitter TAMIS, par une simple recherche, comme illustrée dans la courte vidéo suivante :
Des outils pour exploiter les liens et rendre les livres plus découvrables
Au-delà de l’aspect ludique d’explorer les oeuvres à travers les entités qui y sont mentionnées (et croyez-nous, c’est vraiment fascinant !), à quoi cela sert-il d’identifier les entités importantes d’un texte ? La réponse est dans les liens que cela permet de créer entre une oeuvre et le reste du web.
Le web est organisé autour des liens entre les pages, les sites web, les personnes, et de plus en plus, entre les entités. Les moteurs de recherche, notamment Google, s’intéressent de plus en plus à identifier les entités qui font partie des requêtes des utilisateurs. Et la présence de liens entre des pages est un signal important pour leur référencement.
Utiliser le nom des entités à la façon de mots-clés, dans des descriptifs de livres à travers les métadonnées traditionnelles, c’est bien.
Exploiter les liens entre le livre et des entités existantes sur le web, c’est mieux !
Il y a plusieurs stratégies pour le web. Deux d’entre elles ont été ajoutées dans TAMIS au cours des derniers mois :
- les données structurées pour Google et les autres moteurs de recherche ;
- la création de références dans Wikidata.
Les données structurées pour Google et les autres moteurs de recherche
TAMIS permet de générer une description d’un livre au format JSON-LD, en utilisant le vocabulaire Schema.org. Il vous suffit d’utiliser le bouton « Schema.org » de la boîte d’outils « Connexions » de la page d’un texte pour obtenir le résultat suivant:

Pour simplifier, on peut dire que JSON-LD et Schema.org sont au web ce qu’ONIX est à la chaîne de valeur du livre ou MARC aux bibliothèques : c’est un standard technique pour décrire les livres.
Le code au format JSON-LD peut par exemple être intégré dans une page web qui décrit le livre pour faciliter la compréhension, par un moteur de recherche, des données relatives à ce livre. Par ailleurs, le code généré contient des références aux entités préalablement sélectionnées comme sujet principal ou d’intérêt pour un texte, de façon à rendre explicites les liens entre l’oeuvre et ces entités aux yeux du moteur de recherche. Il contient également différentes informations tirées du fichier ONIX original, comme les mots-clés, les catégories BISAC, etc.
💡 Vous souhaitez intégrer des données structurées à votre site web ? Les modèles générés par TAMIS ne seront probablement pas suffisants pour que votre intégrateur web le fasse. Contactez-nous pour avoir quelques conseils (ou un coup de main) avant d’ouvrir ce chantier !
La création de références dans Wikidata
TAMIS dispose désormais d’outils qui permettent de déposer des données dans Wikidata. Ainsi, pour chaque livre, une page permet de réviser les liens entre les données disponibles dans TAMIS, et les entités existantes (ou pas dans Wikidata). Cet outil s’appuie sur les propriétés et le modèle proposés par le Wikiprojet Livres, qui distingue les informations sur l’oeuvre, et celles sur ses éditions.

L’outil très simple permet de réviser et confirmer la correspondance entre les données dans TAMIS, et des items dans Wikidata. Un simple clic va créer de nouveaux items dans Wikidata, noter leurs références dans TAMIS (pour faciliter d’éventuelles mises à jour), ou mettre à jour des items existants en ajoutant des propriétés supplémentaires.
TAMIS tire évidemment profit de sa connaissance du contenu des livres pour enrichir les fiches Wikidata de propriétés comme le lieu de l’action (P840), les personnages (P674) et les sujets principaux (P921).
À noter, TAMIS ne dépose aucune donnée sans qu’un opérateur humain ne les ait révisées, et se soit assuré que l’opération ne créera pas de conflits ou de doublons dans Wikidata.
💡 Le dépôt de données sur Wikidata demande la configuration d’un compte ayant accès en écriture, par API, sans blocage d’adresses IP, à Wikidata (typiquement un compte de «bot»). TAMIS ne dispose pas d’un tel compte qui puisse être utilisé par tous. Veuillez nous contacter pour configurer votre compte de «bot» dans TAMIS.
Quoi d’autre ?
La dernière année a également été l’occasion de faire en sorte que TAMIS fonctionne en anglais. En plus de la (relativement) simple opération de traduire l’interface, la complexité était évidemment associée au besoin de traiter du contenu dans une autre langue, et donc de s’assurer que les outils de traitement du langage naturel fonctionnent en anglais. C’est désormais le cas pour tous les outils, à l’exception de l’outil de suggestion de codes BISAC.
Pour la prochaine année, nous espérons voir un déploiement à plus grande échelle des nouveaux outils présentés précédemment. Nous travaillons depuis plusieurs mois avec deux partenaires qui contribuent à la découverte et de visibilité des livres, et qui le feront de façon innovante à partir des données disponibles dans TAMIS. En effet, l’Institut canadien de Québec (Maison de la littérature, festival Québec en toutes lettres) et la coopérative des Librairies indépendantes du Québec (leslibraires.ca, quialu.ca et revue Les libraires), utiliseront les données de TAMIS dans leurs activités respectives de mise en valeur des livres et de la littérature.
C’est d’ailleurs les partenariats avec ces deux organisations qui ont rendu possibles certaines des améliorations présentées précédemment. Nous en profitons également pour souligner les contributions du Conseil des arts du Canada, partenaire de la coopérative des Librairies indépendantes du Québec, et le Conseil des arts et des lettres du Québec, partenaire de l’Institut canadien de Québec.
À retenir…
Si vous êtes un éditeur qui utilise déjà TAMIS, nous vous donnerons plus de détails bientôt. Vous pourrez évidemment décider si vous souhaitez ou pas que vos livres puissent être inclus dans ces projets ! N’hésitez pas à nous contacter dès maintenant si vous souhaitez manifester votre intérêt plus rapidement ou si vous avez des questions. Vous pouvez également ouvrir la discussion avec votre contact à la coopérative des Librairies indépendantes du Québec.
Si vous êtes un éditeur qui n’utilise pas déjà TAMIS et qui voulez en savoir plus, ou éventuellement vous joindre à ces projets, n’hésitez-pas à nous contacter !