Revues et journaux québécois
Faisant partie de la collection numérique de Bibliothèque et Archives nationales du Québec (BAnQ), l’ensemble de Données « Revues et journaux québécois » est particulièrement riche. « Issus des collections patrimoniales de BAnQ, ces revues et journaux témoignent de la vie quotidienne, culturelle, politique, économique et scientifique du Québec » (description prise sur le site du fournisseur de contenu).
Consultez le site du fournisseur de contenu pour plus d’information.
Informations générales
Ajouté aux Données de la recherche : août 2017
Dernière mise à jour : mars 2024
Fréquence de mise à jour : aucune mise à jour n’est planifiée pour le moment
Formats disponibles : JPG, PDF, TXT, TIF, XLS
Disponibilité des fichiers connexes ? non
Disponibilité des métadonnées ? non
Taille des données : 18.4 To
Nombre de fichiers : 4 627 040
Droit d’auteur : les données et toute documentation connexe sont soumises au droit d’auteur. Veuillez consulter le site web du fournisseur de contenu pour plus de détails.
Domaine couvert par les Données : concerne principalement la zone géographique du Québec
Les Données en graphiques
Tout le contenu disponible dans l’ensemble de Données « BAnQ - Revues et journaux québécois » est dans des formats propriétaires. Aucune métadonnée n’est disponible.
Formats de fichiers disponibles dans le sous-ensemble « BAnQ - Revues et journaux québécois »
La structure des Données
Le contenu de l’ensemble de Données de BAnQ n’est pas structuré de manière totalement homogène et fluctue d’un journal à l’autre. Pour un journal ou une revue donnée, il est possible que le contenu change à travers le temps. Bien qu’il puisse varier pour chaque journal ou revue, notez que le contenu de cet ensemble de Données devrait être structuré par journal ou revue, puis par année, mois et numéro. Au niveau du numéro, le contenu peut osciller d’un fichier par numéro à un fichier par page.
Disponibilité des PDF
Certains fichiers sont disponibles dans le format PDF. Les autres fichiers sont des images (majoritairement des .jpg)
Disponibilité du plein texte
Des fichiers au format .TXT, obtenus par reconnaissance optique de caractères (OCR), sont disponibles pour certaines revues et journaux, permettant une recherche en texte intégral.
Il y a un dossier appelé « OCR_corpus_data » dans l’ensemble de données, qui contient les fichiers .tsv avec le texte intégral des documents. Tous les documents n’ont pas un texte intégral correspondant dans les fichiers .tsv.
Voici la structure des fichiers TSV :
Colonne 1 : file - La colonne file contient le chemin du fichier dans l’ensemble de données.
Colonne 2: page - La colonne page contient le numéro de la page du document
Colonne 3 : text - La colonne text contient le texte complet (OCR) de la page
Disponibilité des Métadonnées
Il n’y a pas de métadonnées disponibles dans l’ensemble de Données « BAnQ - Revues et journaux québécois »
Références bibliographiques des articles
Il n’y a pas de références bibliographiques dans l’ensemble de Données « BAnQ - Revues et journaux québécois »