Revues et journaux québécois

Faisant partie de la collection numérique de Bibliothèque et Archives nationales du Québec (BAnQ), l’ensemble de Données « Revues et journaux québécois » est particulièrement riche. « Issus des collections patrimoniales de BAnQ, ces revues et journaux témoignent de la vie quotidienne, culturelle, politique, économique et scientifique du Québec » (description prise sur le site du fournisseur de contenu).

Consultez le site du fournisseur de contenu pour plus d’information.

Informations générales

Ajouté aux Données de la recherche : août 2017

Dernière mise à jour : mars 2024

Fréquence de mise à jour : aucune mise à jour n’est planifiée pour le moment

Formats disponibles : JPG, PDF, TXT, TIF, XLS

Disponibilité des fichiers connexes ? non

Disponibilité des métadonnées ? non

Taille des données : 18.4 To

Nombre de fichiers : 4 627 040

Droit d’auteur : les données et toute documentation connexe sont soumises au droit d’auteur. Veuillez consulter le site web du fournisseur de contenu pour plus de détails.

Domaine couvert par les Données : concerne principalement la zone géographique du Québec

Les Données en graphiques

../_images/overview_banq.png

Tout le contenu disponible dans l’ensemble de Données « BAnQ - Revues et journaux québécois » est dans des formats propriétaires. Aucune métadonnée n’est disponible.

Formats de fichiers disponibles dans le sous-ensemble « BAnQ - Revues et journaux québécois »

../_images/document_type_banq.png

La structure des Données

Le contenu de l’ensemble de Données de BAnQ n’est pas structuré de manière totalement homogène et fluctue d’un journal à l’autre. Pour un journal ou une revue donnée, il est possible que le contenu change à travers le temps. Bien qu’il puisse varier pour chaque journal ou revue, notez que le contenu de cet ensemble de Données devrait être structuré par journal ou revue, puis par année, mois et numéro. Au niveau du numéro, le contenu peut osciller d’un fichier par numéro à un fichier par page.

Disponibilité des PDF

Certains fichiers sont disponibles dans le format PDF. Les autres fichiers sont des images (majoritairement des .jpg)

Disponibilité du plein texte

Des fichiers au format .TXT, obtenus par reconnaissance optique de caractères (OCR), sont disponibles pour certaines revues et journaux, permettant une recherche en texte intégral.

Il y a un dossier appelé « OCR_corpus_data » dans l’ensemble de données, qui contient les fichiers .tsv avec le texte intégral des documents. Tous les documents n’ont pas un texte intégral correspondant dans les fichiers .tsv.

Voici la structure des fichiers TSV :

  • Colonne 1 : file - La colonne file contient le chemin du fichier dans l’ensemble de données.

  • Colonne 2: page - La colonne page contient le numéro de la page du document

  • Colonne 3 : text - La colonne text contient le texte complet (OCR) de la page

Disponibilité des Métadonnées

Il n’y a pas de métadonnées disponibles dans l’ensemble de Données « BAnQ - Revues et journaux québécois »

Références bibliographiques des articles

Il n’y a pas de références bibliographiques dans l’ensemble de Données « BAnQ - Revues et journaux québécois »