« Cette grande diversité de collections et de données pose un certain nombre de problématiques qui sont donc liées précisément à cette diversité des formats de description et donc on a trois formats principaux pour les données de la BnF : le format Intermarc, qui est celui du catalogue général, le format EAD, qui est un format de description des archives, archivistique, qui n'est pas sur les mêmes modalités, et puis on a le Dublin Core, qui est le format simplifié, qui est un langage du web sémantique, utilisé par Gallica, qui permet justement d'articuler les deux autres formats, mais qui du coup est un format qui est, on va dire, simplifié, appauvri. Dans l'Intermarc, on a à peu près une centaine de champs différents pour décrire les collections, alors que dans le Dublin Core on a que quinze champs, et donc vous voyez l'appauvrissement des données, et ça pose des difficultés pour la constitution de corpus puisqu'on ne va pas pouvoir aller aussi finement dans Gallica, pouvoir constituer des ensembles. Et pour les chercheurs, ça pose des problématiques donc d'appropriation de ces formats, qui sont des formats professionnels, des bibliothèques et des archives, et puis des problématiques de conversion de ces formats. »

Item

Citations
« Cette grande diversité de collections et de données pose un certain nombre de problématiques qui sont donc liées précisément à cette diversité des formats de description et donc on a trois formats principaux pour les données de la BnF : le format Intermarc, qui est celui du catalogue général, le format EAD, qui est un format de description des archives, archivistique, qui n'est pas sur les mêmes modalités, et puis on a le Dublin Core, qui est le format simplifié, qui est un langage du web sémantique, utilisé par Gallica, qui permet justement d'articuler les deux autres formats, mais qui du coup est un format qui est, on va dire, simplifié, appauvri. Dans l'Intermarc, on a à peu près une centaine de champs différents pour décrire les collections, alors que dans le Dublin Core on a que quinze champs, et donc vous voyez l'appauvrissement des données, et ça pose des difficultés pour la constitution de corpus puisqu'on ne va pas pouvoir aller aussi finement dans Gallica, pouvoir constituer des ensembles. Et pour les chercheurs, ça pose des problématiques donc d'appropriation de ces formats, qui sont des formats professionnels, des bibliothèques et des archives, et puis des problématiques de conversion de ces formats. »
Est cité par
Arnaud Laborderie
startTime
642
endTime
725
datasetTimeInterval
21 October 2022 – 21 October 2022

Linked resources

Items with "Citation tirée de la conférence: « Cette grande diversité de collections et de données pose un certain nombre de problématiques qui sont donc liées précisément à cette diversité des formats de description et donc on a trois formats principaux pour les données de la BnF : le format Intermarc, qui est celui du catalogue général, le format EAD, qui est un format de description des archives, archivistique, qui n'est pas sur les mêmes modalités, et puis on a le Dublin Core, qui est le format simplifié, qui est un langage du web sémantique, utilisé par Gallica, qui permet justement d'articuler les deux autres formats, mais qui du coup est un format qui est, on va dire, simplifié, appauvri. Dans l'Intermarc, on a à peu près une centaine de champs différents pour décrire les collections, alors que dans le Dublin Core on a que quinze champs, et donc vous voyez l'appauvrissement des données, et ça pose des difficultés pour la constitution de corpus puisqu'on ne va pas pouvoir aller aussi finement dans Gallica, pouvoir constituer des ensembles. Et pour les chercheurs, ça pose des problématiques donc d'appropriation de ces formats, qui sont des formats professionnels, des bibliothèques et des archives, et puis des problématiques de conversion de ces formats. »"
Title Class
Accès, exploitation et réutilisation des données patrimoniales de la BNF Conference

Annotations

There are no annotations for this resource.