Arnaud Laborderie

Item

Title
Arnaud Laborderie
Prénom
Arnaud
Nom
Laborderie
URL cv en ligne
https://www.univ-paris8.fr/
A comme laboratoire
Laboratoire Paragraphe

Linked resources

Items with "Is Referenced By: Arnaud Laborderie"
Title Class
Analyse des traces d'usage de Gallica : Une étude à partir des logs de connexion au site Gallica Report
BnF DataLab Website
Catalogue collectif de France (ccfr) Website
Dumps de data.bnf.fr Webpage
Éditeur SPARQL data.bnf Webpage
Foucault fiches de lecture (FFL+) Webpage
Gallica Website
Gallicagram Website
Items with "Est cité par: Arnaud Laborderie"
Title Class
« Cette grande diversité de collections et de données pose un certain nombre de problématiques qui sont donc liées précisément à cette diversité des formats de description et donc on a trois formats principaux pour les données de la BnF : le format Intermarc, qui est celui du catalogue général, le format EAD, qui est un format de description des archives, archivistique, qui n'est pas sur les mêmes modalités, et puis on a le Dublin Core, qui est le format simplifié, qui est un langage du web sémantique, utilisé par Gallica, qui permet justement d'articuler les deux autres formats, mais qui du coup est un format qui est, on va dire, simplifié, appauvri. Dans l'Intermarc, on a à peu près une centaine de champs différents pour décrire les collections, alors que dans le Dublin Core on a que quinze champs, et donc vous voyez l'appauvrissement des données, et ça pose des difficultés pour la constitution de corpus puisqu'on ne va pas pouvoir aller aussi finement dans Gallica, pouvoir constituer des ensembles. Et pour les chercheurs, ça pose des problématiques donc d'appropriation de ces formats, qui sont des formats professionnels, des bibliothèques et des archives, et puis des problématiques de conversion de ces formats. » author self citation
« Depuis cette année nous avons une exception dans le droit français qui permet de faire de la fouille de données, l'exception TDM, et donc qui permet aux chercheurs de constituer des corpus sous droit et de faire de la fouille du données sur ces corpus sous droit sans demander l'autorisation aux ayants droits et sans que les ayants droits puissent les opposer. Et donc ça ouvre évidemment pour le Data Lab et pour les études de recherche beaucoup de perspectives. La loi permet aussi la conservation des corpus acquis, ce qui permet donc de pouvoir rejouer les corpus, ce qui répond à la nécessité de pouvoir vérifier et éventuellement falsifier les résultats de recherche. » author self citation
« L'une des problématiques, c'est comment est-ce qu'on va rendre accessible aux chercheurs cette masse documentaire considérable, et quels outils on va mettre en place pour accompagner les nouveaux usages de la recherche, notamment pour la création de corpus numériques, pour faire par exemple, et j'y reviendrai, de l'extraction de contenu, de la fouille de textes, de l'analyse d'image, des analyses statistiques... Ce sont les nouveaux usages que permet justement la masse, le fait qu'on atteint une masse critique depuis quelques années déjà et que les chercheurs peuvent s'emparer de ces collections pour travailler sur des corpus massifs. » author self citation
Items with "Conférencier: Arnaud Laborderie"
Title Class
Accès, exploitation et réutilisation des données patrimoniales de la BNF Conference

Annotations

There are no annotations for this resource.