Subject: Computer and Information Science
Data Type: Dataset
Data Type: Text
Language: French
Author Name: Teisseire, Maguelonne
1 to 3 of 3 Results
3 sept. 2021
Deléglise, Hugo; Schaeffer, Camille; Maître d'Hôtel, Elodie; Bégué, Agnès; Roche, Mathieu; Interdonato, Roberto; Teisseire, Maguelonne, 2021, "Corpus de journaux burkinabés en français sur la sécurité alimentaire publiés entre 2009 et 2018", https://doi.org/10.18167/DVN1/IVVEQL, CIRAD Dataverse, V1
Ce corpus de journaux en français est constitué de 22856 articles issus des journaux burkinabés "Le Faso" et "Burkina 24", publiés entre 2009 et 2018. Plusieurs infos sur ces articles sont données: l'année (ANNEE); la similarité Word2vec avec un lexique de sécurité alimentaire (S... |
6 nov. 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "Dic-ES : Liste d'entités spatiales en français", https://doi.org/10.18167/DVN1/LPY080, CIRAD Dataverse, V1
Le dictionnaire "dic-ES" est un ensemble de noms de lieux à partir des listes fournies par (1) la métropole de Montpellier (rues, quartiers, etc.) ; (2) la métropole européenne de Lille ; (3) les noms de pays et les capitales de chaque pays. Le dictionnaire contient également une... |
8 sept. 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "A corpus of 1000 authentic SMS in French with spatial labels", https://doi.org/10.18167/DVN1/0ZGJRC, CIRAD Dataverse, V2
Extract of 1000 authentic French SMS from a corpus of more than 88000 SMS (http://88milsms.huma-num.fr/). Spatial entities are tagged (with label). First, an automatic labelling approach based on text-mining techniques is applied in order to obtain the first corpus ("corpus1_auto... |