1 to 10 of 26 Results
Sep 8, 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "A corpus of 1000 authentic SMS in French with spatial labels", doi:10.18167/DVN1/0ZGJRC, CIRAD Dataverse, V2
Extract of 1000 authentic French SMS from a corpus of more than 88000 SMS (http://88milsms.huma-num.fr/). Spatial entities are tagged (with label). First, an automatic labelling approach based on text-mining techniques is applied in order to obtain the first corpus ("corpus1_auto... |
Dec 20, 2018
Jacques Fize, 2018, "BVLAC corpus - Extracted Data", doi:10.18167/DVN1/8LIG1D, CIRAD Dataverse, V1
[FR] Dans le cadre du projet SONGES sur la mise en correspondance de données textuelles massives et hétérogènes, nous élaborons des modèles de représentation de données ainsi que des mesures de similarité à partir d’indicateurs trouvés dans les textes (thématiques, spatiaux et te... |
Aug 21, 2018
Bonin, Muriel; Roche, Mathieu, 2018, "Corpus 'Controverses sur l’épandage aérien en Guadeloupe'", doi:10.18167/DVN1/LSGN42, CIRAD Dataverse, V1
THEME : Controverses concernant des traitements aériens contre la cercosporiose des bananiers (car contestation citoyenne et succession d’interdiction/dérogation fruit d’un rapport de force entre société civile et producteurs de banane) en Guadeloupe. CORPUS : Corpus en français... |
Sep 29, 2018
Coste, Caroline; Roche, Mathieu; Falala, Sylvain; Touré, Ibra; Bonnet, Pascal, 2018, "Corpus en anglais sur la Mobilité", doi:10.18167/DVN1/GGBWWL, CIRAD Dataverse, V1
Les questions liées à « mobilité » confèrent un caractère clairement pluridisciplinaire en Sciences Sociales (migrations, démographie, etc.) mais également dans d’autres domaines comme la Santé (par exemple, risques en épidémiologie) ou en Agriculture (par exemple, études liées à... |
Dec 22, 2017
Roche, Mathieu; Bonin, Muriel, 2017, "CRESI BigDataPol - Terrain Guadeloupe : Comparaison des termes extraits", doi:10.18167/DVN1/YMCUEY, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
Jan 16, 2018
Bonin, Muriel; Roche, Mathieu, 2018, "CRESI BigDataPol - Terrain Guadeloupe : Corpus", doi:10.18167/DVN1/W5U3I0, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
Jan 16, 2018
Roche, Mathieu; Bonin, Muriel, 2018, "CRESI BigDataPol - Terrain Guadeloupe : Termes extraits automatiquement", doi:10.18167/DVN1/0SD5SL, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
Nov 6, 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "Dic-ES : Liste d'entités spatiales en français", doi:10.18167/DVN1/LPY080, CIRAD Dataverse, V1
Le dictionnaire "dic-ES" est un ensemble de noms de lieux à partir des listes fournies par (1) la métropole de Montpellier (rues, quartiers, etc.) ; (2) la métropole européenne de Lille ; (3) les noms de pays et les capitales de chaque pays. Le dictionnaire contient également une... |
Dec 14, 2018
Fize, Jacques, 2018, "Données pour l'évaluation de méthodes de géocodage", doi:10.18167/DVN1/KH7YTO, CIRAD Dataverse, V1
[FR] Ce jeu de données contient les toponymes de différents documents et leur référence dans le gazetier Geodict (http://dx.doi.org/10.18167/DVN1/MWQQOQ). Les documents utilisés proviennent de deux sources de texte : PadiWeb et AgroMada. [EN] This dataset contains the toponyms of... |
Mar 6, 2018
Fize, Jacques; Gaurav, Shrivastava, 2017, "Geodict: an integrated gazetteer", doi:10.18167/DVN1/MWQQOQ, CIRAD Dataverse, V3
[EN] Geodict is a gazetteer where 12 millions spatial entities are referenced. Each entry is associated with basic yet detailed information such as multi-lingual labels, polygon of boundaries, coordinates, class, etc. Geodict data are extracted from famous dataset: Geonames, Wiki... |