1 to 9 of 9 Results
3 sept. 2021
Deléglise, Hugo; Schaeffer, Camille; Maître d'Hôtel, Elodie; Bégué, Agnès; Roche, Mathieu; Interdonato, Roberto; Teisseire, Maguelonne, 2021, "Corpus de journaux burkinabés en français sur la sécurité alimentaire publiés entre 2009 et 2018", https://doi.org/10.18167/DVN1/IVVEQL, CIRAD Dataverse, V1
Ce corpus de journaux en français est constitué de 22856 articles issus des journaux burkinabés "Le Faso" et "Burkina 24", publiés entre 2009 et 2018. Plusieurs infos sur ces articles sont données: l'année (ANNEE); la similarité Word2vec avec un lexique de sécurité alimentaire (S... |
21 déc. 2020
Roche, Mathieu, 2020, "COVID-19 and media dataset: Mining textual data according periods and countries (UK, Spain, France)", https://doi.org/10.18167/DVN1/ZUA8MF, CIRAD Dataverse, V2
These datasets contain a set of news articles in English, French and Spanish extracted from Medisys (i‧e. advanced search) according the following criteria: (1) Keywords (at least): COVID-19, ncov2019, cov2019, coronavirus; (2) Keywords (all words): masque (French), mask (English... |
21 août 2018
Bonin, Muriel; Roche, Mathieu, 2018, "Corpus 'Controverses sur l’épandage aérien en Guadeloupe'", https://doi.org/10.18167/DVN1/LSGN42, CIRAD Dataverse, V1
THEME : Controverses concernant des traitements aériens contre la cercosporiose des bananiers (car contestation citoyenne et succession d’interdiction/dérogation fruit d’un rapport de force entre société civile et producteurs de banane) en Guadeloupe. CORPUS : Corpus en français... |
21 août 2018
Roche, Mathieu; Bonin, Muriel, 2018, "Termes "Controverses et épandage aérien en Guadeloupe"", https://doi.org/10.18167/DVN1/37ENLP, CIRAD Dataverse, V1
THEME : Controverses concernant des traitements aériens contre la cercosporiose des bananiers (car contestation citoyenne et succession d’interdiction/dérogation fruit d’un rapport de force entre société civile et producteurs de banane) en Guadeloupe. TERMES EXTRAITS : Termes aut... |
16 janv. 2018
Bonin, Muriel; Roche, Mathieu, 2018, "CRESI BigDataPol - Terrain Guadeloupe : Corpus", https://doi.org/10.18167/DVN1/W5U3I0, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
16 janv. 2018
Roche, Mathieu; Bonin, Muriel, 2018, "CRESI BigDataPol - Terrain Guadeloupe : Termes extraits automatiquement", https://doi.org/10.18167/DVN1/0SD5SL, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
22 déc. 2017
Roche, Mathieu; Bonin, Muriel, 2017, "CRESI BigDataPol - Terrain Guadeloupe : Comparaison des termes extraits", https://doi.org/10.18167/DVN1/YMCUEY, CIRAD Dataverse, V1
CONTEXTE : projet CRESI BigDataPol (http://textmining.biz/Projects/BigDataPol). But : Mobiliser des approches de Big data pour l'analyse des processus et des effets des politiques publiques dans le milieu rural. Question de recherche en SHS adaptée au terrain Guadeloupe : (1) Par... |
6 nov. 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "Dic-ES : Liste d'entités spatiales en français", https://doi.org/10.18167/DVN1/LPY080, CIRAD Dataverse, V1
Le dictionnaire "dic-ES" est un ensemble de noms de lieux à partir des listes fournies par (1) la métropole de Montpellier (rues, quartiers, etc.) ; (2) la métropole européenne de Lille ; (3) les noms de pays et les capitales de chaque pays. Le dictionnaire contient également une... |
8 sept. 2017
Zenasni, Sarah; Kergosien, Eric; Roche, Mathieu; Teisseire, Maguelonne, 2017, "A corpus of 1000 authentic SMS in French with spatial labels", https://doi.org/10.18167/DVN1/0ZGJRC, CIRAD Dataverse, V2
Extract of 1000 authentic French SMS from a corpus of more than 88000 SMS (http://88milsms.huma-num.fr/). Spatial entities are tagged (with label). First, an automatic labelling approach based on text-mining techniques is applied in order to obtain the first corpus ("corpus1_auto... |