Description du vocabulaire
Titre
ThesoTM (thésaurus)
ThesoTM
Description
Le thésaurus ThesoTM (Thesaurus of Text Mining) est une ressource terminologique bilingue (français-anglais) issue de la transformation en SKOS d’une ontologie dédiée aux outils de fouille de textes répertoriant les outils libres du domaine. Il regroupe plus de 1400 concepts avec leurs définitions et éventuellement une bibliographie associée.
Il repose sur la réutilisation de classes et propriétés provenant d’ontologies existantes :
• BFO (Basic Formal Ontology) : ontologie de haut niveau, modélisation des grandes catégories de la réalité
• IAO (Information Artifact Ontology) : ontologie noyau, modélisation des entités d’information
• SWO (Software Ontology) : modélisation des logiciels
• OMTD-Share (issue du projet OpenMinTed) : modélisation des tâches de traitement automatique du langage.
De nouvelles classes et propriétés ont été introduites quand cela s’est avéré nécessaire.
Sont ainsi documentés pour les différents outils : les langages et les types de données d’entrée ; les systèmes d’exploitation possibles, les langages de programmation sous-jacents, les interfaces d’utilisation et les tâches exécutées ; les pays de conception, les licences utilisées et les champs d’application ainsi que toutes les informations utiles d’accès : page d’accueil, entrepôts et localisations de téléchargement.
Le thésaurus est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Un téléchargement de l’ontologie sous format OWL est disponible ICI.
Une visualisation interactive en ligne est disponible sur TM Tools Explorer.
Il repose sur la réutilisation de classes et propriétés provenant d’ontologies existantes :
• BFO (Basic Formal Ontology) : ontologie de haut niveau, modélisation des grandes catégories de la réalité
• IAO (Information Artifact Ontology) : ontologie noyau, modélisation des entités d’information
• SWO (Software Ontology) : modélisation des logiciels
• OMTD-Share (issue du projet OpenMinTed) : modélisation des tâches de traitement automatique du langage.
De nouvelles classes et propriétés ont été introduites quand cela s’est avéré nécessaire.
Sont ainsi documentés pour les différents outils : les langages et les types de données d’entrée ; les systèmes d’exploitation possibles, les langages de programmation sous-jacents, les interfaces d’utilisation et les tâches exécutées ; les pays de conception, les licences utilisées et les champs d’application ainsi que toutes les informations utiles d’accès : page d’accueil, entrepôts et localisations de téléchargement.
Le thésaurus est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Un téléchargement de l’ontologie sous format OWL est disponible ICI.
Une visualisation interactive en ligne est disponible sur TM Tools Explorer.
Créateur(s)
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
Fabienne Schmittheisler
Version
1.1
Date de création
lundi 8 juin 2020 00:00:00
Date de dernière modification
jeudi 20 juin 2024 00:00:00
Nom d'attribution
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
URL d'attribution
Concepts équivalents
Type d'entrée
Description
Cette ressource contient 1402 entrées terminologiques.
Titre court
ThesoTM
URI
http://data.loterre.fr/ark:/67375/LTK
Nombre d'entrées par type
Type | Nombre |
---|
Nombre de termes par langue
Langue | Termes préférentiels | Termes synonymes | Termes cachés |
---|