2010-10-20 39 views
0

Existe-t-il un logiciel libre/libre disponible qui vous donne des mots-clés liés sémantiquement pour un mot donné. par exemple le mot chien: il devrait donner les mots clés comme: animal, mammifère, ... ou pour le mot France il devrait vous donner des mots clés comme: pays, Europe .... essentiellement un ensemble de mots-clés liés au mot donné.Obtention de mots-clés liés sémantiquement pour un mot donné

ou si ce n'est pas le cas, quelqu'un a-t-il une idée de la façon dont cela pourrait être mis en œuvre et comment cela serait complexe. Meilleures salutations

Répondre

0

Oui. Une société nommée Saplo en Suède est spécialisée dans ce domaine. Je crois que vous pouvez utiliser leur API pour cela et si vous demandez gentiment, vous pourriez être en mesure de l'utiliser gratuitement (si ce n'est pas à des fins commerciales bien sûr).

Saplo

+0

Et non, je ne travaille pas là mais j'ai un ami qui le fait. – Phil

+0

mais c'est pour générer des mots-clés à partir d'articles. ne pas trouver de mots liés sémantiquement pour un mot donné. et une sorte de solution libre/open source serait meilleure si elle existait. –

+0

Ah bon, mon mauvais, ils ne l'ont pas encore implémenté. Ils seront probablement bientôt un jour. – Phil

0

Saplo a ce genre de soutien. Bien qu'il ne soit pas encore accessible au public dans Saplo API, nous allons maintenant prendre en compte votre cas d'utilisation.

Fredrik Horte - Saplo

Mise à jour:

(Prenez contact avec moi par Saplo homepage ou @horte)

0

Oui. Ce que vous cherchez est quelque chose de similaire au modèle d'espace vectoriel pour la recherche et c'est la meilleure façon efficace de faire. Il existe des librairies open source disponibles pour l'indexation/la recherche sémantique latente (cas particulier du modèle d'espace vectoriel). Apache Lucene est l'un des plus pupular. Ou quelque chose de google code.

1

Wordnet peut être ce dont vous avez besoin. Wordnet regroupe des mots anglais dans des ensembles de synonymes et fournit des définitions générales, et enregistre les différentes relations sémantiques entre ces groupes.

Il y a des tonnes de projets là-bas en utilisant Wordnet, ici vous avez une liste: http://wordnet.princeton.edu/wordnet/related-projects/

Regardez celui-ci, vous trouverez peut-être particulièrement utile (http://kylescholz.com) http://kylescholz.com/projects/wordnet/?text=dog

vous pouvez voir le démo en direct ici: http://kylescholz.com/projects/wordnet/?text=dog

J'espère que cela aide.

0

Si vous recherchez des ressources en ligne, il y en a plusieurs à considérer (au moins en 2017, le PO est daté de 2010). Lien sémantique (http://www.semantic-link.com): Le créateur de Semantic Link offre une interface aux résultats d'un calcul d'une métrique appelée "information mutuelle" sur des paires de mots sur l'ensemble de Wikipédia en anglais. Seuls les mots survenant plus de 1000 fois dans Wikipedia sont disponibles. «Chien» vous obtient, par exemple: pure race, races, canine, animal de compagnie, chiots.

Il semble cependant que vous soyez vraiment à la recherche d'un outil en ligne qui donne des hyponymes et des hypernymes.A partir de la page Wikipedia pour « Hyponymie »:

En linguistique, un hyponyme (de HUPO grec, « sous » et Onoma, « name ») est un mot ou une phrase dont le champ sémantique est inclus dans celui de un autre mot, son hyperonyme ou hypernym (du grec hupér, "over" et ónoma, "name"). En termes plus simples, un hyponyme partage un type de relation avec son hypernyme. Par exemple, le pigeon, le corbeau, l'aigle et la mouette sont tous des hyponymes de l'oiseau (leur hyperonyme); qui, à son tour, est un hyponyme de l'animal.

WordNet (https://wordnet.princeton.edu) a cette information et possède un outil de recherche en ligne. Avec cet outil, si vous entrez un mot, vous obtiendrez une ou plusieurs entrées avec un "S" à côté d'eux. Si vous cliquez sur le "S", vous pouvez parcourir le "Synset (semantic) relations" du mot avec ce sens ou l'utilisation et comprend hyper- et hyponymes directs. C'est incroyablement riche! Par exemple: "chien" (comme dans "chien domestique") -> "canin" -> "carnivore" -> "mammifère placentaire" -> "vertébré" -> "chordé" - -> etc. ou "chien" -> "animal domestique" -> "animal" -> "organisme" -> "vivant" ->

Il y a aussi WordNik qui liste les hypernymes et inverser mots du dictionnaire (mots avec le mot donné dans leur définition). Hypernymes pour "France" comprennent "pays/nation européenne" et dictionnaire inverse comprend les régions et les villes en France, les noms de certains dirigeants, etc. "Chien" obtient l'hypernyme "animal domestiqué" (et autres).