Notre société travaille sur un projet qui nécessite une base de données avec 30-50 millions de lignes de données produit. Ces lignes contiennent du texte qui doit être recherché simultanément des milliers de fois par seconde. De plus, chaque recherche doit prendre moins d'une seconde à exécuter. Donc, dans l'ensemble, nous avons une base de données de 50 Mo qui doit être recherchée des milliers de fois par seconde. Gardez à l'esprit que ce sont des recherches en texte intégral. Je sais que MySQL ou toute autre base de données relationnelle ne peut pas gérer ce type de travail. Nous cherchons donc quelqu'un qui peut concevoir la bonne configuration pour nous et nous aider à la mettre en œuvre, pour un prix que vous spécifiez.Base de données massive w/Fulltext Recherche - Sphinx, Lucene, Cassandra, MongoDB, CouchDB
Tout d'abord, nous aimerions savoir quelles sont nos meilleures options ici. J'ai personnellement fait des recherches sur des choses comme Sphinx, Lucene, Cassandra, MongoDB, CouchDB, Solr, etc, mais je ne sais vraiment pas ce qui devrait être utilisé en conjonction avec un autre pour nous donner la configuration la plus efficace possible. Donc, si quelqu'un pouvait simplement donner quelques conseils, ou accepter notre offre d'emploi, ce serait grandement apprécié.
Vous pouvez me contacter via PM ici, et je vais vous donner mon email/IM/numéro de téléphone pour discuter plus en détail.
Merci!
Hey, Merci pour la réponse! Et oui, j'ai oublié de mentionner qu'il s'agit de recherches en texte intégral. La raison pour laquelle je rejette MySQL est à cause du verrouillage de la table. Les fonctions de texte intégral requièrent myisam, qui verrouille les tables et nuirait aux milliers de recherches simultanées dont nous aurions besoin chaque seconde. En outre, les recherches de texte intégral sont plus lentes que les autres alternatives. J'espère que l'association de MySQL avec Sphinx peut prendre soin de ces deux problèmes, mais je ne suis pas vraiment sûr, c'est pourquoi j'ai posté ici :) Merci encore! –