J'ai un problème de stockage de 50 Go de journaux chaque jour dans un environnement distribué. J'ai regardé Hadoop HDFS mais parce qu'il a des problèmes fonctionnant sur l'infrastructure de Windows, le manque d'API de système de fichiers multilingue ne me convient pas très bien. Cassandra, d'un autre côté, est très facile à déployer sur n'importe quelle plateforme. Le seul gros problème auquel je suis confronté est l'utilisation de l'espace disque. Voici les chiffres:Cassandra est-il suffisamment adapté pour stocker des journaux en termes d'utilisation de l'espace disque?
- taille du journal original est 224 Mo
- fichier de données Cassandra est 557Mb
- fichier d'index Cassandra est 109Mo
Je suis arrivé en tête presque 2x lors de l'enregistrement des lignes de journaux à partir d'un fichier journal.
Est-il possible d'accorder Cassandra d'une manière ou d'une autre afin qu'il ne mange pas autant d'espace disque pour des scénarios très simples?
mamu, s'il vous plaît lire http://stackoverflow.com/questions/2359175/cassandra-file-structure-how-are-the-files-use/2359282#2359282 – Schildmeijer