7

Je me demande si quelqu'un pourrait prendre une minute de sa journée pour donner son grain de sel sur mon problème.Meilleure structure de données pour les données de séries temporelles

Je voudrais quelques suggestions sur ce qui serait la meilleure structure de données pour représenter, sur disque, un grand ensemble de données de séries chronologiques. La priorité principale est la vitesse d'insertion, avec d'autres priorités dans l'ordre décroissant; vitesse de récupération, taille sur disque, taille en mémoire, vitesse de suppression.

J'ai vu que les arbres B + sont souvent utilisés dans la base de données en raison de leur temps de recherche rapide, mais qu'en est-il des temps d'insertion rapide? Une liste chaînée est-elle vraiment la solution?

+0

Veuillez mieux décrire vos données. Parlez-vous d'une séquence d'horodatages et de valeurs (par exemple, quelle est la taille d'un élément à un moment donné). Ou les données sont-elles plus complexes? Une série d'horodatages, de valeurs et d'autres données. – Hogan

+0

Les données sont simplement une séquence d'horodatages et de valeurs, pas plus complexes que cela. Je vous remercie. – ChrisBellew

+0

S'il s'agit de données de séries chronologiques, la plupart de vos "insertions" sont-elles réellement "ajoutées"? Cela ferait une grande différence. – John

Répondre

3

Vous voudrez peut-être regarder dans HDF5 (Hierarchical Data Format). Il est bien adapté aux données de séries chronologiques. Mise en œuvre sage, il utilise B Arbres.

+0

Merci, cela semble être exactement ce que le médecin a ordonné! – ChrisBellew

+0

Je me demandais si quelqu'un d'autre avait des idées? Merci. – ChrisBellew