2009-07-27 12 views
7

Je construis des AMI à partir de l'une des bases sur EC2. Un des types d'instance exécute Tomcat et contient beaucoup d'index Lucene; une autre instance exécutera MySQL et aura de grandes exigences de données avec celle-ci. J'essaie de définir la meilleure façon d'inclure ceux dans les AMI que je suis en train de créer. Si je monte /mnt/lucene et /mnt/mysql, ceux-ci ne sont pas inclus dans l'AMI généré. Donc, il me semble que la meilleure façon d'y faire face est d'avoir un EBS pour chacun, de prendre des snapshots et de lancer des instances qui ont leur propre EBS basé sur les snapshots les plus récents. Est-ce la meilleure façon de procéder?Quel est le stockage d'instance sur EC2?

Qu'est-ce que le stockage d'instance de point? Il semble que cela ne fonctionnera que comme une zone de stockage temporaire - qu'est-ce qui me manque? Vraisemblablement, il y a une raison pour laquelle Amazon offre jusqu'à 800 Go de stockage sur les grandes instances standard ...

Répondre

4

Le stockage d'instance est plus rapide que le stockage EBS. Vous ne mentionnez pas ce que vous allez faire avec vos instances, mais pour certaines applications, la vitesse peut être plus importante que la durabilité. Pour une application qui effectue principalement l'exploration de données sur une base de données volumineuse, il peut être utile de disposer de quelques centaines d'unités de stockage local et rapide pour héberger la base de données. Les nœuds de travail dans un cluster MapReduce peuvent également être d'excellents candidats pour le stockage d'instance, en fonction du type de travail.

+0

C'est ce que je pensais. Je pourrais faire avec quelques chiffres pour déterminer comment le stockage d'instance varie par rapport à EBS. J'ai couru bonnie ++ sur le stockage de l'instance et ça n'a pas détruit mes chaussettes. – jabley

+0

Je suppose que la question est de savoir à quel point cela ne vous a pas fait chuter par rapport à la même référence sur ebs :) J'ai le sentiment que c'est une de ces situations où le bon choix va différer pour tout le monde, et vous Je vais devoir déterminer quelle combinaison des options disponibles fonctionne le mieux pour votre problème particulier. La beauté de la situation est que si un nœud prend deux heures à parcourir vos données, vous pouvez toujours louer deux nœuds et le faire en 1 heure! (En supposant que vous êtes bénis avec des tâches parallélisables) –

+0

Je me demande comment le stockage d'instance résiste à un RAID de petits volumes EBS. Peut-être une fois que vous utilisez des RAIDs, il n'y a plus de raison d'utiliser le stockage d'instance (au moins pour l'accès à la base de données lourdement sollicité). –

2

Un autre point de stockage d'instance est indépendant. Il y a eu plusieurs pannes d'EBS (google par exemple "site: aws.amazon.com ebs outage"). Si l'instance s'exécute, le stockage de l'instance est disponible. Évidemment, si vous comptez sur le stockage d'instance, vous devez exécuter plusieurs instances (sur plusieurs zones de disponibilité) et tolérer des instances défaillantes uniques.

0

Je sais que c'est en retard dans le jeu, mais un autre peu réfléchie factoid ...

stockage EBS rend très facile de créer AMI de partir, alors que, le stockage d'instance magasin exige que la création d'AMI va être fait localement sur la machine elle-même avec tout un tas de travail pour préparer, stocker et enregistrer l'AMI.