Nous utilisons notre cluster sur Amazon EC2. nous utilisons des scripts cloudera pour installer hadoop. Sur le nœud maître, nous démarrons en dessous des services.Hadoop safemode recovery - prendre beaucoup de temps
609 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop-daemon.sh start namenode'
610 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop-daemon.sh start secondarynamenode'
611 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop-daemon.sh start jobtracker'
612
613 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop dfsadmin -safemode wait'
Sur la machine esclave, nous exécutons les services ci-dessous.
625 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop-daemon.sh start datanode'
626 $AS_HADOOP '"$HADOOP_HOME"/bin/hadoop-daemon.sh start tasktracker'
Le principal problème auquel nous sommes confrontés est, HDFS récupération safemode prend plus d'une heure, ce qui provoque des retards dans notre achèvement des travaux.
Voici les principaux messages du journal.
1. domU-12-31-39-0A-34-61.compute-1.internal 10/05/05 20:44:19 INFO ipc.Client: Retrying connect to server: ec2-184-73-64-64.compute-1.amazonaws.com/10.192.11.240:8020. Already tried 21 time(s).
2. The reported blocks 283634 needs additional 322258 blocks to reach the threshold 0.9990 of total blocks 606499. Safe mode will be turned off automatically.
Le premier message est lancé dans le journal de suivi des tâches, car le suivi des travaux n'est pas démarré. le traqueur de travaux n'a pas démarré à cause de la récupération de safemode hdfs.
Le deuxième message est lancé pendant le processus de récupération.
Y a-t-il quelque chose que je fais de mal? Combien de temps dure la récupération normale de safemode hdfs? Y aura-t-il une accélération, en ne démarrant pas les suiveurs de tâches jusqu'à ce que le traqueur de travaux soit démarré? Existe-t-il des problèmes hadoop connus sur le cluster amazon?
Merci pour votre aide.