2009-08-11 5 views
2

Je charge une table dans laquelle la première colonne est une URL et la lit dans R en utilisant read.table().Lignes supprimées dans R avec read.table?

Il semble que R abandonne environ 1/3 des colonnes et ne renvoie aucune erreur.

Les URL ne contiennent aucun # caractères ou onglets (mon champ séparateur), ce qui, d'après ce que je comprends, pourrait poser problème. Si je convertis d'abord les URL en nombres entiers, le problème disparaît.

Y a-t-il quelque chose dans le champ qui pourrait amener R à supprimer les lignes?

+0

Pourriez-vous nous fournir un petit échantillon des données (à partir d'un éditeur de texte brut, pas après avoir chargé dans R)? Utilisez-vous des paramètres avec votre read.table() ou juste les valeurs par défaut? celui qui a upvoted ma version de réponse de ce commentaire de sorte que je pourrais avoir assez de représentant pour commenter!) –

Répondre

2

Sans un échantillon des données, c'est difficile à dire. Mais un petit "gotcha" est que # est la valeur par défaut comment.char en read.table(). Essayez de définir comment.char = "" et voir si cela résout.

1

Merci pour votre aide,

Oui, donc il y avait quelques initialement hash et j'ai pu les manipuler à l'aide comment.char = ''. Le problème s'est avéré être que certaines de mes URL contenaient des caractères 'et' Le plus étrange à propos de la situation est qu'il n'a renvoyé aucune erreur Après avoir supprimé ces caractères en utilisant tr, je n'ai eu aucun problème avec le chargement des données.

+0

Ceci devrait être une édition à la question Un exemple reproductible est nécessaire. –