J'ai un ensemble de données qui ressemble à ce qui suit:
film (année) genre
par exemple.tout d'impression pour correspondre à motif
quelques mots (1934) Action
Mon but est de saisir chaque champ « film » et vérifier un fichier différent qui a aussi un tas de films et supprimer les lignes du second fichier qui ne contiennent pas film. J'ai essayé d'utiliser awk pour faire cela, mais j'ai seulement réussi à faire correspondre le champ de l'année. Est-il possible de créer une variable pour le champ de film? Je pense que la façon la plus simple de le faire serait de faire correspondre le champ de l'année et de créer une variable à partir de tout ce qui précède chaque ligne. Je n'ai pas été capable de comprendre cela, est-ce qu'il y a un moyen de faire cela qui pourrait être plus facile que ma suggestion?
c'est génial! Je ne savais pas que -F accepte les expressions régulières. Vous pouvez combiner ceci en une ligne de commande comme "awk -F" [()] "'{print $ 1}' dataset | fgrep -f - secondfile De cette façon, vous n'avez pas besoin du fichier temporaire movie_names –
Merci pour la réponse, cela fera exactement ce dont j'avais besoin @raha Je vais devoir essayer ce oneliner, on dirait que ça marcherait bien – Isawpalmetto