Je travaille avec différentes bases de données. Tous contiennent des informations sur plus de 1000 entreprises. Une société est définie par son code de téléscripteur (la version courte du nom (c'est-à-dire Ford comme F) généralement vu sur les conseils boursiers). Mis à part le code de téléscripteur à fusionner, je dois aussi fusionner à l'heure. J'ai utilisé le mois comme variable de comptage tout au long de ma série chronologique. Le but final est d'avoir une régression dans le genre deFusion de jeux de données basés sur 2 variables dans SAS
Y(jt) = c + X(jt) +X1(jt)
etc avec j = company
(ticker) et t = time
(mois). Imaginez donc que j'ai 2 bases de données, dont la base de données avec des variables telles que Tickers, mois, betas d'une entreprise (mesure de risque) etc. et une deuxième base de données avec une variable supplémentaire (disons la capitalisation boursière)).
Ce que je veux faire est de fusionner ces 2 bases de données en fonction du ticker et du mois.
Exemple: base de données de base:
Ticker ____ Month ____ Betas AA ____ 4 ____ 1.2 BB ____ 8 ____ 1.18
seconde base de données:
Ticker ____ Month ____ MCAP AA ____ 4 ____ 8542 BB ____ 6 ____ 1245
Puis, après fusion, je voudrais avoir quelque chose comme ceci:
Ticker ____ Month ____ Betas ____ MCAP AA ____ 4 ____ 1.2 ____ 8542
Donc toutes les observations qui font ne correspond pas à la date et le ticker doivent être supprimés. Je suis sûr que c'est possible, mais je ne trouve pas le bon type de code.
PS: Je devine que les underscores ont quelque chose à voir avec la mise en page de la police, mais aussi le gras en italique est censé être normal :)
Vous pouvez réécrire cela en une seule étape proc sql. Proc sql peut gérer plusieurs à plusieurs fusions, ce que l'étape de données ne peut pas faire, et vous n'avez pas besoin de trier les ensembles de données avant de les fusionner. –