Je dois résumer un cadre de données par quelques variables, en ignorant les autres. Ceci est parfois appelé effondrement. Par exemple. si j'ai un dataframe comme ceci:Comment est-ce que je peux réduire une trame de données par certaines variables, en prenant la moyenne à travers d'autres
Widget Type Energy
egg 1 20
egg 2 30
jap 3 50
jap 1 60
Puis l'effondrement de Widget, avec l'énergie de la variable dépendante, l'énergie ~ Widget, donnerait
Widget Energy
egg 25
jap 55
Dans Excel la fonctionnalité la plus proche peut-être « tableaux croisés dynamiques » et j'ai travaillé comment le faire en python (http://alexholcombe.wordpress.com/2009/01/26/summarizing-data-by-combinations-of-variables-with-python/), et voici un exemple avec R utilisant la bibliothèque doBy pour faire quelque chose de très lié (http://www.mail-archive.com/[email protected]/msg02643.html), mais y a-t-il un moyen facile de faire ce qui précède? Et encore mieux y a-t-il quelque chose de construit dans la bibliothèque ggplot2 pour créer des graphes qui s'effondrent à travers certaines variables?
'by' est également très pratique de temps en temps. –
vrai. aussi 'ave' –
pour un exemple utilisant' ddply' du paquet 'plyr' jetez un oeil à cette question connexe: http://stackoverflow.com/questions/2473659/r-what-are-the-best-functions- à-traiter-avec-concaténant-et-moyennage-valeurs-dans – mropa