Je traite beaucoup de texte/données que j'échange entre Python, R, et parfois Matlab. Mon go-to est le fichier de texte plat, mais utilise aussi occasionnellement SQLite pour stocker les données et l'accès de chaque programme (pas encore Matlab). Je n'utilise pas GROUPBY, AVG, etc. dans SQL autant que je fais ces opérations dans R, donc je n'ai pas nécessairement besoin des opérations de base de données.SQLite ou fichier texte à plat?
Pour les applications nécessitant l'échange de données entre les programmes pour utiliser les librairies disponibles dans chaque langue, existe-t-il une bonne règle sur le format/méthode d'échange de données à utiliser (même XML ou NetCDF ou HDF5)? Je sais entre Python -> R il y a rpy ou rpy2 mais je m'interrogeais sur cette question dans un sens plus général - j'utilise de nombreux ordinateurs qui n'ont pas tous rpy2 et qui utilisent aussi quelques autres analyses scientifiques les logiciels qui nécessitent un accès aux données à différents moments (les étapes de traitement et d'analyse sont également séparées).
+1 pour sqlite et d'anticiper une utilisation intensive de la base de données à l'avenir, même si ce n'est pas évident en ce moment. –
Merci - oui, ne pas lire l'ensemble du fichier est certainement son plus. – hatmatrix