J'ai un ensemble de trois (ou plus) variables connues qui sont liées à l'entrée d'un processus. J'ai aussi les résultats (mesurés) du processus, dans ce cas le temps qu'il a fallu pour que le processus se termine.Comment trouver la relation entre un certain nombre de variables d'entrée et une sortie résultante
Afin d'être en mesure de donner une durée estimée et créer un indicateur de progression en fonction de l'entrée, je besoin de trouver la relation (le cas échéant) entre les variables et les résultats.
Quelle est la meilleure façon de déterminer s'il y a une relation, et si une relation existe pour créer une formule.
I ont un certain nombre d'ensembles de données pour travailler avec (valeurs variables d'entrée et de temps qui en résulte).
Des suggestions ou des liens liés à cela? Un indice sur la façon de résoudre cela en utilisant le code ou un pointeur vers une théorie serait utile.
Certains fond ajouté:
Le processus se compose d'un certain nombre de fichiers à traiter (l'entrée principale) avec une entrée secondaire supplémentaire consistant en une autre série de (référence) des fichiers directement lié au contenu de l'entrée principale. Actuellement, la progression est indiquée en montrant la progression globale du fichier (liée au nombre total d'entrées principales) combinée avec la progression dans le fichier sur la base de la position dans le contenu du fichier d'entrée courant. Comme le temps global requis par fichier (ensemble) peut être assez long (selon le contenu), je voudrais ajouter une sorte de "temps restant" ou "temps de fin prévu".
Le code actuel consiste en une fusion d'un sous-ensemble de données à partir d'une liste (format Excel) avec des fichiers XML dans un fichier de format hérité. La partie "qui prend du temps" est l'analyse des fichiers Excel, mais elle est grandement affectée par la taille réelle du fichier, le nombre d'éléments à traiter et le nombre de fichiers à créer en sortie. Dans certains cas, un fichier volumineux génère une sortie alors que dans d'autres, un petit fichier peut générer un grand nombre de sorties. Comme beaucoup d'accès aux fichiers est effectué, un facteur secondaire (difficile à mettre en chiffres) est le nombre de processus identiques qui s'exécutent en même temps.
L'idée est de pouvoir donner un débit estimé en fonction de l'entrée.
Merci à tous! Basé sur les réponses je mettrai à jour le code pour créer automatiquement un journal contenant toutes les variables et les débits connus par sous-tâche. Cela devrait faciliter l'identification de la contribution de chaque tâche (et, espérons-le, simplifier la relation entre l'entrée et la sortie de la sous-tâche). Cela devrait également faciliter l'obtention plus rapide d'un plus grand nombre de données d'échantillon pour l'analyse. Notez que puisqu'il s'agit d'une fonctionnalité de priorité inférieure, cela peut prendre un certain temps;) Je rapporterai ici avec les résultats. – barry