Mon code Python prend en charge la lecture et l'écriture des données dans un format de fichier créé par d'autres, appelé BLT format. Le format BLT est un espace blanc et un retour à la ligne indépendante, car une nouvelle ligne est traitée comme n'importe quel autre espace blanc. L'entrée principale dans ce format est un « bulletin » qui se termine par un « 0 », par exemple,lecture de fichiers très volumineux dont le format est indépendant de la nouvelle ligne
1 2 3 0
Le format est newline indépendant, il pourrait aussi être écrit comme
1 2
3 0
Ou vous pourrait avoir plusieurs bulletins de vote sur une ligne:
1 2 3 0 4 5 6 0
Ces fichiers peuvent être très volumineux, donc je ne veux pas lire un fichier en mémoire. La lecture par ligne est compliquée car les données ne sont pas basées sur des lignes. Quel est un bon moyen de traiter ces fichiers de manière efficace sur le plan de la mémoire?
Êtes-vous intéressé par le format BLT simple ou le format étendu (Open STV)? Le lien que vous avez donné est la seule spécification pour chaque format? –
La divulgation complète, j'ai écrit la page wiki liée et conçu le format étendu. Je m'intéresse au format original où il est indépendant de Newline (ce qui n'est pas expliqué dans la page wiki parce que j'encourage les gens à utiliser les nouvelles lignes). –