J'ai des enregistrements vaguement structurés dans un fichier composé de 3 ou 4 lignes de texte séparées (la plupart du temps) par une ligne blanche. Tous les enregistrements n'ont pas un séparateur de ligne vide, mais la dernière ligne de chacun d'eux commence par le mot "Added". Je voudrais produire un fichier csv avec chaque enregistrement sur une ligne précédé de son numéro de ligne. Jusqu'à présent, je n'ai pu produire qu'une concaténation de tous les enregistrements séparés par un nombre arbitraire d'espaces et une virgule redondante.
Logiquement, j'essaie d'obtenir ce qui suit :
Lire la ligne, si la ligne commence par 'Added', garder la nouvelle ligne à la fin.
sinon, remplacez 'newline' par ','.
ou si la ligne est vide, la supprimer
endif
Les données de l'échantillon :
Peter Green
Space Monkey at Area 51
Joined
Added by SF 3 weeks ago
Will Rossiter
Joined
Added by SF 3 weeks ago
Dean Matthews
Guitarist at Blues
Joined
Added by SF 3 weeks ago
Hobbit Mak
Farnborough, United Kingdom
Joined
Added by SF 3 weeks ago
Keneth W Moorfield
THE STOREMAN
Joined
Added by SF 3 weeks ago
Mick Georgious
Software Engineer
Joined
Added by SF 3 weeks ago