Du kan inte välja fler än 25 ämnen Ämnen måste starta med en bokstav eller siffra, kan innehålla bindestreck ('-') och vara max 35 tecken långa.
Den här utvecklingskatalogen är arkiverad. Du kan se filer och klona katalogen, men inte öppna ärenden eller genomföra push- eller pull-förfrågningar.

06-top-words.py 780 B

5 år sedan
1234567891011121314151617181920212223242526272829303132333435363738394041
  1. # On veut obtenir la fréquence de chaque mot
  2. def get_freq(nom_fich):
  3. fich=open(nom_fich)
  4. contenu=fich.read()
  5. liste_frag=contenu.split() # coupe sur 'espace' et \
  6. liste_mot=list()
  7. for fragment in liste_frag:
  8. fragment_min=fragment.lower()
  9. frag_clean=clean(fragment_min)
  10. liste_mot.append(frag_clean)
  11. return liste_mot
  12. def clean(fragment):
  13. result=""
  14. for c in fragment:
  15. if c.isalpha():
  16. result+=c
  17. return result
  18. def tri(d):
  19. list_tuples=list()
  20. for clé, valeur in d.items():
  21. list_tuples.append((valeur, clé))
  22. list_tuples.sort(reverse=True)
  23. print(list_tuples)
  24. return d
  25. nom_fich="ruffin.txt"
  26. f=get_freq(nom_fich)
  27. print(f)