Não pode escolher mais do que 25 tópicos Os tópicos devem começar com uma letra ou um número, podem incluir traços ('-') e podem ter até 35 caracteres.
Este repositório está arquivado. Pode ver ficheiros e cloná-lo, mas não pode fazer envios ou lançar questões ou pedidos de integração.

04-top-words.py 784 B

12345678910111213141516171819202122232425262728293031323334353637383940
  1. import sys
  2. def get_value(pair):
  3. key, value = pair
  4. return value
  5. def get_word(chunk):
  6. if all(x.isalpha() for x in chunk):
  7. if len(chunk) < 4:
  8. return None
  9. return chunk.lower()
  10. else:
  11. return None
  12. def main():
  13. filename = sys.argv[1]
  14. stream = open(filename, "r")
  15. scores = {}
  16. for line in stream.readlines():
  17. for chunk in line.split():
  18. word = get_word(chunk)
  19. if word:
  20. if not word in scores:
  21. scores[word] = 0
  22. else:
  23. scores[word] += 1
  24. stream.close()
  25. top = sorted(scores.items(), key=get_value, reverse=True)
  26. for word, count in top[0:10]:
  27. print(count, word)
  28. if __name__ == "__main__":
  29. main()