O dataset desta atividade foi tirado do Kaggle e chama-se Food Ingredient List. Ele contém os ingredientes presentes em 10000 produtos encontrados em supermercados. Para mais informações, visite a página do dataset.
Para baixar o dataset, crie uma conta no Kaggle ou, se possível, execute o comando abaixo:
In [ ]:
from os import system
system("wget -O ingredients.tsv https://drive.google.com/uc?export=download&id=1oTjCLXJZjciOmpweGsirlreu9zcrm6Py")
PS: caso o comando não obtenha resposta no jupyter, execute-o no seu terminal ou baixe o arquivo direto pelo link
Para por seus conhecimentos em prática, temos aqui 7 demandas de informações a serem extraídas sobre o dataset. As demandas, para serem atingidas, necessitam de algumas operações de manipulação de strings e, se preferir (para sue bem), DataFrames. Fique a vontade para responder da maneira que achar mais interessante, bem como plotar gráficos para ilustrar suas respostas.
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]: