Tarefa


Esta tarefa é um desafio para por em prova seus conhecimentos em Python! Para resolvê-lo, você deverar utilizar o que foi apresentado nas últimas aulas E consultar materiais complementares(stack overflow) para aprender ainda mais em um cenário prático!

Baixando o dataset

O dataset desta atividade foi tirado do Kaggle e chama-se Food Ingredient List. Ele contém os ingredientes presentes em 10000 produtos encontrados em supermercados. Para mais informações, visite a página do dataset.

Para baixar o dataset, crie uma conta no Kaggle ou, se possível, execute o comando abaixo:


In [ ]:
from os import system
system("wget -O ingredients.tsv https://drive.google.com/uc?export=download&id=1oTjCLXJZjciOmpweGsirlreu9zcrm6Py")

PS: caso o comando não obtenha resposta no jupyter, execute-o no seu terminal ou baixe o arquivo direto pelo link

Demandas


Para por seus conhecimentos em prática, temos aqui 7 demandas de informações a serem extraídas sobre o dataset. As demandas, para serem atingidas, necessitam de algumas operações de manipulação de strings e, se preferir (para sue bem), DataFrames. Fique a vontade para responder da maneira que achar mais interessante, bem como plotar gráficos para ilustrar suas respostas.

1 - Quantas e quais as marcas de produtos contidas no dataset?


In [ ]:

2 - Quais as marcas que aparecem mais no dataset? Quais aparecem menos?


In [ ]:

3 - Compute a média e desvio padrão da frequência das marcas de produtos


In [ ]:

4 - Quais os ingredientes que aparecem nos produtos? Mostre quantos são, os que mais aparecem e os que menos aparecem.


In [ ]:

5 - Compute a média e desvio padrão da frequência dos ingredientes


In [ ]:

6 - Quais os ingredientes mais usados por cada marca? E os menos usados?


In [ ]:

7 - Compute alguma informação não demandada pelas questões anteriores e justifique o porquê que tal informação é útil


In [ ]: