Sumarização e agrupamento
# Resumo e agrupamento

Quando temos uma pergunta como “quantas pessoas baixaram nosso aplicativo a cada dia na última semana?”, estamos pedindo um **resumo** dos dados. Um resumo geralmente é composto por duas partes: um ou mais *números* que nos interessam (chamados de “métrica”, no jargão de dados) e como queremos ver esses números *agrupados* ou *segmentados*. Para responder à pergunta “Quantas pessoas baixaram nosso app a cada dia na última semana?”:
- A métrica seria a contagem de pessoas que baixaram o app (a contagem de linhas).
- Queremos que essa métrica seja agrupada por “cada dia”.
- E queremos filtrar as linhas para “última semana”.
Existem duas formas comuns de você resumir seus dados:
- Contar o número de linhas na sua tabela
- Obter a soma ou a média de uma coluna numérica
E muitas vezes, você vai então **agrupar** essa métrica por:
- Tempo
- Local
- Categoria
## Métricas de resumo
Adicionar um passo de resumo permite que você escolha como agregar os dados da etapa anterior. Você pode escolher uma ou mais métricas e, opcionalmente, agrupar essas métricas por uma ou mais dimensões (colunas). Ao selecionar suas métricas, você pode escolher entre funções básicas como `sum`, `average` e `count`; ou pode selecionar uma métrica comum definida por um administrador; ou criar uma [expressão personalizada](./expressions) escrevendo uma fórmula.
Métricas comuns incluem:
- **Count of rows:** o total de linhas na tabela, após a aplicação de quaisquer filtros. Se estiver olhando a tabela `Orders` e quiser saber quantas ordens foram feitas com preço maior que 40 dólares, filtraria por “Price greater than 40” e então selecionaria `Count of rows`, porque deseja que o Analytics conte quantas ordens corresponderam ao filtro.
- **Sum of …:** a soma de todos os valores em uma coluna específica.
- **Average of …:** a média de todos os valores em uma única coluna.
- **Number of distinct values of…:** a quantidade de valores únicos em todas as células de uma coluna. Útil para saber, por exemplo, quantos tipos diferentes de produtos foram vendidos no último mês (não quantos foram vendidos no total).
- **Cumulative sum of…:** dá um total acumulado para uma coluna específica. Para essa métrica ser útil, é preciso agrupá-la por uma coluna de data para visualizar ao longo do tempo.
- **Cumulative count of rows:** total acumulado do número de linhas na tabela ao longo do tempo. Igual ao `Cumulative sum of…`, é necessário agrupar por uma coluna de data para ser útil.
- **Standard deviation of …:** um número que expressa o quanto os valores de uma coluna variam, para mais ou para menos, em relação à média dessa coluna.
- **Minimum of …:** o menor valor presente no campo selecionado.
- **Maximum of …:** o maior valor presente no campo selecionado.
Se você fizer um resumo e adicionar um agrupamento, poderá então resumir *novamente*. Também pode adicionar etapas para filtrar e/ou relacionar tabelas entre os resumos. Por exemplo, sua primeira etapa de resumo pode ser contar o número de pedidos por mês e depois adicionar uma segunda etapa de resumo para obter a média mensal do total de pedidos selecionando o `Average of…` da sua coluna de `count`.

Você também pode adicionar métricas e agrupamentos na página de resultados, em uma barra lateral: a parte superior da barra lateral é onde você escolhe o número (“métrica”) que quer visualizar, e a parte abaixo é onde seleciona como agrupar esse número (ou como “segmentar”).
Se seus administradores criaram algum [métrica nomeada](../../data-modeling/metrics) específica para sua empresa ou organização, elas estarão nesse menu suspenso na seção **Common Metrics**. Essas métricas podem representar, por exemplo, a forma oficial da sua empresa de calcular receita.
## Agrupando suas métricas
Dependendo da coluna de agrupamento selecionada, o Analytics mostrará qual visualização ou gráfico ele considera o mais adequado para esse resumo. Portanto, se você selecionar uma coluna de data, verá um gráfico de linha assim (você pode clicar no botão verde **Summarize** para abrir a barra lateral de resumo).

Ao clicar em uma coluna de agrupamento diferente daquela que está selecionada, o agrupamento mudará para usar essa nova coluna. Mas se quiser **adicionar** um agrupamento adicional, basta clicar no ícone de mais (+) ao lado da coluna. Para remover um agrupamento, clique no ícone X.

Algumas colunas de agrupamento permitem escolher o nível de granularidade:
- Para colunas datetime, você pode clicar nas palavras `by month` para alterar o agrupamento para dia, semana, hora, trimestre, ano etc. Também é possível adicionar múltiplos agrupamentos na mesma coluna datetime com granularidades diferentes (por exemplo, agrupar por semana e por dia da semana). Para informações sobre como agrupar por semana do ano, veja [Week of year](./expressions/week).
- Para colunas numéricas, como idade, o Analytics automaticamente “agrupa em bins” (faixas), então você verá sua métrica agrupada em faixas etárias, como 0–10, 11–20, 21–30 etc. Assim como nas datas, você pode clicar na opção atual para alterar o número de bins. Atualmente, não é possível escolher faixas personalizadas para os bins.

Se você selecionar um número fixo de bins, o Analytics dividirá o intervalo dos dados em esse número de intervalos iguais. Alguns intervalos podem não conter dados e o Analytics não irá mostrá-los.