Skip to main content

BigQuery

Google BigQuery

Para adicionar uma conexão de banco de dados, clique no ícone de engrenagem no canto superior direito, e navegue até Configurações de administração > Bancos de dados > Adicionar um banco de dados.

Pré-requisitos

Você precisará de uma conta na Google Cloud Platform com um projeto que deseja usar no Analytics. Consulte a documentação do Google Cloud Platform para saber como criar e gerenciar um projeto. Esse projeto deve possuir um dataset do BigQuery para que o Analytics possa se conectar.

Google Cloud Platform: criando uma conta de serviço e o arquivo JSON

Você precisará primeiro de um arquivo JSON da conta de serviço que o Analytics usará para acessar seu dataset do BigQuery. Contas de serviço são destinadas a usuários não humanos (como aplicações como o Analytics) para autenticar (quem sou eu?) e autorizar (o que posso fazer?) suas chamadas de API.

Para criar o arquivo JSON da conta de serviço, siga a documentação do Google sobre configurar uma conta de serviço para seu dataset BigQuery. Aqui está o fluxo básico:

  1. Criar conta de serviço. No console do seu projeto Google Cloud Platform, abra o menu lateral principal à esquerda, vá para a seção IAM & Admin, e selecione Conta de serviço. O console listará as contas de serviço existentes, se houver. No topo da tela, clique em + CRIAR CONTA DE SERVIÇO.

  2. Preencha os detalhes da conta de serviço. Dê um nome à conta de serviço e adicione uma descrição (o ID da conta de serviço será gerado após adicionar o nome). Depois, clique no botão Criar.

  3. Conceda acesso da conta de serviço a este projeto. Você precisará adicionar funções à conta de serviço para que o Analytics tenha permissão para visualizar e executar consultas em seu dataset. Certifique-se de adicionar as seguintes funções à conta de serviço:

    • BigQuery Data Viewer
    • BigQuery Metadata Viewer
    • BigQuery Job User (diferente de BigQuery User)

Para mais informações sobre funções no BigQuery, veja a documentação do Google Cloud Platform.

  1. Criar chave. Depois de atribuir funções à conta de serviço, clique no botão Criar chave e selecione JSON para o tipo de chave. O arquivo JSON será baixado para seu computador.

Você só pode baixar a chave uma vez. Se você excluir a chave, será necessário criar outra conta de serviço com as mesmas funções.

Conexão e sincronização

Após conectar a um banco de dados, você verá a seção “Conexão e sincronização” que exibe o status atual da conexão e opções para gerenciar sua conexão de banco de dados.

Nesta seção, você pode sincronizar o esquema do banco de dados e reescanear os valores dos campos, além de editar os detalhes da conexão.

Editar detalhes da conexão

Você pode editar essas configurações a qualquer momento. Apenas lembre-se de salvar suas alterações.

Nome para exibição

O nome que será exibido para o banco de dados na interface do Analytics.

Project ID

Cada dataset do BigQuery terá um Project ID. Você pode encontrar este ID pelo Console do Google Cloud. Se não souber onde localizar o Project ID, consulte a documentação do Google sobre como obter informações sobre datasets.

Ao inserir o Project ID, omita o prefixo do Project ID. Por exemplo, se seu ID for project_name:project_id, insira somente project_id.

Arquivo JSON da conta de serviço

O arquivo JSON contém as credenciais que sua aplicação Analytics precisa para acessar os datasets do BigQuery, conforme definido pelas funções adicionadas à conta de serviço. Se precisar adicionar funções adicionais, será necessário criar outra conta de serviço, fazer o download do arquivo JSON e enviar este arquivo para o Analytics.

Datasets

Você pode especificar quais datasets do BigQuery deseja sincronizar e escanear. As opções são:

  • Todos
  • Apenas estes...
  • Todos exceto...

Um dataset BigQuery é semelhante a um schema. Certifique-se de inserir os nomes dos seus datasets (como marketing), não os nomes das tabelas (marketing.campaigns).

Suponha que você tenha três datasets: foo, bar e baz.

Para sincronizar os três datasets, selecione Apenas estes... e insira:

foo,bar,baz

Para sincronizar datasets com base em correspondência por string, use o curinga *:

  • Para sincronizar bar e baz, selecione Apenas estes... e insira a string b*.
  • Para sincronizar somente foo, selecione Todos exceto... e insira a string b*.

Note que apenas o curinga * é suportado; não é possível usar outros caracteres especiais ou expressões regulares.

Usar o timezone da Java Virtual Machine (JVM)

Sugerimos deixar esta opção desativada, a menos que você esteja fazendo castings manuais de timezone em muitas ou na maioria de suas consultas com esses dados.

Incluir User ID e query hash nas consultas

Esta opção pode ser útil para auditoria e depuração, mas impede que o BigQuery cacheie os resultados, o que pode aumentar seus custos.

Hostname alternativo

Se quiser usar um hostname diferente para conectar ao BigQuery, informe no formato: https://<hostname>:<porta>. Se estiver usando um serviço proxy para se conectar ao BigQuery (por exemplo, um proxy de privacidade que anonimiza dados pessoais), configure este campo com o hostname ou IP do proxy. Lembre-se de fornecer o URI completo com protocolo e número da porta.

Reexecutar consultas para explorações simples

Desative esta opção se estiver ligada caso os usuários queiram clicar em Run (o botão de play) antes de aplicar algum filtro ou opção de Summarize.

Por padrão, o Analytics executa uma consulta assim que você escolhe uma opção de agrupamento do menu Summarize ou uma condição de filtro do menu drill-through. Se seu banco de dados for lento, talvez seja melhor desabilitar a reexecução para evitar carregar dados a cada clique.

Escolher quando ocorrem as sincronizações e scans

Veja sincronizações e scans.

Refazer fingerprinting das tabelas periodicamente

O fingerprinting periódico aumentará a carga em seu banco de dados.

Ative esta opção para escanear uma amostra de valores toda vez que o Analytics executar uma sincronização.

Uma consulta de fingerprinting examina as primeiras 10.000 linhas de cada coluna e usa esses dados para estimar quantos valores únicos cada coluna possui, quais os valores mínimos e máximos para colunas numéricas e timestamp, entre outros. Se esta opção estiver desativada, o Analytics fará o fingerprint das colunas apenas uma vez durante a configuração.

Conectando o Analytics a fontes de dados do Google Drive

Você pode conectar o Analytics a fontes de dados do Google Drive via BigQuery. Há um processo de configuração envolvido, mas basicamente consiste em criar um dataset no BigQuery e adicionar uma tabela externa a esse dataset que aponta para uma planilha do Google. Isso é útil para carregar CSVs no Google Sheets e, em seguida, analisar e visualizar os dados com o Analytics.

Para conectar a uma fonte de dados armazenada no Google Drive (como uma planilha do Google), primeiro certifique-se que completou os passos acima, incluindo:

  • criar um projeto no Google Cloud Platform,
  • adicionar um dataset no BigQuery, e
  • criar uma conta de serviço.

Compartilhe sua fonte do Google Drive com a conta de serviço

Enquanto visualiza seu arquivo no Drive (por exemplo, uma planilha do Google com um CSV carregado), clique no botão Compartilhar no canto superior direito. No campo Adicionar pessoas ou grupos, cole o e-mail da sua conta de serviço, que você pode encontrar na página de Contas de Serviço no Console do Google Cloud.

Esse endereço de e-mail terá um formato parecido com service-account-name@your-project-name.iam.gserviceaccount.com, com os nomes da conta de serviço e do projeto preenchidos conforme o seu caso.

Escolha a permissão Visualizador (Viewer) no menu suspenso, desmarque a opção Notificar pessoas, e clique em Compartilhar.

Crie uma tabela externa no BigQuery que aponte para sua fonte do Google Drive

Se você ainda não tem um dataset no BigQuery, crie um.

Em seguida, usando o Console do Google Cloud, crie uma tabela externa dentro do seu dataset do BigQuery que aponte para sua planilha do Google Sheets.

Certifique-se de especificar o URI correto do Drive e o formato do arquivo.

Se ainda não fez, conecte seu Analytics ao seu BigQuery.

Depois de concluir esses passos, será possível fazer perguntas e criar dashboards no Analytics usando uma fonte do Google Drive como seus dados.

Usando Legacy SQL

A partir da versão 0.30.0, o Analytics instrui o BigQuery a interpretar as consultas SQL como Standard SQL (GoogleSQL). Se preferir usar Legacy SQL, você pode informar o Analytics para isso incluindo a diretiva #legacySQL no início da sua consulta, por exemplo:

#legacySQL
SELECT *
FROM [my_dataset.my_table]

Resolução de problemas

Se estiver com problemas na conexão com o BigQuery, você pode consultar este guia de resolução de problemas que cobre questões relacionadas ao BigQuery, este outro sobre conexões de data warehouse, ou visitar o fórum de discussão do Analytics para verificar se alguém enfrentou e resolveu um problema parecido.

Recursos de modelagem

Ainda não há recursos de modelagem disponíveis para BigQuery.

ZONA DE PERIGO

Veja Zona de Perigo.

Leituras adicionais

Leia a documentação para outras versões do Analytics.