Advanced 10 etapas 1 dia 60 créditos
Esta é a primeira de duas Quests de laboratórios práticos e é derivada dos exercícios do livro Data Science on Google Cloud Platform de Valliappa Lakshmanan, publicado pela O'Reilly Media, Inc. Nesta primeira Quest, que aborda o capítulo 8, você poderá praticar todos os aspectos de ingestão, preparação, processamento, consulta, exploração e visualização de conjuntos de dados usando as ferramentas e os serviços do Google Cloud Platform.
Pré-requisitos:
This Quest assumes you have access to the O’Reilly book Data Science on the Google Cloud Platform as the labs only include the exercises from the end of each chapter and do not contain the concepts or teaching from the text itself. The labs use Google Cloud Services and Tools for data storage, transformation, and warehousing, so it is recommended that the student also has earned Badges for the Baseline: Data, ML, and AI and the GCP Essentials Quests before beginning.Quest Outline
Introdução ao SQL para BigQuery e Cloud SQL
Neste laboratório, você aprenderá sobre as cláusulas básicas do SQL e executará consultas estruturadas no BigQuery e no Cloud SQL.
Como fazer a ingestão de dados na nuvem
Neste laboratório, você aprenderá a usar um script bash para fazer o download de dados selecionados de um grande conjunto de dados público disponível na Internet.
Ingesting Data Into The Cloud Using Google Cloud Functions
This lab demonstrates how to use local Python scripts to retrieve data from the US Bureau of Transport Statistics website, then modify the data so they can be run using Google Cloud Functions.
Como carregar dados no Google Cloud SQL
Neste laboratório, você importará dados de arquivos de texto CSV para o Cloud SQL e fará algumas análises de dados básicas usando consultas simples.
Como visualizar dados com o Google Data Studio
Este laboratório explica como usar o Google Data Studio para visualizar dados armazenados no Google Cloud SQL.
Processar dados com o Google Cloud Dataflow
Neste laboratório, você simulará um conjunto de dados em tempo real com base em informações históricas. A simulação será processada com arquivos de texto em Python e o Google Cloud Dataflow. Os dados resultantes serão armazenados no Google BigQuery.
Visualizar dados geoespaciais em tempo real com o Google Data Studio
Use o Google Dataflow para processar dados de streaming em tempo real com um conjunto de dados históricos do mundo real, armazene os resultados no Google BigQuery e visualize dados geoespaciais em tempo real no Google Data Studio.
Como carregar dados no BigQuery para fazer análises exploratórias
Você aprenderá a carregar dados de texto no BigQuery e usá-los para fazer análises exploratórias rápidas com notebooks do Google Cloud Datalab.
Análise exploratória de dados com o AI Platform
Aprenda o processo de análise de um conjunto de dados armazenado no BigQuery usando o AI Platform para fazer consultas e apresentar os dados por meio de várias técnicas de plotagem estatística.
Como avaliar modelos de dados
Aprenda a realizar o processo de particionamento para dividir um conjunto de dados em duas partes: um conjunto de treinamento para desenvolver um modelo e um conjunto de teste para avaliar a acurácia do modelo. Depois avalie modelos preditivos de maneira independente e reproduzível.