Advanced 10 Schritte 1 Tag 60 Guthabenpunkte
Dies ist die erste von zwei Aufgabenreihen mit praxisorientierten Labs, die auf Übungen im Buch Data Science on the Google Cloud Platform von Valliappa Lakshmanan (erschienen bei O'Reilly Media Inc.) basieren. In dieser Aufgabenreihe, die die Kapitel 1 bis 8 abdeckt, üben Sie, Datasets mit Tools und Diensten der Google Cloud Platform aufzunehmen, vorzubereiten, zu verarbeiten, abzufragen, zu analysieren und zu visualisieren.
Voraussetzungen:
This Quest assumes you have access to the O’Reilly book Data Science on the Google Cloud Platform as the labs only include the exercises from the end of each chapter and do not contain the concepts or teaching from the text itself. The labs use Google Cloud Services and Tools for data storage, transformation, and warehousing, so it is recommended that the student also has earned Badges for the Baseline: Data, ML, and AI and the GCP Essentials Quests before beginning.Quest Outline
Einführung in SQL für BigQuery und Cloud SQL
In diesem Lab lernen Sie grundlegende SQL-Klauseln kennen und führen praktische Übungen zu strukturierten Abfragen in BigQuery und Cloud SQL aus.
Daten in die Cloud aufnehmen
In diesem Lab erfahren Sie, wie Sie mithilfe eines Bash-Skripts bestimmte Daten aus einem großen öffentlichen online verfügbaren Dataset herunterladen.
Ingesting Data Into The Cloud Using Google Cloud Functions
This lab demonstrates how to use local Python scripts to retrieve data from the US Bureau of Transport Statistics website, then modify the data so they can be run using Google Cloud Functions.
Daten in Google Cloud SQL laden
In diesem Lab importieren Sie Daten aus CSV-Textdateien in Cloud SQL und führen dann mit einfachen Abfragen grundlegende Datenanalysen aus.
Daten mit Google Data Studio visualisieren
In diesem Lab wird gezeigt, wie Sie mit Google Data Studio Daten visualisieren, die in Google Cloud SQL gespeichert sind.
Daten mit Google Cloud Dataflow verarbeiten
In diesem Lab simulieren Sie ein reales Echtzeit-Dataset mit Verlaufsdaten. Das simulierte Dataset wird aus mehreren Textdateien mithilfe von Python und Google Cloud Dataflow verarbeitet und die simulierten Echtzeitdaten werden in Google BigQuery gespeichert.
Raumbezogene Echtzeitdaten mit Google Data Studio visualisieren
Sie verarbeiten mit Dataflow Echtzeit-Streamingdaten aus einem Dataset mit Verlaufsdaten, speichern die Ergebnisse in BigQuery und visualisieren die raumbezogenen Echtzeitdaten anschließend mit Data Studio.
Daten in BigQuery für eine explorative Datenanalyse nutzen
Sie lernen, wie Sie Textdaten in BigQuery laden. Anschließend verwenden Sie diese Daten für eine schnelle explorative Datenanalyse mit Google Cloud Datalab-Notebooks.
Explorative Datenanalyse mit der AI Platform
Sie erfahren, wie Sie ein in BigQuery gespeichertes Dataset mit der AI Platform analysieren, um Abfragen auszuführen und die Daten mit verschiedenen statistischen Verfahren darzustellen.
Ein Datenmodell evaluieren
Sie erfahren, wie Sie ein Dataset partitionieren: in einen Trainingssatz zum Entwickeln eines Modells und in einen Testsatz, mit dem sich die Genauigkeit des Modells bewerten und Vorhersagemodelle wiederholt und unabhängig evaluieren lassen.