arrow_back

Uzyskiwanie statystyk z danych BigQuery: Challenge Lab

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Uzyskiwanie statystyk z danych BigQuery: Challenge Lab

Lab 1 godz. 30 godz. universal_currency_alt Punkty: 5 show_chart Średnio zaawansowany
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP787

Moduły Google Cloud do samodzielnego ukończenia

Opis

Przed Tobą seria zadań, które należy wykonać w określonym czasie. Zamiast szczegółowych instrukcji otrzymasz scenariusz i zestaw zadań. Musisz rozwiązać je samodzielnie. Automatyczny system oceniania (widoczny na tej stronie) poinformuje Cię, czy zadanie zostało wykonane poprawnie.

Aby zdobyć 100% punktów, musisz ukończyć wszystkie zadania w określonym czasie.

W Challenge Lab (module-wyzwaniu) nie będziemy uczyć Cię pojęć związanych z Google Cloud. Aby rozwiązać zadania, użyj umiejętności nabytych w poszczególnych modułach szkolenia, którego częścią jest to wyzwanie. Podczas wykonywania zadań rozwiniesz swoje umiejętności i będziesz mieć okazję do naprawienia błędów w zapytaniach.

Ten moduł przeznaczony jest dla użytkowników zapisanych na szkolenie Derive Insights from BigQuery Data, które pozwala zdobyć odznakę umiejętności. Podejmujesz się wyzwania?

Konfiguracja i wymagania

Zanim klikniesz przycisk Rozpocznij moduł

Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.

W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.

Do ukończenia modułu potrzebne będą:

  • dostęp do standardowej przeglądarki internetowej (zalecamy korzystanie z przeglądarki Chrome).
Uwaga: uruchom ten moduł w oknie incognito lub przeglądania prywatnego. Dzięki temu unikniesz konfliktu między swoim kontem osobistym a kontem do nauki, co mogłoby spowodować naliczanie oddatkowych opłat na koncie osobistym.
  • Odpowiednia ilość czasu na ukończenie modułu – pamiętaj, że gdy rozpoczniesz, nie możesz go wstrzymać.
Uwaga: jeśli masz już osobiste konto lub projekt w Google Cloud, nie używaj go w tym module, aby uniknąć naliczania opłat na koncie.

Scenariusz

Należysz do organizacji zajmującej się zdrowiem publicznym, której zadaniem jest znalezienie odpowiedzi na zapytania dotyczące pandemii COVID-19. Uzyskanie właściwych danych pomoże organizacji w odpowiednim zaplanowaniu i ukierunkowaniu działań w zakresie ochrony zdrowia oraz tworzenia programów mających na celu szerzenie wiedzy.

Zbiór danych oraz tabela, które zostaną wykorzystane do analizy, to bigquery-public-data.covid19_open_data.covid19_open_data. To repozytorium zawiera zbiory danych dotyczących COVID-19 na całym świecie w postaci dziennych ciągów czasowych na poziomie kraju. Znajdują się tu dane z zakresu demografii, ekonomii, epidemiologii, geografii, zdrowia, hospitalizacji, mobilności, reakcji rządu oraz pogody.

Zadanie 1. Łączna liczba potwierdzonych przypadków

  • Utwórz zapytanie, dzięki któremu dowiesz się, jaka była łączna liczba potwierdzonych przypadków . Zapytanie musi wyświetlić jeden wiersz z sumą potwierdzonych przypadków we wszystkich krajach. Kolumna powinna mieć nazwę total_cases_worldwide.

Kolumny, do których należy się odnieść:

  • cumulative_confirmed
  • date

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Łączna liczba potwierdzonych przypadków

Zadanie 2. Obszary najbardziej dotknięte pandemią

  • Utwórz zapytanie, dzięki któremu dowiesz się, w ilu stanach USA odnotowano ponad  zgonów. Zapytanie musi wyświetlić wyniki w polu count_of_states.
Uwaga: nie uwzględniaj wartości NULL.

Kolumny, do których należy się odnieść:

  • country_name
  • subregion1_name (w przypadku informacji o stanie)
  • cumulative_deceased

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Obszary najbardziej dotknięte pandemią

Zadanie 3. Ogniska zakażeń

  • Utwórz zapytanie, dzięki któremu wyświetlone zostaną wszystkie stany USA, w których liczba potwierdzonych przypadków wyniosła ponad . Zwrócone wyniki powinny składać się z nazwy stanów i odpowiadających im liczb potwierdzonych przypadków oraz zostać przedstawione w porządku malejącym. Nazwy pól, w których powinny wyświetlić się wyniki, to odpowiednio state (stan) i total_confirmed_cases (łączna liczba potwierdzonych przypadków).

Kolumny, do których należy się odnieść:

  • country_code
  • subregion1_name (w przypadku informacji o stanie)
  • cumulative_confirmed

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Ogniska zakażeń

Zadanie 4. Wskaźnik śmiertelności

  1. Utwórz zapytanie, dzięki któremu dowiesz się, jaki był wskaźnik śmiertelności we Włoszech w 2020 r. (). Wskaźnik śmiertelności oblicza się w następujący sposób: (łączna liczba zgonów / łączna liczba potwierdzonych przypadków) × 100.
  2. Utwórz zapytanie umożliwiające określenie wskaźnika na 2020 r. i zawierające pola total_confirmed_cases, total_deaths oraz case_fatality_ratio.

Kolumny, do których należy się odnieść:

  • country_name
  • cumulative_confirmed
  • cumulative_deceased

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Wskaźnik śmiertelności

Zadanie 5. Konkretne daty

  • Utwórz zapytanie, dzięki któremu dowiesz się, w których dniach łączna liczba zgonów we Włoszech przekroczyła . Wynik powinien zawierać daty w formacie rrrr-mm-dd.

Kolumny, do których należy się odnieść:

  • country_name
  • cumulative_deceased

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Konkretne daty

Zadanie 6. Liczba dni, w których nie stwierdzono nowych przypadków

Zapytanie ma zwrócić liczbę dni z przedziału czasowego  – , w których nie stwierdzono żadnych nowych przypadków zakażenia w Indiach. Zapytanie nie działa jednak poprawnie.

  • Aby otrzymać oczekiwany wynik, musisz je zaktualizować:
WITH india_cases_by_date AS ( SELECT date, SUM(cumulative_confirmed) AS cases FROM `bigquery-public-data.covid19_open_data.covid19_open_data` WHERE country_name="India" AND date between '{{{project_0.startup_script.start_date_india_code}}}' and '{{{project_0.startup_script.close_date_india_code}}}' GROUP BY date ORDER BY date ASC ) , india_previous_day_comparison AS (SELECT date, cases, LAG(cases) OVER(ORDER BY date) AS previous_day, cases - LAG(cases) OVER(ORDER BY date) AS net_new_cases FROM india_cases_by_date )

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Liczba dni, w których nie stwierdzono nowych przypadków

Zadanie 7. Wskaźnik podwajania się liczby przypadków

  • Wykorzystując poprzednie zapytanie jako szablon, utwórz zapytanie pozwalające wskazać dni z przedziału czasowego 22 marca – 20 kwietnia 2020 r., w których liczba potwierdzonych przypadków w USA wzrosła o ponad % w stosunku do dnia poprzedniego (co oznacza podwojenie się liczby przypadków na przestrzeni ~ 7 dni). Zwrócony wynik powinien przyjąć postać listy zawierającej daty, liczby przypadków potwierdzonych w danym dniu oraz liczby przypadków potwierdzonych w dniu poprzednim, a także dane na temat procentowego wzrostu liczby przypadków pomiędzy tymi dniami.

    • Pola z wynikami nazwij następująco: Date (Data), Confirmed_Cases_On_Day (Liczba przypadków potwierdzonych danego dnia), Confirmed_Cases_Previous_Day (Liczba przypadków potwierdzonych poprzedniego dnia) i Percentage_Increase_In_Cases (Procentowy wzrost liczby przypadków).

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Wskaźnik podwajania się liczby przypadków

Zadanie 8. Wskaźnik ozdrowień

  1. Utwórz zapytanie, które zwróci listę wskaźników ozdrowień dla  krajów przedstawioną w porządku malejącym (dane mają odzwierciedlać stan do 10 maja 2020 r.).

  2. W zapytaniu uwzględnij tylko te kraje, w których liczba potwierdzonych przypadków przekroczyła 50 tysięcy.

    • Zapytanie powinno zwrócić wyniki w następujących polach: country (kraj), recovered_cases (liczba ozdrowień), confirmed_cases (liczba potwierdzonych przypadków), recovery_rate (wskaźnik ozdrowień).

Kolumny, do których należy się odnieść:

* country_name * cumulative_confirmed * cumulative_recovered

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Wskaźnik ozdrowień

Zadanie 9. Skumulowany dzienny wskaźnik wzrostu (CDGR)

  • Kolejne zapytanie ma pomóc określić CDGR (Cumulative Daily Growth Rate, skumulowany dzienny wskaźnik wzrostu) dla Francji, liczony od dnia zgłoszenia pierwszego przypadku (wynik powinien odzwierciedlać stan z ). Pierwszy przypadek odnotowano tam 24 stycznia 2020 r.

  • CDGR obliczymy w następujący sposób:

((last_day_cases/first_day_cases)^1/days_diff)-1)

Gdzie:

  • last_day_cases to łączna liczba potwierdzonych przypadków według stanu na 10 maja 2020 r.,

  • first_day_cases to liczba przypadków potwierdzonych 24 stycznia 2020 r.,

  • days_diff to liczba dni między 24 stycznia a 10 maja 2020 r.

  • Zapytanie nie działa prawidłowo. Czy potrafisz naprawić błąd?

WITH france_cases AS ( SELECT date, SUM(cumulative_confirmed) AS total_cases FROM `bigquery-public-data.covid19_open_data.covid19_open_data` WHERE country_name="France" AND date IN ('2020-01-24', '{{{project_0.startup_script.date_code}}}') GROUP BY date ORDER BY date) , summary as ( SELECT total_cases AS first_day_cases, LEAD(total_cases) AS last_day_cases, DATE_DIFF(LEAD(date) OVER(ORDER BY date),date, day) AS days_diff FROM france_cases LIMIT 1 ) select first_day_cases, last_day_cases, days_diff, SQRT((last_day_cases/first_day_cases),(1/days_diff))-1 as cdgr from summary Uwaga: aby dowiedzieć się więcej o funkcji SQL `LEAD()`, zapoznaj się z dokumentacją funkcji, operatorów i warunków (w języku angielskim).

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Skumulowany dzienny wskaźnik wzrostu (CDGR)

Zadanie 10. Tworzenie raportu w Looker Studio

  • Looker Studio utwórz raport dotyczący Stanów Zjednoczonych, który zawiera następujące informacje:

    • liczba potwierdzonych przypadków,
    • liczba zgonów,
    • zakres dat: .

Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło. Utworzenie raportu w Looker Studio

Uwaga: podczas tworzenia raportu wspomóż się przedstawionym niżej wykresem i postaraj się, aby Twój raport był z nim zgodny. Uwaga: nie używaj opcji BigQuery Przeglądaj w Looker Studio.

wykres liniowy

Gratulacje!

Odznaka ze szkolenia Derive Insights from BigQuery Data Badge

Zdobądź kolejną odznakę umiejętności

Ten moduł do samodzielnego ukończenia jest częścią szkolenia Derive Insights from BigQuery Data, które pozwala zdobyć odznakę umiejętności. Za ukończenie szkolenia otrzymujesz widoczną powyżej odznakę – stanowi ona potwierdzenie Twojego osiągnięcia. Pochwal się nią w swoim CV i mediach społecznościowych, oznaczając swoje osiągnięcie hashtagiem #GoogleCloudBadge.

Ta odznaka umiejętności jest częścią ścieżki szkoleniowej Google Data Analyst. Jeśli udało Ci się już zdobyć pozostałe odznaki umiejętności dostępne w tej ścieżce szkoleniowej, sprawdź katalog Google Cloud Skills Boost, w którym czeka na Ciebie więcej takich odznak.

Szkolenia i certyfikaty Google Cloud

…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.

Ostatnia aktualizacja instrukcji: 25 marca 2024 r.

Ostatni test modułu: 26 września 2023 r.

Copyright 2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.