menu
arrow_back

Processamento distribuído de imagens no Cloud Dataproc

Processamento distribuído de imagens no Cloud Dataproc

1 hora 7 créditos

GSP010

Laboratórios autoguiados do Google Cloud

Visão geral

Neste laboratório prático, você aprenderá a usar o Apache Spark no Cloud Dataproc para distribuir uma tarefa de processamento de imagens com alta demanda computacional em um cluster de máquinas. Este laboratório faz parte de uma série de laboratórios sobre processamento de dados científicos.

O que você aprenderá

  • Como criar um cluster gerenciado do Cloud Dataproc com o Apache Spark pré-instalado

  • Como criar e executar jobs que usam pacotes externos que não estão instalados no cluster

  • Como encerrar o cluster

Pré-requisitos

Este é um laboratório de nível avançado. Recomendamos ter experiência com o Cloud Dataproc e o Apache Spark, mas isso não é obrigatório. Para aprender a usar esses serviços, confira os laboratórios a seguir:

Depois, role para baixo para conhecer melhor os serviços que você usará no laboratório.

Participe do Qwiklabs para ler o restante deste laboratório e muito mais!

  • Receber acesso temporário a Console do Google Cloud.
  • Mais de 200 laboratórios, do nível iniciante ao avançado.
  • Tamanho compacto para que você possa aprender no seu próprio ritmo.
Participe para iniciar este laboratório
Pontuação

—/30

Create a development machine in Compute Engine

Executar etapa

/ 5

Install Software in the development machine

Executar etapa

/ 5

Create a GCS bucket

Executar etapa

/ 5

Download some sample images into your bucket

Executar etapa

/ 5

Create a Cloud Dataproc cluster

Executar etapa

/ 5

Submit your job to Cloud Dataproc

Executar etapa

/ 5