arrow_back

API Google Cloud Speech: Qwik Start

Partecipa Accedi
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

API Google Cloud Speech: Qwik Start

Lab 30 minuti universal_currency_alt 1 credito show_chart Introduttivi
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP119

Laboratori autogestiti Google Cloud

Panoramica

L'API Google Cloud Speech permette di integrare facilmente le tecnologie Google per il riconoscimento vocale nelle applicazioni degli sviluppatori. L'API Speech consente di inviare audio e ricevere una trascrizione del testo dal servizio. Per saperne di più, vedi la documentazione sull'API Google Cloud Speech

Obiettivi didattici

In questo lab svolgerai le seguenti attività per configurare e utilizzare l'API Speech:

  • Creare una chiave API
  • Creare una richiesta di API Speech
  • Chiamare la richiesta di API Speech

Configurazione e requisiti

Prima di fare clic sul pulsante Avvia lab

Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.

Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.

Per completare il lab, avrai bisogno di:

  • Accesso a un browser internet standard (Chrome è il browser consigliato).
Nota: utilizza una finestra del browser in incognito o privata per eseguire questo lab. Ciò evita eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
  • È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarlo per questo lab per evitare addebiti aggiuntivi al tuo account.

Dopo aver avviato il lab, potrai accedere alla console Google Cloud.

Come avviare il lab e accedere alla console Google Cloud

  1. Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:

    • Pulsante Apri console Google
    • Tempo rimanente
    • Credenziali temporanee da utilizzare per il lab
    • Altre informazioni per seguire questo lab, se necessario
  2. Fai clic su Apri console Google. Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.

    Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.

    Note: se visualizzi la finestra di dialogo Scegli un account, fai clic su Utilizza un altro account.
  3. Se necessario, copia il Nome utente dal riquadro Dettagli lab e incollalo nella finestra di dialogo di accesso. Fai clic su Avanti.

  4. Copia la Password dal riquadro Dettagli lab e incollala nella finestra di dialogo di benvenuto. Fai clic su Avanti.

    Importante: devi utilizzare le credenziali presenti nel riquadro di sinistra. Non utilizzare le tue credenziali Google Cloud Skills Boost. Nota: utilizzare il tuo account Google Cloud per questo lab potrebbe comportare addebiti aggiuntivi.
  5. Fai clic nelle pagine successive:

    • Accetta i termini e le condizioni.
    • Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
    • Non registrarti per le prove gratuite.

Dopo qualche istante, la console Google Cloud si apre in questa scheda.

Nota: puoi visualizzare il menu con un elenco di prodotti e servizi Google Cloud facendo clic sul menu di navigazione in alto a sinistra. Icona menu di navigazione

Attività 1: crea una chiave API

Poiché utilizzerai curl per inviare una richiesta all'API Speech, devi generare una chiave API che dovrai passare nell'URL della richiesta.

  1. Per creare una chiave API, fai clic su menu di navigazione > API e servizi > Credenziali.

  2. Quindi fai clic su Crea credenziali.

  3. Seleziona Chiave API dal menu a discesa.

  4. Copia la chiave appena generata e fai clic su Chiudi.

Fai clic su Controlla i miei progressi per verificare l'obiettivo.

Crea una chiave API

Ora che hai una chiave API, salvala come variabile di ambiente per evitare di doverne inserirne il valore in ogni richiesta.

Per eseguire i passaggi successivi, connettiti utilizzando SSH all'istanza di cui è stato effettuato il provisioning.

  1. Nel men di navigazione, seleziona Compute Engine. Vedrai la voce linux-instance nella finestra Istanze VM.

  2. Fai clic sul pulsante SSHin corrispondenza di linux-instance. Si aprirà una shell interattiva.

  3. Nella riga di comando, inserisci il comando seguente sostituendo <YOUR_API_KEY> con la chiave API che hai appena copiato da quanto generato in precedenza:

export API_KEY=<YOUR_API_KEY>

Rimani in questa sessione SSH per il resto del lab.

Attività 2: crea una richiesta di API Speech

Nota: utilizzerai un file pre-registrato disponibile in Cloud Storage: gs://cloud-samples-tests/speech/brooklyn.flac. Ascolta il file audio prima di inviarlo all'API Speech.
  1. Crea il file request.json nella riga di comando di SSH. Utilizzerai questo file per creare la tua richiesta all'API Speech:
touch request.json
  1. Apri request.json:
nano request.json Nota: puoi utilizzare il tuo editor della riga di comando preferito (nano, vim, emacs) o gcloud. Le istruzioni in questo lab sono per nano.
  1. Aggiungi quanto segue al file request.json utilizzando il valore dell'uri del file audio RAW di esempio:
{ "config": { "encoding":"FLAC", "languageCode": "en-US" }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }
  1. Premi Ctrl + x, quindi y per salvare e fai clic su Invio per chiudere il file request.json.

Il corpo della richiesta contiene un oggetto config e un oggetto audio.

In config, indichi all'API Speech come elaborare la richiesta. Il parametro encoding indica all'API quale tipo di codifica audio viene utilizzato durante l'invio del file all'API. FLAC è il tipo di codifica per i file .raw. Scopri di più sui tipi di codifica nella Guida a RecognitionConfig.

Esistono altri parametri che puoi aggiungere all'oggetto config, ma encoding è l'unico obbligatorio.

Nell'oggetto audio, passi all'API l'URI del file audio in Cloud Storage.

Fai clic su Controlla i miei progressi per verificare l'obiettivo.

Crea una richiesta di API Speech

A questo punto puoi chiamare l'API Speech.

Attività 3: chiama l'API Speech

  1. Utilizza il seguente comando curl (tutto in un'unica riga di comando) per passare all'API il corpo della richiesta insieme alla variabile d'ambiente della chiave API:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}"

La risposta dovrebbe avere un aspetto simile al seguente:

{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }

Il valore transcript restituirà la trascrizione del testo del file audio eseguita dall'API Speech e il valore confidence indica in che misura l'API è sicura di aver trascritto l'audio in modo accurato.

Noterai che la richiesta precedente conteneva una chiamata al metodo syncrecognize. L'API Speech supporta la trascrizione sincrona e asincrona della conversione della voce in testo. In questo esempio è stato inviato un file audio completo, ma puoi usare anche il metodo syncrecognize per eseguire una trascrizione della voce in testo in streaming mentre l'utente sta ancora parlando.

Hai creato una richiesta all'API Speech e quindi hai chiamato l'API Speech.

  1. Esegui il comando seguente per salvare la risposta in un file result.json:
curl -s -X POST -H "Content-Type: application/json" --data-binary @request.json \ "https://speech.googleapis.com/v1/speech:recognize?key=${API_KEY}" > result.json

Fai clic su Controlla i miei progressi per verificare l'obiettivo.

Chiama l'API Speech

Complimenti!

Il self-paced lab API Google Cloud Speech: Qwik Start si conclude qui. Hai integrato il riconoscimento vocale in un'app, quindi hai generato la trascrizione dal servizio.

Completa la Quest

Questo self-paced lab fa parte delle Quest Baseline: Data, ML, AI e Intro to ML: Language Processing. Una Quest è una serie di lab collegati tra loro che formano un percorso di apprendimento. Il completamento di una Quest ti permette di ottenere un badge come riconoscimento dell'obiettivo raggiunto. Puoi rendere pubblici i tuoi badge inserendone i link nel tuo CV online o sui social media. Iscriviti a una delle Quest contenenti il lab e ricevi un riconoscimento subito dopo averlo completato. Per vedere tutte le Quest disponibili, consulta il catalogo.

Segui il prossimo lab

Questo lab fa anche parte di una serie di lab chiamata Qwik Starts, pensata per offrirti un piccolo assaggio delle diverse funzionalità disponibili in Google Cloud. Cerca "Qwik Starts" nel catalogo dei lab per trovare il prossimo lab da seguire.

Passaggi successivi/Scopri di più

Formazione e certificazione Google Cloud

… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.

Ultimo aggiornamento del manuale: 15 settembre 2023

Ultimo test del lab: 13 ottobre 2023

Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.