Guida introduttiva: Installare Speech SDK

Documentazione di riferimento | Pacchetto (NuGet) | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per C#.

Gli esempi di codice nella documentazione sono scritti in C# 8 ed eseguiti in .NET Standard 2.0.

Requisiti di piattaforma

Speech SDK per C# è compatibile con Windows, Linux e macOS.

Speech SDK per C# supporta solo le distribuzioni seguenti nelle architetture x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Usare la versione LTS più recente della distribuzione Linux. Ad esempio, se si usa Ubuntu 20.04 LTS, usare la versione più recente di Ubuntu 20.04.X.

Speech SDK dipende dalle seguenti librerie di sistema Linux:

  • Le raccolte condivise della Libreria GNU C (inclusa la libreria di Programmazione thread POSIX, libpthreads).
  • Libreria OpenSSL, versione 1.x (libssl1) o 3.x (libssl3) e certificati (ca-certificates).
  • La libreria condivisa per le applicazioni ALSA (libasound2).

Eseguire i comandi seguenti:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installare Speech SDK per C#

Speech SDK per C# è disponibile come pacchetto NuGet e implementa .NET Standard 2.0. Per ulteriori informazioni, consultare Microsoft.CognitiveServices.Speech.

Speech SDK per C# può essere installato tramite l’interfaccia della riga di comando di .NET con il comando seguente dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

È possibile seguire queste guide per altre opzioni.

Questa guida spiega come installare Speech SDK per una applicazione console .NET Framework (Windows).

Questa guida richiede:

Creare un progetto di Visual Studio e installare Speech SDK

Procedere all'installazione del pacchetto NuGet Speech SDK per potervi fare riferimento nel codice. A tale scopo, è prima di tutto necessario creare un progetto helloworld. Se si dispone già di un progetto con il carico di lavoro .NET desktop development disponibile, è possibile usare quel progetto e passare a Usare NuGet Package Manager per installare Speech SDK.

Creazione di un progetto helloworld

  1. Aprire Visual Studio.

  2. In Attività iniziali, selezionare Crea un nuovo progetto.

  3. In Crea un nuovo progetto, scegliere App console (.NET Framework), quindi selezionare Avanti.

  4. In Configura nuovo progetto per Nome progetto, immettere helloworld, scegliere o creare il percorso della directory in Percorso e quindi selezionare Crea.

  5. Dalla barra dei menu di Visual Studio, selezionare Strumenti>Ottieni strumenti e funzionalità. Questo passaggio apre il Programma di installazione di Visual Studio e visualizza la finestra di dialogo Modifica.

  6. Assicurarsi che il carico di lavoro di Sviluppo per desktop .NET sia disponibile. Se il carico di lavoro non è installato, selezionarlo e quindi selezionare Modifica per avviare l'installazione. Il download e l'installazione possono richiedere alcuni minuti.

    Se lo sviluppo desktop .NET è già selezionato, selezionare Chiudi per chiudere la finestra di dialogo.

    Screenshot che mostra l'abilitazione dello sviluppo di applicazioni desktop .NET.

  7. Chiudere il Programma di installazione di Visual Studio.

Usare NuGet Package Manager per installare Speech SDK

  1. In Esplora soluzioni, fare clic con il pulsante destro del mouse sul progetto helloworld e quindi scegliere Gestisci pacchetti NuGet per visualizzare Gestione pacchetti NuGet.

  2. Nell'angolo in alto a destra individuare la casella a discesa Origine dei pacchetti e assicurarsi che sia selezionata l'opzione nuget.org.

    Screenshot che mostra Gestione pacchetti NuGet.

  3. Nell'angolo in alto a sinistra fare clic su Sfoglia.

  4. Nella casella di ricerca digitare Microsoft.CognitiveServices.Speech e premere INVIO.

  5. Nei risultati della ricerca selezionare il pacchetto Microsoft.CognitiveServices.Speech e quindi selezionare Installa per installare la versione stabile più recente.

    Screenshot che mostra l’installazione del pacchetto NuGet Microsoft.CognitiveServices.Speech.

  6. Accettare tutti i contratti e le licenze per avviare l'installazione.

    Dopo aver installato il pacchetto, viene visualizzato un messaggio di conferma nella finestra della Console di Gestione pacchetti.

Scegliere l'architettura di destinazione

Per compilare ed eseguire l'applicazione console, creare una configurazione della piattaforma che corrisponda all'architettura del computer.

  1. Dal menu, selezionare Compila>Gestione configurazione. Verrà visualizzata finestra di dialogo Gestione configurazione.

  2. Nella casella a discesa Piattaforma soluzione attiva selezionare Nuova. Verrà visualizzata la finestra di dialogo Nuova piattaforma soluzione.

    Screenshot che mostra la finestra di dialogo Gestione configurazione.

  3. Nella casella a discesa Digitare o selezionare la nuova piattaforma:

    • Se è in esecuzione Windows a 64 bit, selezionare x64.
    • Se è in esecuzione Windows a 32 bit, selezionare x86.
  4. Fare clic su OK e quindi su Chiudi.

Documentazione di riferimento | Pacchetto (NuGet) | Altri esempi in GitHub

In questa guida introduttiva si installerà lo Speech SDK per C++.

Requisiti di piattaforma

Speech SDK per C++ è compatibile con Windows, Linux e macOS.

Speech SDK per C++ supporta solo le distribuzioni seguenti nelle architetture x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Usare la versione LTS più recente della distribuzione Linux. Ad esempio, se si usa Ubuntu 20.04 LTS, usare la versione più recente di Ubuntu 20.04.X.

Speech SDK dipende dalle seguenti librerie di sistema Linux:

  • Le raccolte condivise della Libreria GNU C (inclusa la libreria di Programmazione thread POSIX, libpthreads).
  • Libreria OpenSSL, versione 1.x (libssl1) o 3.x (libssl3) e certificati (ca-certificates).
  • La libreria condivisa per le applicazioni ALSA (libasound2).

Eseguire i comandi seguenti:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installare Speech SDK per C++

Speech SDK per C++ è disponibile come pacchetto NuGet. Per ulteriori informazioni, consultare Microsoft.CognitiveServices.Speech.

Speech SDK per C++ può essere installato dall'interfaccia della riga di comando di .NET con il comando seguente dotnet add:

dotnet add package Microsoft.CognitiveServices.Speech

È possibile seguire queste guide per altre opzioni.

Questa guida spiega come installare Speech SDK per Linux.

Usare la seguente procedura per scaricare e installare SDK. I passaggi includono il download delle librerie e dei file di intestazione necessari come file .tar.

  1. Scegliere una directory per i file Speech SDK. Impostare la variabile di ambiente SPEECHSDK_ROOT in modo che punti a tale directory. La variabile semplifica il riferimento alla directory nei comandi futuri.

    Per usare la directory speechsdk nella home directory, eseguire il seguente comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Creare la directory se non esiste:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Scaricare ed estrarre l'archivio .tar.gz contenente i file binari di Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Convalidare il contenuto della directory di primo livello del pacchetto estratto:

    ls -l "$SPEECHSDK_ROOT"
    

    L'elenco di directory deve contenere le note dei partner e i file di licenza. L'elenco deve includere anche una directory che contenga file di intestazione (.h) e una directory lib che contenga librerie per arm32, arm64, x64 e x86.

    Percorso Descrizione
    license.md Licenza
    ThirdPartyNotices.md Comunicazioni dei partner
    REDIST.txt Avviso di ridistribuzione
    include File di intestazione necessari per C++
    lib/arm32 Libreria nativa per ARM32 necessaria per collegare l'applicazione
    lib/arm64 Libreria nativa per ARM64 necessaria per collegare l'applicazione
    lib/x64 Libreria nativa per x64 necessaria per collegare l'applicazione
    lib/x86 Libreria nativa per x86 necessaria per collegare l'applicazione

Documentazione di riferimento | Pacchetto (Go) | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per Go.

Requisiti di piattaforma

Speech SDK per Go supporta le seguenti distribuzioni nell'architettura x64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Importante

Usare la versione LTS più recente della distribuzione Linux. Ad esempio, se si usa Ubuntu 20.04 LTS, usare la versione più recente di Ubuntu 20.04.X.

Speech SDK dipende dalle seguenti librerie di sistema Linux:

  • Le raccolte condivise della Libreria GNU C (inclusa la libreria di Programmazione thread POSIX, libpthreads).
  • Libreria OpenSSL, versione 1.x (libssl1) o 3.x (libssl3) e certificati (ca-certificates).
  • La libreria condivisa per le applicazioni ALSA (libasound2).

Eseguire i comandi seguenti:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installare il file binario Go versione 1.13 o successive.

Installare Speech SDK per Go

Usare la seguente procedura per scaricare e installare SDK. I passaggi includono il download delle librerie e dei file di intestazione necessari come file .tar.

  1. Scegliere una directory per i file Speech SDK. Impostare la variabile di ambiente SPEECHSDK_ROOT in modo che punti a tale directory. La variabile semplifica il riferimento alla directory nei comandi futuri.

    Per usare la directory speechsdk nella home directory, eseguire il seguente comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Creare la directory se non esiste:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Scaricare ed estrarre l'archivio .tar.gz contenente i file binari di Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Convalidare il contenuto della directory di primo livello del pacchetto estratto:

    ls -l "$SPEECHSDK_ROOT"
    

    L'elenco di directory deve contenere le note dei partner e i file di licenza. L'elenco deve includere anche una directory che contenga file di intestazione (.h) e una directory lib che contenga librerie per arm32, arm64, x64 e x86.

    Percorso Descrizione
    license.md Licenza
    ThirdPartyNotices.md Comunicazioni dei partner
    REDIST.txt Avviso di ridistribuzione
    include File di intestazione necessari per C++
    lib/arm32 Libreria nativa per ARM32 necessaria per collegare l'applicazione
    lib/arm64 Libreria nativa per ARM64 necessaria per collegare l'applicazione
    lib/x64 Libreria nativa per x64 necessaria per collegare l'applicazione
    lib/x86 Libreria nativa per x86 necessaria per collegare l'applicazione

Configurare l'ambiente Go

I seguenti passaggi consentono all'ambiente Go di trovare Speech SDK.

  1. Poiché i binding si basano su cgo, è necessario impostare le variabili di ambiente in modo che Go possa trovare l'SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Importante

    Sostituire <architecture> con l'architettura del processore della CPU: x64, arm32 o arm64.

  2. Per eseguire applicazioni e SDK, indicare al sistema operativo dove trovare le librerie.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Importante

    Sostituire <architecture> con l'architettura del processore della CPU: x64, arm32 o arm64.

Documentazione di riferimento | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per Java.

Requisiti di piattaforma

Scegliere l'ambiente di destinazione:

Speech SDK per Java è compatibile con Windows, Linux e macOS.

Speech SDK per Java supporta le seguenti distribuzioni nelle architetture x64, ARM32 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Usare la versione LTS più recente della distribuzione Linux. Ad esempio, se si usa Ubuntu 20.04 LTS, usare la versione più recente di Ubuntu 20.04.X.

Speech SDK dipende dalle seguenti librerie di sistema Linux:

  • Le raccolte condivise della Libreria GNU C (inclusa la libreria di Programmazione thread POSIX, libpthreads).
  • Libreria OpenSSL, versione 1.x (libssl1) o 3.x (libssl3) e certificati (ca-certificates).
  • La libreria condivisa per le applicazioni ALSA (libasound2).

Eseguire i comandi seguenti:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installare un Development Kit di Java, come Azul Zulu OpenJDK. Microsoft Build di OpenJDK o il proprio JDK di scelta dovrebbero funzionare allo stesso modo.

Installare Speech SDK per Java

Alcune delle istruzioni usano una versione specifica dell'SDK, ad esempio 1.24.2. Per controllare la versione più recente, effettuare una ricerca sul repository GitHub.

Scegliere l'ambiente di destinazione:

Questa guida spiega come installare Speech SDK per Java sul Runtime Java.

Sistemi operativi supportati

Il pacchetto Speech SDK di Java è disponibile per i seguenti sistemi operativi:

Seguire questa procedura per installare Speech SDK per Java usando Apache Maven:

  1. Installare Apache Maven.

  2. Aprire un prompt dei comandi dove si vuole il nuovo progetto e creare un nuovo file pom.xml.

  3. Copiare il seguente contenuto XML in pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.40.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Eseguire il seguente comando Maven per installare Speech SDK e le relative dipendenze.

    mvn clean dependency:copy-dependencies
    

Documentazione di riferimento | Pacchetto (npm) | Altri esempi in GitHub | Codice sorgente della libreria

In questa guida introduttiva, si installerà lo Speech SDK per JavaScript.

Speech SDK per JavaScript è disponibile come pacchetto npm. Consultare microsoft-cognitiveservices-speech-sdk e il repository GitHub complementare cognitive-services-speech-sdk-js.

Requisiti di piattaforma

Comprendere le implicazioni di architettura tra Node.js e web browser client. Ad esempio, il Document Object Model (DOM) non è disponibile per le applicazioni del lato server. Il file system Node.js non è disponibile per le applicazioni del lato client.

Installare Speech SDK per JavaScript

A seconda dell'ambiente di destinazione, usare una delle guide seguenti:

Questa guida spiega come installare Speech SDK per JavaScript per l'uso con Node.js.

  1. Installare Node.js.

  2. Creare una nuova directory, eseguire npm init ed esaminare i prompt.

  3. Per installare Speech SDK per JavaScript, eseguire il seguente comando npm install:

    npm install microsoft-cognitiveservices-speech-sdk
    

Per ulteriori informazioni, vedere gli esempi di Node.js.

Usare Speech SDK

  • Aggiungere la seguente istruzione di importazione per usare Speech SDK nel progetto JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Per ulteriori informazioni su import, consultare Esportazione e importazione nel sito Web JavaScript.

In alternativa, è possibile usare un'istruzione di richiesta:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Documentazione di riferimento | Pacchetto (download) | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per Objective-C.

Suggerimento

Per ulteriori informazioni sull'uso di Speech SDK per Swift, consultare Importazione di Objective-C in Swift.

Installare Speech SDK per Objective-C

Speech SDK per Objective-C è disponibile in modo nativo come pacchetto CocoaPod per Mac x64 e sistemi basati su ARM.

Requisiti di sistema per Mac:

  • macOS versione 10.14 o successive

Il pacchetto macOS CocoaPod è disponibile per il download e l'uso con l'ambiente di sviluppo integrato (IDE) Xcode 9.4.1 o versioni successive.

  1. Passare alla directory Xcode in cui si trova il file di progetto .xcodeproj.

  2. Eseguire pod init per creare un file pod denominato Podfile.

  3. Sostituire il contenuto di Podfile con quello seguente. Aggiornare il nome target da AppName al nome dell'app. Aggiornare la versione della piattaforma o del pod in base alle esigenze.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. Eseguire pod install per installare Speech SDK.

In alternativa, scaricare il CocoaPod binario ed estrarne contenuto. Nel progetto Xcode, aggiungere un riferimento alla cartella MicrosoftCognitiveServicesSpeech.xcframework estratta e al relativo contenuto.

Nota

Gli sviluppatori .NET possono compilare applicazioni macOS native usando il framework dell'applicazione Xamarin.Mac. Per ulteriori informazioni, consultare Xamarin.Mac.

Documentazione di riferimento | Pacchetto (download) | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per Swift.

Suggerimento

Per ulteriori informazioni sull'uso di Speech SDK per Swift, consultare Importazione di Objective-C in Swift.

Installare Speech SDK per Swift

Speech SDK per Swift è disponibile in modo nativo come pacchetto CocoaPod per i sistemi basati su Mac x64 e ARM.

Requisiti di sistema per Mac:

  • macOS versione 10.14 o successive

Il pacchetto macOS CocoaPod è disponibile per il download e l'uso con l'ambiente di sviluppo integrato (IDE) Xcode 9.4.1 o versioni successive.

  1. Passare alla directory Xcode in cui si trova il file di progetto .xcodeproj.

  2. Eseguire pod init per creare un file pod denominato Podfile.

  3. Sostituire il contenuto di Podfile con quello seguente. Aggiornare il nome target da AppName al nome dell'app. Aggiornare la versione della piattaforma o del pod in base alle esigenze.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. Eseguire pod install per installare Speech SDK.

In alternativa, scaricare il CocoaPod binario ed estrarne contenuto. Nel progetto Xcode, aggiungere un riferimento alla cartella MicrosoftCognitiveServicesSpeech.xcframework estratta e al relativo contenuto.

Nota

Gli sviluppatori .NET possono compilare applicazioni macOS native usando il framework dell'applicazione Xamarin.Mac. Per ulteriori informazioni, consultare Xamarin.Mac.

Documentazione di riferimento | Pacchetto (PyPi) | Altri esempi in GitHub

In questa guida introduttiva, si installerà lo Speech SDK per Python.

Requisiti di piattaforma

Speech SDK per Python è compatibile con Windows, Linux e macOS.

Speech SDK per Python supporta le seguenti distribuzioni nelle architetture x64 e ARM64:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12
  • Amazon Linux 2023
  • Azure Linux 3.0

Importante

Usare la versione LTS più recente della distribuzione Linux. Ad esempio, se si usa Ubuntu 20.04 LTS, usare la versione più recente di Ubuntu 20.04.X.

Speech SDK dipende dalle seguenti librerie di sistema Linux:

  • Le raccolte condivise della Libreria GNU C (inclusa la libreria di Programmazione thread POSIX, libpthreads).
  • Libreria OpenSSL, versione 1.x (libssl1) o 3.x (libssl3) e certificati (ca-certificates).
  • La libreria condivisa per le applicazioni ALSA (libasound2).

Eseguire i comandi seguenti:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Installare una versione di Python 3.8 o successiva.

  • Per controllare l'installazione, aprire un terminale ed eseguire il comando python --version. Se Python è stato installato correttamente, si otterrà una risposta come Python 3.8.10.

  • Se si sta usando macOS o Linux, potrebbe essere necessario eseguire il comando python3 --version.

    Per abilitare l'uso di python invece di python3, eseguire alias python='python3' per configurare un alias. I campioni di avvio rapido di Speech SDK specificano l’utilizzo di python.

Installare Speech SDK per Python

Prima di installare Speech SDK per Python, assicurarsi di soddisfare i requisiti della piattaforma.

Installare da PyPI

Per installare Speech SDK per Python, eseguire questo comando in una finestra console:

pip install azure-cognitiveservices-speech

Eseguire l'aggiornamento alla versione più recente di Speech SDK

Per eseguire l'aggiornamento alla versione più recente di Speech SDK, eseguire questo comando in una finestra console:

pip install --upgrade azure-cognitiveservices-speech

È possibile controllare quale versione di Speech SDK per Python sia attualmente installata esaminando la variabile azure.cognitiveservices.speech.__version__. Ad esempio, eseguire questo comando in una finestra console:

pip list

Usare Speech SDK

Aggiungere la seguente istruzione di importazione per usare Speech SDK nel progetto Python:

import azure.cognitiveservices.speech as speechsdk