Score Matchbox Recommender
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Assegna un punteggio alle stime per un set di dati usando il sistema di raccomandazione Matchbox
Categoria: Machine Learning/Punteggio
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Score Matchbox Recommender in Machine Learning Studio (versione classica) per creare stime basate su un modello di raccomandazione con training, basato sull'algoritmo Matchbox di Microsoft Research.
Il sistema di raccomandazione Matchbox può generare quattro tipi diversi di stime:
Quando si creano gli ultimi tre tipi di stime, è possibile operare in modalità di produzione o di valutazione.
La modalità di produzione considera tutti gli utenti o gli elementi e viene in genere usata in un servizio Web.
È possibile creare punteggi per i nuovi utenti, non solo per gli utenti visti durante il training. Per altre informazioni, vedi questa sezione.
La modalità di valutazione opera su un set ridotto di utenti o elementi che possono essere valutati e viene in genere usata durante la sperimentazione.
Suggerimento
Informazioni sull'esperienza end-to-end di creazione di un sistema di raccomandazione in questa esercitazione del team di sviluppo .NET. Include codice di esempio e informazioni su come chiamare Machine Learning da un'applicazione.
Compilazione del motore di raccomandazione per le applicazioni .NET con Machine Learning
Altre informazioni sul sistema di raccomandazione Matchbox
L'obiettivo della creazione di un sistema di raccomandazione è quello di consigliare uno o più "elementi" agli "utenti" del sistema. Esempi di elemento possono essere un film, un ristorante, un libro o un brano musicale. Un utente può essere una persona, un gruppo di persone o un'altra entità con preferenze per determinati elementi.
Esistono due approcci principali ai sistemi di raccomandazione. Il primo è l'approccio basato sul contenuto che si avvale sia di funzioni utente sia di funzioni elemento. Gli utenti possono essere descritti da proprietà quali età e sesso, mentre gli elementi possono essere descritti da proprietà quali autore e produttore. Esempi tipici di sistemi di raccomandazione basati sul contenuto sono disponibili nei siti di social matchmaking. Il secondo approccio è il filtro collaborativo, che usa solo identificatori degli utenti e degli elementi e ottiene implicite informazioni su queste entità da una matrice di classificazioni (di tipo sparse) fornita dagli utenti agli elementi. È possibile apprendere informazioni su un utente dagli elementi che ha classificato e dagli altri utenti che hanno classificato gli stessi elementi.
Matchbox Recommender combina il filtro collaborativo con un approccio basato sul contenuto. Per questo motivo, viene considerato un sistema di raccomandazione ibrido. Quando un utente ha scarsa familiarità con il sistema, le stime vengono migliorate grazie all'uso di informazioni sulle funzioni utente, risolvendo in questo modo il noto problema di "avvio a freddo". Tuttavia, quando esiste un numero sufficiente di classificazioni eseguite da un particolare utente, è possibile eseguire stime completamente personalizzate per tale utente in base alle sue specifiche classificazioni piuttosto che in base alle sole funzioni. Di conseguenza, esiste una transizione graduale da raccomandazioni basate sul contenuto a raccomandazioni basate sul filtro collaborativo. Anche quando le funzionalità dell'utente o dell'elemento non sono disponibili, Matchbox funziona comunque nella modalità di filtro collaborativa.
Altri dettagli sul sistema di raccomandazione Matchbox e sull'algoritmo probabilistico sottostante sono disponibili nel documento di ricerca su
Esempio
Per esempi su come creare punteggi da un motore di raccomandazione, vedere il Azure AI Gallery.
Raccomandazione: raccomandazione di film: questo esempio illustra la raccomandazione per gli elementi, in cui gli elementi sono film, e illustra anche la stima della valutazione.
Raccomandazione: Classificazioni dei ristoranti: questo esempio illustra le raccomandazioni per gli elementi usando sia le funzionalità degli elementi che le funzionalità utente.
- Consigli Everywhere: questo post di blog offre un'introduzione generale ai sistemi di raccomandazione con numerosi strumenti visivi.
Come configurare score matchbox recommender
Questo modulo supporta diversi tipi di raccomandazioni, ognuno con requisiti diversi. Fare clic sul collegamento per il tipo di dati e il tipo di raccomandazione che si vuole creare.
Stimare le classificazioni
Quando si stimano le classificazioni, il modello calcola il modo in cui un determinato utente reagisce a un determinato elemento, in base ai dati di training. Di conseguenza, i dati di input per l'assegnazione dei punteggi devono fornire sia un utente che l'elemento da valutare.
Aggiungere un modello di raccomandazione con training all'esperimento e connetterlo alla raccomandazione Trained Matchbox. È necessario creare il modello usando train matchbox recommender.
Tipo di stima del sistema di raccomandazione: selezionare Stima valutazione. Non sono richiesti altri parametri.
Aggiungere i dati per cui si desidera eseguire stime e connetterlo al set di dati per il punteggio.
Per stimare le classificazioni, il set di dati di input deve contenere coppie utente-elemento.
Il set di dati può contenere una terza colonna facoltativa di classificazioni per la coppia utente-elemento nella prima e nella seconda colonna, ma la terza colonna verrà ignorata durante la stima.
(Facoltativo) Se si dispone di un set di dati di funzionalità utente, connetterlo a Funzionalità utente.
Il set di dati delle funzionalità utente deve contenere l'identificatore utente nella prima colonna. Le colonne rimanenti devono contenere valori che caratterizzano gli utenti, ad esempio sesso, preferenze, posizione e così via.
Le funzionalità degli utenti che hanno elementi classificati vengono ignorate da Score Matchbox Recommender, perché sono già state apprese durante il training. Pertanto, filtrare il set di dati in anticipo per includere solo gli utenti con avvio a freddo o gli utenti che non hanno valutato alcun elemento.
Avviso
Se il training del modello è stato fatto senza usare le funzionalità utente, non è possibile introdurre funzionalità utente durante l'assegnazione dei punteggi.
Se si dispone di un set di dati di funzionalità dell'elemento, è possibile connetterlo alle funzionalità dell'elemento.
Il set di dati delle funzionalità dell'elemento deve contenere un identificatore di elemento nella prima colonna. Le colonne rimanenti devono contenere valori che caratterizzano gli elementi.
Le funzionalità degli elementi classificati vengono ignorate dallo strumenti di raccomandazione Score Matchbox perché sono già state apprese durante il training. Limitare quindi il set di dati di assegnazione dei punteggi agli elementi di avvio a freddo o agli elementi che non sono stati classificati da alcun utente.
Avviso
Se il training del modello è stato evaso senza usare le funzionalità dell'elemento, non è possibile introdurre funzionalità dell'elemento durante l'assegnazione dei punteggi.
Usare la quinta porta di input facoltativa, denominata Training Dataset, per rimuovere gli elementi che sono già stati valutati dai risultati della stima.
Per applicare questo filtro, connettere il set di dati di training originale alla porta di input.
Eseguire l'esperimento.
Risultati per le stime delle valutazioni
Il set di dati di output contiene tre colonne, contenenti l'utente, l'elemento e la classificazione stimata per ogni utente e elemento di input.
Inoltre, durante l'assegnazione dei punteggi vengono applicate le modifiche seguenti:
I valori mancanti nelle colonne delle caratteristiche di un utente o di un elemento vengono sostituiti automaticamente con la modalità dei relativi valori del set di training non mancanti.
Tutte le funzionalità relative a utenti ed elementi vengono ridimensionate in base ai valori assoluti massimi corrispondenti visualizzati nel training.
Non viene applicata alcuna traduzione ai valori delle caratteristiche, per mantenerne la parsimonità.
Le funzioni con valori stringa vengono convertite in un set di funzioni indicatore con valori binari.
Recommend
Per consigliare gli elementi agli utenti, fornire un elenco di utenti ed elementi come input. Da questi dati, il modello usa le proprie conoscenze sugli elementi e sugli utenti esistenti per generare un elenco di elementi con probabile richiamo per ogni utente. È possibile personalizzare il numero di raccomandazioni restituite e impostare una soglia per il numero di raccomandazioni precedenti necessarie per generare una raccomandazione.
Aggiungere un modello di raccomandazione con training all'esperimento e connetterlo alla raccomandazione Matchbox con training. È necessario creare il modello usando Train Matchbox Recommender.You must create the model by using Train Matchbox Recommender.
Per consigliare elementi per un determinato elenco di utenti, impostare Tipo di stima della raccomandazione su Raccomandazione elemento.
Selezione dell'elemento consigliata: indicare se si usa il modulo di assegnazione dei punteggi nell'ambiente di produzione o per la valutazione del modello, scegliendo uno di questi valori:
Da Elementi valutati (per la valutazione del modello): selezionare questa opzione se si sta sviluppando o testando un modello. Questa opzione abilita la modalità di valutazione e il modulo formula raccomandazioni solo dagli elementi del set di dati di input classificati.
Da Tutti gli elementi: selezionare questa opzione se si configura un esperimento da usare in un servizio Web o in un ambiente di produzione. Questa opzione abilita la modalità di produzione e il modulo offre raccomandazioni da tutti gli elementi visualizzati durante il training.
Aggiungere il set di dati per cui si desidera eseguire stime e connetterlo al set di dati per il punteggio.
Se si sceglie l'opzione Da tutti gli elementi, il set di dati di input deve essere costituito da una sola colonna contenente gli identificatori degli utenti per cui eseguire raccomandazioni.
Se il set di dati contiene più di una colonna, viene generato un errore. Usare il modulo Seleziona colonne nel set di dati per rimuovere colonne aggiuntive dal set di dati di input.
Se si sceglie l'opzione Da elementi con valutazione (per la valutazione del modello ), il set di dati di input deve essere costituito da coppie utente-elemento. La prima colonna deve contenere l'identificatore utente. La seconda colonna deve contenere gli identificatori di elemento corrispondenti.
Il set di dati può includere una terza colonna di classificazioni utente-elemento, ma questa colonna viene ignorata.
(Facoltativo) Se si dispone di un set di dati di funzionalità utente, connetterlo alle funzionalità utente.
La prima colonna nel set di dati delle funzionalità utente deve contenere l'identificatore utente. Le colonne rimanenti devono contenere valori che caratterizzano l'utente, ad esempio sesso, preferenze, posizione e così via.
Le funzionalità degli utenti che hanno valutato gli elementi vengono ignorate da Score Matchbox Recommender, perché queste funzionalità sono già state apprese durante il training. Pertanto, è possibile filtrare il set di dati in anticipo per includere solo gli utenti con avvio a freddo o gli utenti che non hanno valutato alcun elemento.
Avviso
Se il training del modello è stato applicato senza usare le funzionalità utente, non è possibile usare applica funzionalità durante l'assegnazione dei punteggi.
(Facoltativo) Se si dispone di un set di dati di funzionalità dell'elemento, è possibile connetterlo alle funzionalità dell'elemento.
La prima colonna nel set di dati delle funzionalità dell'elemento deve contenere l'identificatore dell'elemento. Le colonne rimanenti devono contenere valori che caratterizzano gli elementi.
Le funzionalità degli elementi classificati vengono ignorate da Score Matchbox Recommender, perché queste funzionalità sono già state apprese durante il training. È quindi possibile limitare il set di dati di assegnazione dei punteggi agli elementi con avvio a freddo o agli elementi che non sono stati classificati da alcun utente.
Avviso
Se il training del modello è stato fatto senza usare le funzionalità dell'elemento, non usare le funzionalità dell'elemento durante l'assegnazione dei punteggi.
Numero massimo di elementi da consigliare a un utente: digitare il numero di elementi da restituire per ogni utente. Per impostazione predefinita, sono consigliati 5 elementi.
Dimensioni minime del pool di raccomandazioni per utente: digitare un valore che indica il numero di raccomandazioni precedenti necessarie. Per impostazione predefinita, questo parametro è impostato su 2, ovvero l'elemento deve essere stato consigliato da almeno altri due utenti.
Questa opzione deve essere usata solo se si sta classificando in modalità di valutazione. L'opzione non è disponibile se si seleziona Da tutti gli elementi.
Eseguire l'esperimento.
Risultati della raccomandazione per gli elementi
Il set di dati con punteggio restituito da Score Matchbox Recommender elenca gli elementi consigliati per ciascun utente.
- La prima colonna contiene gli identificatori utente.
- Vengono generate diverse colonne aggiuntive, a seconda del valore impostato per Numero massimo di elementi da consigliare a un utente. Ogni colonna contiene un elemento consigliato (in base all'identificatore). Le raccomandazioni vengono ordinate in base all'affinità utente-elemento, con l'elemento con la più alta affinità inserita nella colonna Item 1.
Avviso
Questo set di dati con punteggio non può essere valutato usando il modulo Evaluate Recommender .
Trovare utenti correlati
L'opzione per trovare gli utenti correlati è utile se si consigliano "persone come te" o se si crea un pool di utenti simili su cui basare altri tipi di stime.
Aggiungere un modello di raccomandazione con training all'esperimento e connetterlo alla raccomandazione Matchbox con training. È necessario creare il modello usando Train Matchbox Recommender.You must create the model by using Train Matchbox Recommender.
Tipo di stima della raccomandazione: selezionare Utenti correlati.
Selezione utente correlata: indicare come si usa il modello per l'assegnazione dei punteggi e specificare il pool di utenti su cui basare i punteggi come segue:
Da Tutti gli utenti: selezionare questa opzione se si configura un esperimento da usare in un servizio Web o in un ambiente di produzione o se è necessario eseguire stime per i nuovi utenti. Questa opzione abilita la modalità di produzione e il modulo basa la raccomandazione solo sugli utenti visti durante il training.
Da Utenti che hanno valutato gli elementi (per la valutazione del modello): selezionare questa opzione se si sta sviluppando o testando un modello. Questa opzione abilita la modalità di valutazione e il modello basa le raccomandazioni sugli utenti nel set di test che hanno valutato alcuni elementi comuni.
Connessione un set di dati che contiene gli utenti per cui generare stime. Il formato di questo set di dati dipende dal fatto che si utilizzi il modulo di assegnazione dei punteggi in modalità di produzione o di valutazione.
Modalità di produzione, uso da tutti gli elementi
Il set di dati per il punteggio deve essere costituito dagli utenti per cui si desidera trovare gli utenti correlati. La prima e l'unica colonna devono contenere gli identificatori utente. Se sono incluse altre colonne, viene generato un errore. Usare il modulo Seleziona colonne nel set di dati per rimuovere le colonne non necessarie.
Modalità di valutazione, usando da elementi con valutazione (per la valutazione del modello)
Il set di dati per il punteggio deve essere costituito da 2-3 colonne, contenenti coppie utente-elemento. La prima colonna deve contenere identificatori utente. La seconda colonna deve contenere identificatori di elemento. Il set di dati può includere una terza colonna di classificazioni (dall'utente nella colonna 1 per l'elemento nella colonna 2), ma la colonna ratings verrà ignorata.
Numero massimo di utenti correlati da trovare per un utente: digitare un numero che indica il numero massimo di stime desiderato per ogni utente. Il valore predefinito è 5, vale a dire che è possibile restituire al massimo cinque utenti correlati, ma in alcuni casi potrebbe essere inferiore a 5.
In modalità di valutazione (da utenti che hanno valutato gli elementi), configurare questi parametri aggiuntivi:
Numero minimo di elementi che l'utente della query e l'utente correlato devono avere valutato in comune: questo valore imposta una soglia per le raccomandazioni. Il numero digitato rappresenta il numero minimo di elementi che l'utente di destinazione e il potenziale utente correlato devono avere valutato. Il valore predefinito è 2, vale a dire che, almeno, due elementi devono essere stati valutati da entrambi gli utenti.
Dimensioni minime del pool di utenti correlato per un singolo utente: questo valore controlla il numero minimo di utenti simili necessari per creare una raccomandazione. Per impostazione predefinita, il valore è 2, vale a dire che se si hanno solo due utenti correlati in virtù della classificazione degli stessi elementi, è possibile considerarli correlati e generare una raccomandazione.
(Facoltativo) Se si dispone di un set di dati di funzionalità utente, connetterlo alle funzionalità utente.
La prima colonna nel set di dati delle funzionalità utente deve contenere l'identificatore utente. Le colonne rimanenti devono contenere valori che caratterizzano l'utente, ad esempio sesso, preferenze, posizione e così via.
Le funzionalità degli utenti che hanno valutato gli elementi vengono ignorate da Score Matchbox Recommender perché queste funzionalità sono già state apprese durante il training. Pertanto, filtrare il set di dati in anticipo in modo da includere solo gli utenti con avvio a freddo o gli utenti che non hanno valutato alcun elemento.
Avviso
Se il training del modello è stato applicato senza usare le funzionalità utente, non è possibile applicare le funzionalità utente durante l'assegnazione dei punteggi.
(Facoltativo) Se si dispone di un set di dati di funzionalità dell'elemento, connetterlo a Funzionalità elemento.
La prima colonna nel set di dati delle funzionalità dell'elemento deve contenere l'identificatore dell'elemento. Le colonne rimanenti devono contenere valori che caratterizzano gli elementi.
Le funzionalità degli elementi classificati vengono ignorate da Score Matchbox Recommender perché queste funzionalità sono già state apprese durante il training. È quindi possibile limitare il set di dati di assegnazione dei punteggi agli elementi con avvio a freddo o agli elementi che non sono stati classificati da alcun utente.
Avviso
Se il training del modello è stato fatto senza usare le funzionalità dell'elemento, non usare le funzionalità dell'elemento durante l'assegnazione dei punteggi.
Eseguire l'esperimento.
Risultati per gli utenti correlati
Il set di dati con punteggio restituito da Score Matchbox Recommender elenca gli utenti correlati a ogni utente nel set di dati di input.
Per ogni utente specificato nel set di dati di input, il set di dati dei risultati contiene un set di utenti correlati.
La prima colonna contiene l'identificatore dell'utente di destinazione (l'utente fornito come input).
Vengono generate colonne aggiuntive contenenti gli identificatori degli utenti correlati. Il numero di colonne aggiuntive dipende dal valore impostato nell'opzione Numero massimo di utenti correlati da trovare per un utente.
Gli utenti correlati sono ordinati in base all'intensità della relazione con l'utente di destinazione, con l'utente più strettamente correlato nella colonna Utente correlato 1.
Trovare elementi correlati
Stimando gli elementi correlati, è possibile generare raccomandazioni per gli utenti in base agli elementi che sono già stati valutati.
Aggiungere un modello di raccomandazione con training all'esperimento e connetterlo alla raccomandazione Trained Matchbox. È necessario creare il modello usando train matchbox recommender.
Tipo di stima del sistema di raccomandazione: selezionare Elementi correlati.
Connessione un set di dati che contiene gli utenti per i quali generare stime. Il formato per questo set di dati varia a seconda che si utilizzi il modulo di assegnazione dei punteggi in modalità di produzione o di valutazione.
Modalità di produzione, uso di Da tutti gli elementi
Il set di dati per il punteggio deve essere costituito da elementi per i quali si desidera trovare gli utenti correlati.
La prima e l'unica colonna devono contenere gli identificatori di elemento. Se sono incluse altre colonne, viene generato un errore. Usare il modulo Select Columns in Dataset (Seleziona colonne nel set di dati) per rimuovere le colonne non necessarie.
Modalità di valutazione, uso di From Rated Items (per la valutazione del modello)
Il set di dati per il punteggio deve essere costituito da 2-3 colonne, contenenti coppie utente-elemento. La prima colonna deve contenere identificatori utente. La seconda colonna deve contenere identificatori di elemento.
Il set di dati può includere una terza colonna di classificazioni (dall'utente nella colonna 1 per l'elemento nella colonna 2), ma la colonna ratings viene ignorata.
Numero massimo di elementi correlati da trovare per un elemento>: digitare un numero che indica il numero massimo di stime desiderate per ogni elemento.
Il valore predefinito è 5, vale a dire che è possibile restituire al massimo cinque elementi correlati, ma potrebbero essere presenti meno di 5 elementi.
Se si usa la modalità di valutazione (Da utenti che hanno valutato elementi), configurare questi parametri aggiuntivi:
Numero minimo di elementi da cui l'elemento di query e l'elemento correlato devono essere stati classificati in comune: questo valore imposta una soglia per le raccomandazioni. Il numero digitato rappresenta il numero minimo di elementi classificati dall'utente di destinazione e da alcuni utenti correlati. Il valore predefinito è 2, vale a dire che, almeno, due elementi devono essere stati classificati dall'utente di destinazione e dall'utente correlato.
Dimensioni minime del pool di elementi correlati per un singolo elemento: questo valore controlla il numero minimo di elementi simili necessari per creare una raccomandazione. Per impostazione predefinita, il valore è 2, vale a dire che, se si dispone di un minimo di due elementi correlati grazie alla possibilità di essere stati valutati dagli stessi utenti, è possibile considerarli correlati e generare una raccomandazione.
(Facoltativo) Se si dispone di un set di dati di funzionalità utente, connetterlo a Funzionalità utente.
La prima colonna nel set di dati delle funzionalità utente deve contenere l'identificatore utente. Le colonne rimanenti devono contenere valori che caratterizzano l'utente, ad esempio sesso, preferenze, posizione e così via.
Le funzionalità degli utenti che hanno elementi classificati vengono ignorate da Score Matchbox Recommender, perché queste funzionalità sono già state apprese durante il training. Pertanto, è possibile filtrare in anticipo il set di dati per includere solo gli utenti con avvio a freddo o gli utenti che non hanno valutato alcun elemento.
Avviso
Se il training del modello è stato applicato senza usare le funzionalità utente, non è possibile applicare le funzionalità utente durante l'assegnazione dei punteggi.
(Facoltativo) Se si dispone di un set di dati di funzionalità dell'elemento, è possibile connetterlo alle funzionalità dell'elemento.
La prima colonna nel set di dati delle funzionalità dell'elemento deve contenere l'identificatore dell'elemento. Le colonne rimanenti devono contenere valori che caratterizzano l'elemento.
Le funzionalità degli elementi classificati vengono ignorate da Score Matchbox Recommender, perché queste funzionalità sono già state apprese durante il training. Pertanto, è possibile limitare il set di dati di assegnazione dei punteggi a elementi di avvio a freddo o elementi che non sono stati classificati da alcun utente.
Avviso
Se il training del modello è stato evaso senza usare le funzionalità dell'elemento, non usare le funzionalità dell'elemento per l'assegnazione dei punteggi.
(Facoltativo) In un esperimento predittivo è possibile usare una quinta porta di input, denominata Training Dataset, per rimuovere gli utenti esistenti inclusi nei dati di training del modello dai risultati della stima.
Per applicare questo filtro, connettere il set di dati di training originale alla porta di input.
Eseguire l'esperimento.
Risultati per gli elementi correlati
Il set di dati con punteggio restituito da Score Matchbox Recommender elenca gli elementi correlati per ogni elemento nel set di dati di input.
La prima colonna contiene l'identificatore dell'elemento di destinazione (l'elemento fornito come input).
Vengono generate colonne aggiuntive contenenti gli identificatori degli elementi correlati. Il numero di colonne aggiuntive dipende dal valore impostato nell'opzione Numero massimo di elementi correlati da trovare per un elemento.
Gli elementi correlati vengono ordinati in base al livello della relazione con l'elemento di destinazione, con l'elemento più strettamente correlato nella colonna , Elemento correlato 1.
Note tecniche
Questa sezione contiene le risposte ad alcune domande comuni sull'uso dello strumento di raccomandazione per creare stime.
Utenti e raccomandazioni per l'avvio a freddo
In genere, per creare raccomandazioni, il modulo Score Matchbox Recommender richiede gli stessi input usati durante il training del modello, incluso un ID utente. Ciò è dovuto al fatto che l'algoritmo deve sapere se ha appreso informazioni su questo utente durante il training.
Per i nuovi utenti, tuttavia, è possibile che non si abbia un ID utente, ma solo alcune funzionalità dell'utente, ad esempio età, sesso e così via.
È comunque possibile creare raccomandazioni per gli utenti che sono nuovi al sistema gestendoli come utenti "avvio a freddo". Per tali utenti, l'algoritmo di raccomandazione non usa la cronologia passata o le classificazioni precedenti ma solo le funzioni utente.
Ai fini della stima, un utente con avvio a freddo viene definito come utente con un ID che non è stato usato per il training. Per assicurarsi che gli ID non corrispondano agli ID usati nel training, è possibile creare nuovi identificatori. Ad esempio, è possibile generare ID casuali all'interno di un intervallo specificato o allocare in anticipo una serie di ID per gli utenti con avvio a freddo.
Se tuttavia non si hanno dati di filtro collaborativo, ad esempio un vettore di funzioni utente, è preferibile usare uno strumento di apprendimento di classificazione o regressione.
Uso in produzione dello strumento di raccomandazione Matchbox
Se è stato fatto un esperimento con lo strumento di raccomandazione Matchbox e quindi si sposta il modello nell'ambiente di produzione, tenere presenti queste differenze principali quando si usa lo strumento di raccomandazione in modalità di valutazione e in modalità di produzione:
La valutazione, per definizione, richiede stime che possono essere verificate rispetto a dati verificati in un set di test. Pertanto, quando si valuta la raccomandazione, è necessario stimare solo gli elementi che sono stati classificati nel set di test limitando necessariamente i possibili valori stimati.
Tuttavia, quando si rende operativo il modello, in genere si modifica la modalità di stima per creare raccomandazioni in base a tutti gli elementi possibili in modo da ottenere le stime migliori. Per molte di queste stime, non esiste alcuna verità di base corrispondente, quindi l'accuratezza della raccomandazione non può essere verificata come durante la sperimentazione.
Se non si fornisce un ID utente nell'ambiente di produzione e si specifica solo un vettore di funzione, si potrebbe ottenere come risposta un elenco di tutte le raccomandazioni per tutti gli utenti possibili. Assicurarsi di fornire un ID utente.
Per limitare il numero di raccomandazioni restituite, è possibile anche specificare il numero massimo di elementi restituiti per ogni utente.
Non è possibile generare stime solo per gli elementi che non sono stati classificati in precedenza. Questo si verifica per motivi strutturali.
Il motivo è che, per consigliare solo gli elementi che non sono stati classificati, il sistema di raccomandazione dovrà archiviare l'intero set di dati di training con il modello, con un aumento dell'uso dello spazio di archiviazione.
Se si vuole raccomandare solo gli elementi che non sono stati visualizzati dall'utente, è possibile richiedere più elementi da raccomandare escludendo manualmente tramite filtro quelli classificati.
Aggiornamento continuo del sistema di raccomandazione
L'aggiornamento online (o training continuo) di un modello di raccomandazione non è attualmente supportato in Machine Learning. Per acquisire le risposte degli utenti alle raccomandazioni e usarle per migliorare il modello, è consigliabile eseguire periodicamente il training del modello completo. Il training incrementale non è possibile, ma è possibile applicare una finestra temporale scorrevole ai dati di training per assicurarsi che il volume di dati sia ridotto al minimo durante l'uso dei dati più recenti.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Sistema di raccomandazione Matchbox con training | ILearner | Sistema di raccomandazione Matchbox con training |
Set di dati a cui assegnare un punteggio | Tabella dati | Set di dati a cui assegnare un punteggio |
Funzioni utente | Tabella dati | Set di dati contenente le funzioni che descrivono gli utenti Questi dati sono facoltativi |
Funzioni elemento | Tabella dati | Set di dati contenente le funzioni che descrivono gli elementi Questi dati sono facoltativi |
Parametri del modulo
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Recommender prediction kind | Elenco | Tipo di stima | Item Recommendation | Specifica il tipo di stima che il sistema di raccomandazione deve restituire come output |
Recommended item selection | Elenco | Selezione degli elementi | From Rated Items (for model evaluation) | Selezionare il set di elementi da cui creare le raccomandazioni |
Related user selection | Elenco | Selezione utente | From Users That Rated Items (for model evaluation) | Selezionare il set di utenti da usare durante la ricerca di elementi correlati |
Related item selection | Elenco | [Selezione di elementi | From Rated Items (for model evaluation) | Selezionare il set di elementi da usare durante la ricerca di elementi correlati |
Output
Nome | Tipo | Descrizione |
---|---|---|
Set di dati con punteggio | Tabella dati | Set di dati con punteggio |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0022 | L'eccezione si verifica se il numero di colonne selezionate nel set di dati di input non corrisponde al numero previsto. |
Errore 0036 | L'eccezione si verifica se sono stati specificati più vettori della funzionalità per un determinato utente o elemento. |
Errore 0013 | Si verifica un'eccezione se il tipo dello strumento di apprendimento passato al modulo non è valido. |
Errore 0035 | L'eccezione si verifica se non sono state specificate funzioni per un determinato utente o elemento. |
Errore 0053 | Si verifica un'eccezione in assenza di elementi o funzioni utente per le raccomandazioni Matchbox. |
Errore 0003 | L'eccezione si verifica se uno o più input sono null o vuoti. |
Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.
Vedi anche
Train Matchbox Recommender
Evaluate Recommender (Valuta modelo di raccomandazione)
Punteggio