Editor trasformazione Raggruppamento fuzzy (scheda Avanzate)
La scheda Avanzate della finestra di dialogo Editor trasformazione Raggruppamento fuzzy consente di specificare le colonne di input e output, impostare le soglie di somiglianza e definire i delimitatori.
[!NOTA]
Le proprietà Exhaustive e MaxMemoryUsage della trasformazione Raggruppamento fuzzy non sono disponibili nell'Editor trasformazione Raggruppamento fuzzy, tuttavia possono essere impostate utilizzando l'Editor avanzato. Per ulteriori informazioni su queste proprietà, vedere la sezione relativa alla trasformazione Raggruppamento fuzzy in Proprietà personalizzate delle trasformazioni.
Per ulteriori informazioni sulla trasformazione Raggruppamento fuzzy, vedere Trasformazione Raggruppamento fuzzy.
Opzioni
Nome colonna chiave di input
Consente di specificare il nome di una colonna di output contenente l'identificatore univoco per ogni riga di input. La colonna _key_in contiene un valore che identifica in modo univoco ogni riga.Nome colonna chiave di output
Consente di specificare il nome di una colonna di output contenente l'identificatore univoco per la riga canonica di un gruppo di righe duplicate. La colonna _key_out corrisponde al valore _key_in della riga di dati canonica.Nome colonna punteggio somiglianza
Consente di specificare un nome per la colonna contenente il punteggio di somiglianza. Il punteggio di somiglianza è un valore compreso tra 0 e 1 che indica la somiglianza della riga di input alla riga canonica. I punteggi vicini a 1 indicano una somiglianza maggiore alla riga canonica.Soglia di somiglianza
Consente di impostare la soglia di somiglianza mediante il dispositivo di scorrimento. Le soglie vicine a 1 indicano che le righe devono avere una somiglianza maggiore per poter essere considerate duplicati. L'aumento del valore di soglia può incrementare la velocità di ricerca della corrispondenza in quanto viene considerato un minor numero di record candidati.Delimitatori token
La trasformazione genera un set predefinito di delimitatori per la suddivisione in token dei dati. È tuttavia possibile aggiungere o rimuovere i delimitatori in base alle esigenze modificando l'elenco.