stochasticLogisticRegression
stochasticLinearRegression et fonctionne de la même manière.
Utilisation
La fonction s’utilise en deux étapes :
- Ajustement
train_data.
Le nombre de paramètres n’est pas fixe : il dépend uniquement du nombre d’arguments passés à logisticRegressionState.
Ils doivent tous être des valeurs numériques.
Notez que la colonne contenant la valeur cible (celle que nous voulons apprendre à prédire) est passée en premier argument.
Les étiquettes prédites doivent être comprises dans [-1, 1].
- Prédiction
1.
evalMLMethod est un objet AggregateFunctionState ; les suivants sont des colonnes de variables.
Nous pouvons également définir un seuil de probabilité, qui attribue les éléments à différentes étiquettes.
test_data est une table comme train_data, mais peut ne pas contenir de valeur cible.
Syntaxe
learning_rate— Coefficient de longueur de pas utilisé lors d’une étape de descente de gradient. Un taux d’apprentissage trop élevé peut entraîner des poids infinis pour le modèle. La valeur par défaut est0.00001.Float64l2_regularization_coef— Coefficient de régularisation L2 pouvant aider à éviter le surapprentissage. La valeur par défaut est0.1.Float64mini_batch_size— Définit le nombre d’éléments pour lesquels les gradients sont calculés et additionnés afin d’effectuer une étape de descente de gradient. La descente stochastique pure utilise un seul élément, mais l’utilisation de petits lots (environ 10 éléments) rend les étapes de gradient plus stables. La valeur par défaut est15.UInt64method— Méthode de mise à jour des poids :Adam(par défaut),SGD,Momentum,Nesterov.MomentumetNesterovdemandent un peu plus de calculs et de mémoire, mais ils peuvent être utiles en termes de vitesse de convergence et de stabilité des méthodes de gradient stochastique.Stringtarget— Étiquettes cibles de classification binaire. Elles doivent être comprises dans l’intervalle [-1, 1].Floatx1, x2, ...— Valeurs des caractéristiques (variables indépendantes). Elles doivent toutes être numériques.Float
evalMLMethod pour effectuer des prédictions ; cette méthode renvoie les probabilités qu’un objet ait l’étiquette 1. Array(Float64)
Exemples
Entraînement d’un modèle
Query
Response
Query
Response
Query
Response