> ## Documentation Index
> Fetch the complete documentation index at: https://private-7c7dfe99-mintlify-8c05c8a2.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> Cette fonction implémente une régression linéaire stochastique. Elle prend en charge des paramètres personnalisés pour le taux d'apprentissage, le coefficient de régularisation L2, la taille des mini-lots, et propose plusieurs méthodes de mise à jour des poids (Adam, SGD simple, Momentum, Nesterov).

# stochasticLinearRegression

<div id="stochasticLinearRegression">
  ## stochasticLinearRegression
</div>

Introduit dans : v20.1.0

Cette fonction implémente une régression linéaire stochastique.
Elle prend en charge des paramètres personnalisés pour :

* taux d’apprentissage
* coefficient de régularisation L2
* taille des mini-lots

Elle propose également plusieurs méthodes de mise à jour des poids :

* Adam (utilisée par défaut)
* SGD simple
* Momentum
* Nesterov

**Utilisation**

La fonction s’utilise en deux étapes : l’entraînement du modèle, puis la prédiction sur de nouvelles données.

1. Entraînement

Pour l’entraînement, vous pouvez utiliser une requête comme celle-ci :

```sql theme={null}
CREATE TABLE IF NOT EXISTS train_data
(
    param1 Float64,
    param2 Float64,
    target Float64
) ENGINE = Memory;

CREATE TABLE your_model ENGINE = Memory AS SELECT
stochasticLinearRegressionState(0.1, 0.0, 5, 'SGD')(target, x1, x2)
AS state FROM train_data;
```

Ici, nous devons également insérer des données dans la table `train_data`.
Le nombre de paramètres n’est pas fixe ; il dépend uniquement du nombre d’arguments passés à `linearRegressionState`.
Ils doivent tous être des valeurs numériques.
Notez que la colonne contenant la valeur cible (que nous voulons apprendre à prédire) est insérée en tant que premier argument.

2. Prédiction

Après avoir enregistré un état dans la table, nous pouvons l’utiliser plusieurs fois pour effectuer des prédictions, ou même le fusionner avec d’autres états afin de créer de nouveaux modèles encore meilleurs.

```sql theme={null}
WITH (SELECT state FROM your_model) AS model SELECT
evalMLMethod(model, x1, x2) FROM test_data
```

La requête renverra une colonne de valeurs prédites.
Notez que le premier argument de `evalMLMethod` est un objet `AggregateFunctionState` ; les suivants sont des colonnes de caractéristiques.

`test_data` est une table similaire à `train_data`, mais peut ne pas contenir la valeur cible.

**Remarques**

1. Pour fusionner deux modèles, l'utilisateur peut créer la requête suivante :

```sq; theme={null}
SELECT state1 + state2 FROM your_models
```

où la table `your_models` contient les deux modèles.
Cette requête renverra un nouvel objet `AggregateFunctionState`.

2. Vous pouvez récupérer les poids du modèle créé pour vos propres usages sans enregistrer le modèle si aucun combinateur `-State` n’est utilisé.

```sql theme={null}
SELECT stochasticLinearRegression(0.01)(target, param1, param2)
FROM train_data
```

Une requête comme celle-ci ajuste le modèle et renvoie ses poids : les premiers sont les poids, qui correspondent aux paramètres du modèle, et le dernier est le biais.
Ainsi, dans l'exemple ci-dessus, la requête renverra une colonne contenant 3 valeurs.

**Syntaxe**

```sql theme={null}
stochasticLinearRegression([learning_rate, l2_regularization_coef, mini_batch_size, method])(target, x1, x2, ...)
```

**Arguments**

* `learning_rate` — Coefficient de longueur de pas lors de l’exécution d’une étape de descente de gradient. Un taux d’apprentissage trop élevé peut entraîner des poids infinis pour le modèle. La valeur par défaut est `0.00001`. [`Float64`](/fr/reference/data-types/float)
* `l2_regularization_coef` — Coefficient de régularisation L2, qui peut aider à éviter le surapprentissage. La valeur par défaut est `0.1`. [`Float64`](/fr/reference/data-types/float)
* `mini_batch_size` — Définit le nombre d’éléments pour lesquels les gradients sont calculés puis additionnés afin d’effectuer une étape de descente de gradient. La descente purement stochastique utilise un seul élément, mais de petits batches (environ 10 éléments) rendent les étapes de gradient plus stables. La valeur par défaut est `15`. [`UInt64`](/fr/reference/data-types/int-uint)
* `method` — Méthode de mise à jour des poids : `Adam` (par défaut), `SGD`, `Momentum`, `Nesterov`. `Momentum` et `Nesterov` nécessitent légèrement plus de calculs et de mémoire, mais ils sont utiles en termes de vitesse de convergence et de stabilité des méthodes de gradient stochastique. [`const String`](/fr/reference/data-types/string)
* `target` — Valeur cible (variable dépendante) à apprendre à prédire. Doit être numérique. [`Float*`](/fr/reference/data-types/float)
* `x1, x2, ...` — Valeurs des caractéristiques (variables indépendantes). Elles doivent toutes être numériques. [`Float*`](/fr/reference/data-types/float)

**Valeur renvoyée**

Renvoie les poids du modèle de régression linéaire entraîné. Les premières valeurs correspondent aux paramètres du modèle, la dernière est le biais. Utilisez `evalMLMethod` pour effectuer des prédictions. [`Array(Float64)`](/fr/reference/data-types/array)

**Exemples**

**Entraînement d’un modèle**

```sql title=Query theme={null}
CREATE TABLE your_model
ENGINE = Memory
AS SELECT
stochasticLinearRegressionState(0.1, 0.0, 5, 'SGD')(target, x1, x2)
AS state FROM train_data
```

```response title=Response theme={null}
Saves trained model state to table
```

**Faire des prédictions**

```sql title=Query theme={null}
WITH (SELECT state FROM your_model) AS model SELECT
evalMLMethod(model, x1, x2) FROM test_data
```

```response title=Response theme={null}
Returns predicted values for test data
```

**Récupération des poids du modèle**

```sql title=Query theme={null}
SELECT stochasticLinearRegression(0.01)(target, x1, x2) FROM train_data
```

```response title=Response theme={null}
Returns model weights without saving state
```

**Voir aussi**

* [stochasticLogisticRegression](/fr/reference/functions/aggregate-functions/stochasticLogisticRegression)
* [Différence entre la régression linéaire et la régression logistique](https://stackoverflow.com/questions/12146914/what-is-the-difference-between-linear-regression-and-logistic-regression)
