Самый простой и наиболее часто используемый вид регрессии – линейная. Приближение данных (xi,yi) осуществляется линейной функцией y(x)=b+a×x. На координатной плоскости (x,y) линейная функция, как известно, представляется прямой линией (рис. справа). Еще линейную регрессию часто называют методом наименьших квадратов, поскольку коэффициенты a и b вычисляются из условия минимизации суммы квадратов ошибок |b+a×xi-yi|2.
Для расчета линейной регрессии используются следующие формулы
Замечание.
Чаще всего, такое же условие, т.е.
минимизация суммы квадратов ошибок в узлах
|b+axi-yi|2, ставится и в других задачах регрессии, т. е. приближения массива данных
(xi,yi) другими зависимостями y(x).
Однако, имеются и альтернативные алгоритмы,
минимизирующие сумму абсолютных значений
медиан ошибок в узлах (медиан-медианная
регрессия).Различие результатов среднеквадратичной
(сплошная линия) и медиан-медианной (пунктир)
линейной регрессии иллюстрируется рис.
снизу.