机器学习中逻辑回归和线性回归的区别

简单来说,逻辑回归是用于解决分类问题的,而线性回归是用于解决回归(预测)问题的。尽管它们的名字里都有“回归”,但本质和目标完全不同。

下面我用一个清晰的对比表格来展示核心区别,然后进行详细解释。

特性线性回归逻辑回归
本质回归算法分类算法(虽名“回归”)
预测目标连续的数值(如房价、温度)离散的类别(如是/否,0/1/2)
输出形式直接输出一个连续的实数值输出一个概率值(介于0和1之间)
核心函数线性函数(加权求和 + 偏置)Sigmoid函数(将线性结果映射到概率)
拟合方式最小二乘法(最小化预测值与真实值的平方误差)最大似然估计(最大化观测到当前数据的概率)
应用场景预测销量、股价趋势、天气温度等垃圾邮件识别、疾病诊断、客户流失预测等

深入解释

我们可以从四个核心层面来理解它们的区别:

1. 目标与输出

  • 线性回归:它的目标是拟合一条直线(或超平面),使得这条线能最好地穿过或接近数据点。它的输出 y 可以是任意实数(例如,y = 15.3万元,预测房价)。
  • 逻辑回归:它的目标是在数据点之间找到一条决策边界,将不同类别的点分开。它的输出 p 是某个样本属于正类(例如“是”)的概率(例如,p = 0.85,意味着有85%的概率是垃圾邮件)。然后通过一个阈值(通常为0.5)将这个概率转换为类别标签。

2. 核心函数与映射

  • 线性回归:核心就是线性方程。
    [
    z = w_1x_1 + w_2x_2 + … + b
    ]
    这个 z 就是最终的预测值 y,范围是 (-∞, +∞)
  • 逻辑回归:它在线性回归的结果之上,套用了一个 Sigmoid 函数
    [
    p = \sigma(z) = \frac{1}{1 + e^{-z}}
    ]
    其中 z 就是线性方程的输出。Sigmoid 函数将 z(-∞, +∞)挤压(0, 1) 区间,完美地代表了概率。

3. 损失函数与优化目标
这是两者在数学上最根本的区别。

  • 线性回归:使用均方误差损失函数。它的思想是“让预测值和真实值在数值上尽可能接近”。
  • 逻辑回归:使用交叉熵损失函数。它的思想是“对于分类正确的样本,我们希望其预测概率尽可能接近1;对于分类错误的样本,希望其预测概率尽可能接近0”。这通过最大似然估计来实现。

4. 假设前提

  • 线性回归:假设自变量和因变量之间存在线性关系,并且误差项服从正态分布等。
  • 逻辑回归不要求自变量和因变量呈线性关系,但要求因变量(在概率的Logit尺度上)与自变量呈线性关系。

一个生动的比喻

  • 线性回归 像一个预言家,他努力预测一个精确的、具体的数值(“明天的气温会是23.5℃”)。
  • 逻辑回归 像一个裁判,他根据证据做出一个判断,并给出对这个判断的信心程度(“这封邮件有92% 的可能是垃圾邮件,所以我判定它为垃圾邮件”)。

总结

线性回归逻辑回归
要解决的问题“是多少?”“是A还是B?”
输出连续数值属于某一类的概率
关键技术最小化误差平方和线性组合 + Sigmoid概率映射 + 最大化似然
关系逻辑回归可以看作是在线性回归的输出上施加了一层Sigmoid变换,从而将回归问题转化为分类问题。

简单记住:要预测具体数字,用线性回归;要做是非判断,用逻辑回归。

Read more

这回真的“装”到了!来OpenClaw全国纵深行,你只需要带一台电脑……

这回真的“装”到了!来OpenClaw全国纵深行,你只需要带一台电脑……

AI Agent 的风,已经从 GitHub 吹到了线下。 过去几个月,越来越多开发者开始讨论一个问题: 当 AI 不再只是聊天,而是可以执行任务,软件会变成什么样? 在这股浪潮中,一个开源项目迅速进入开发者视野——OpenClaw,在 GitHub 上获得大量关注,相关教程、实践案例不断出现。有人用它自动整理资料,有人用它管理开发流程,还有人尝试让它执行复杂的工作流。 很多开发者第一次意识到: AI 不只是工具,它可能成为“执行者”。 不过,在技术社区之外,大多数人对 Agent 的理解仍停留在概念层面。 * AI Agent 到底是什么? * 如何在自己的电脑上运行? * 普通开发者能否真正用起来? 带着这些问题,一场围绕 OpenClaw 的开发者城市行动正在展开。 ZEEKLOG 发起的OpenClaw 全国纵深行将走进 20 个城市,用最直接的方式回答一个问题——如果

By Ne0inhk
从下载到运行:MySQL 详细安装配置完整教程

从下载到运行:MySQL 详细安装配置完整教程

从下载到运行:MySQL 超详细安装配置完整教程 * 从下载到运行:MySQL 详细安装配置完整教程 * 一、MySQL下载步骤 * 二、MySQL安装流程 * 三、MySQL环境配置与验证 * 1. 配置环境变量 * 2. 验证MySQL是否安装成功 * 四、Navicat链接MySQL * 1. 安装Navicat 从下载到运行:MySQL 详细安装配置完整教程 一、MySQL下载步骤 首先访问MySQL官方下载地址,进入MySQL的官方下载页面。 下载完成后,在本地找到下载好的MySQL安装文件,双击文件启动安装程序。 二、MySQL安装流程 双击安装文件后,会进入MySQL安装类型选择界面,界面中提供5种安装模式,各自功能如下: Developer Default(开发者默认):包含MySQL开发所需的全套组件(如数据库服务、客户端工具、SDK等),适合开发人员使用。Server only(仅服务器):仅安装MySQL数据库服务,适合仅需搭建数据库服务器的场景。Client

By Ne0inhk
4nm移动SoC革命:三星高能效NPU架构解析

4nm移动SoC革命:三星高能效NPU架构解析

面向移动端SoC的高硬件效率神经网络处理单元 临近春节,围炉煮茶之余阅读了三星电子发表在固体电子学顶刊IEEE JSSC上的论文 《A Multi-Mode 8k-MAC HW-Utilization-Aware Neural Processing Unit With a Unified Multi-Precision Datapath in 4-nm Flagship Mobile SoC》 ,三星副总裁Inyup Kang博士 为本文的共同作者。三星电子的研究团队提出了一种应用于4nm移动SoC支持多模式的神经网络处理单元(NPU),专为猎户座移动SoC设计,通过统一多精度数据通路支持INT4/8及FP16运算,实现高能效与高面积效率的平衡。 原文链接 关键词 计算利用率、深度神经网络(DNN)、领域专用架构(DSA)、推理加速器、稀疏感知零跳过、统一乘加(MAC) 全文导图及摘要 针对深度卷积、浅层小通道层等端侧AI应用中的低硬件利用率场景,三星团队结合编译器提供的张量信息,通过重构计算流(包含基于特征图稀疏特性的零值跳过、Scatter-Gather等技术),硬件利用

By Ne0inhk
金仓数据库 MongoDB 兼容:多模融合下的架构之道与实战体验

金仓数据库 MongoDB 兼容:多模融合下的架构之道与实战体验

引言:从“平替”到“超越”的技术跨越 在国产化替代(信创)浪潮下,选择数据库不再只是考量“能否使用”,更多关注其“好用与否”,还要看是否能做到“无缝切换”。提到 MongoDB,想必大家都不生疏,作为 NoSQL 领域的佼佼者,凭借自身灵活的数据架构和飞快的读写效率,斩获诸多互联网及物联网项目,不过须要诚实地表明,一旦关乎到企业核心业务,譬如要确保数据完全一致,执行繁杂的关联查询或者实施统一运作管理时,MongoDB 就常常会有些力不从心。 电科金仓(Kingbase)所给出的多模融合数据库方案颇具趣味,该方案并非仅仅创建一层适配层来博取眼球,其实在架构层面上执行了“降维打击”,经由内核级别的 MongoDB 协议适配 并结合自主研发的 OSON 存储引擎,金仓把“关系型数据库稳定的基础”与“NoSQL 灵活的特性”融合起来,现在,让我们一起探究金仓数据库(KingbaseES,

By Ne0inhk