算法

机器学习算法笔记（线性回归）

Ne0inhk

23 Feb 2025 — 3 min read

线性回归

线性回归模型

线性回归是一种线性模型，它假设输入变量x和单个输出变量y之间存在线性关系。
具体来说，利用线性回归模型，可以从一组输入变量x的线性组合中，计算输出变量y

y = a x + b y = ax + b y=ax+b

f ( x ) = w 1 x 1 + w 2 x 2 + . . . + w d x d + b f(x) = w_1x_1 +w_2x_2 + ... + w_dx_d +b f(x)=w1x1+w2x2+...+wdxd+b

最小二乘法

基于均方误差最小化来进行模型求解的方法称为最小二乘法。它的主要思想就是选择未知参数，使得理论值与观测值之差的平方和达到最小。

我们假设输入属性（特征）的数目只有一个：
f ( x i ) = w x i + b , 使得 f ( x i ) ≈ y i f(x_i) = wx_i + b, 使得f(x_i) \approx y_i f(xi)=wxi+b,使得f(xi)≈yi在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧式距离之和最小。
( w ∗ , b ∗ ) = a r g m i n ( w , b ) ∑ i = 1 m ( f ( x i ) − y i ) 2 (w^*,b^*) = \underset{(w,b)}{argmin} \sum_{i = 1}^{m} {(f(x_i) - y_i)^2} (w∗,b∗)=(w,b)argmini=1∑m(f(xi)−yi)2

简单示例

代码如下：

import numpy as np import matplotlib.pyplot as plt ## 1. 导入数据 pts = np.genfromtxt("data.csv", delimiter=',') # 提取pts中两列数据，分别作为x,y x = pts[:, 0] y = pts[:, 1] # 用plt画图 plt.scatter(x, y) plt.show()

# 2.定义损失函数 # 损失函数是系数的函数，另外还要传入数据 def cost(w, b, pts): total_ = 0 m = len(pts) # 计算损失误差，求平均值 for i in range(m): x = pts[i, 0] y = pts[i, 1] total_ += (y - w * x - b) ** 2 return total_/m # 3. 定义算法拟合函数 def avg(data): s = 0 n = len(data) for i in range(n): s += data[i] return s/n # 定义拟合函数 def fit(pts): m = len(pts) x_ = avg(pts[:,0]) sum_yx = 0 sum_x2 = 0 for i in range(m): x = pts[i, 0] y = pts[i, 1] sum_yx += y * (x - x_) sum_x2 += x ** 2 # 根据公式计算 w = sum_yx / (sum_x2 - m * (x_ ** 2)) sum_d = 0 for i in range(m): x = pts[i, 0] y = pts[i, 1] sum_d += (y - w * x) b = sum_d / m return w, b

# 测试 w, b = fit(pts) print(f"w is: {w}", f"b is {b}") cos = cost(w, b, pts) print(f"cost is: {cos}") # 画出拟合曲线 plt.scatter(x,y) # 针对每个x 计算 y pred_y = w * x + b plt.plot(x, pred_y, c='b') plt.show()

探索Vortex开源GPGPU：RISC-V SIMT架构(4-2)，TCU 矩阵计算(2)

目录前言一、TCU模块框图二、WMMA代码分析 2.1 WMMA矩阵分块 2.2 WMMA矩阵地址偏移计算 2.2.1 WMMA matrixA 2.2.2 WMMA matrixB 2.2.3 WMMA matrixC 2.2.4 tcu_int WMMA源代码总结前言本篇分析Vortex矩阵计算的核心模块TCU WMMA。前文：探索Vortex开源GPGPU：RISC-V SIMT架构(4-2)，TCU 矩阵计算(1)https://blog.ZEEKLOG.net/weixin_

Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践

Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践文章目录 * Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践 * Apache IoTDB 核心特性与价值 * Apache IoTDB 监控面板完整部署方案 * 安装步骤 * 步骤一：IoTDB开启监控指标采集 * 步骤二：安装、配置Prometheus * 步骤三：安装grafana并配置数据源 * 步骤四：导入IoTDB Grafana看板 * TimechoDB（基于 Apache IoTDB）增强特性 * 总结与应用场景建议 Apache IoTDB 核心特性与价值 Apache IoTDB 专为物联网场景打造的高性能轻量级时序数据库，以 “设备 - 测点” 原生数据模型贴合物理设备与传感器关系，通过高压缩算法、百万级并发写入能力和毫秒级查询响应优化海量时序数据存储成本与处理效率，同时支持边缘轻量部署、

SQL Server 2019安装教程(超详细图文)

SQL Server 介绍） SQL Server 是由微软（Microsoft）开发的一款关系型数据库管理系统（RDBMS），支持结构化查询语言（SQL）进行数据存储、管理和分析。自1989年首次发布以来，SQL Server 已成为企业级数据管理的核心解决方案，广泛应用于金融、电商、ERP、CRM 等业务系统。它提供高可用性、安全性、事务处理（ACID）和商业智能（BI）支持，并支持 Windows 和 Linux 跨平台部署。一、获取 SQL Server 2019 安装包 1. 官方下载方式前往微软官网注册账号后，即可下载 SQL Server Developer 版本（