人工智能 10 大热门算法详解 | 极客日志

PythonAI算法

人工智能 10 大热门算法详解

线性回归、逻辑回归、决策树、朴素贝叶斯、支持向量机、集成学习、K 近邻、K-means、神经网络及深度强化学习（DQN）等十种主流人工智能算法。涵盖各算法的原理、训练方法、优缺点及适用场景，并提供 Python Scikit-learn 或 TensorFlow 代码示例，帮助开发者快速理解核心机制并应用于房价预测、分类、聚类及游戏控制等实际任务。

蜜桃汽水发布于 2025/2/6更新于 2026/6/321 浏览

人工智能 10 大热门算法详解

人工智能技术在现代生活中越来越重要，本文介绍的这些算法是使其变得智能的关键。无论是大模型的聊天对话、房价预测，还是智能驾驶，这些算法都在背后默默工作。

本文将介绍十种特别热门的人工智能算法：线性回归、逻辑回归、决策树、朴素贝叶斯、支持向量机（SVM）、集成学习、K 近邻算法、K-means 算法、神经网络和强化学习 Deep Q-Networks (DQN)。我们将探讨它们的工作原理、适用场景以及对生活的影响。

1. 线性回归

模型原理：线性回归致力于寻找一条最佳拟合直线，确保这条直线能够精确地穿过散点图中的数据点，形成最佳的拟合曲线。

模型训练：通过利用已知的输入和输出数据对模型进行训练。追求的是最小化预测值与实际值之间的平方误差，以此来实现模型的优化。

优点：线性回归模型以其简洁易懂、计算效率高的特点备受青睐。

缺点：对于处理非线性关系的能力较为有限，这是其不可忽视的局限性。

使用场景：在预测连续值的问题上表现卓越，如预测房价、股票价格等。

示例代码（使用 Python 的 Scikit-learn 库构建一个简单的线性回归模型）：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics

# 创建数据集
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([[2], [4], [6], [8], [10]])

# 将数据集分割为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 创建线性回归模型
regressor = LinearRegression()

# 使用训练数据拟合模型
regressor.fit(X_train, y_train)

# 预测测试集结果
y_pred = regressor.predict(X_test)

# 打印预测结果
print('预测结果:', y_pred)

# 计算并打印模型的性能
print(, metrics.mean_absolute_error(y_test, y_pred))
(, metrics.mean_squared_error(y_test, y_pred))
(, np.sqrt(metrics.mean_squared_error(y_test, y_pred)))


plt.scatter(X_test, y_test, color=)
plt.plot(X_test, y_pred, color=, linewidth=)
plt.show()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 加载数据集
# df = pd.read_csv('dataset.csv')

# 提取特征和目标变量
# X = df['feature'].values.reshape(-1,1)
# y = df['target'].values

# 模拟数据以便运行
import numpy as np
X = np.random.rand(100, 1).reshape(-1, 1)
y = (np.sum(X, axis=1) > 0.5).astype(int)

# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建逻辑回归模型
log_reg = LogisticRegression()

# 使用训练数据训练模型
log_reg.fit(X_train, y_train)

# 使用测试数据预测结果
y_pred = log_reg.predict(X_test)

# 计算预测精度
accuracy = accuracy_score(y_test, y_pred)

print(f"模型的预测精度为：{accuracy}")

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建决策树分类器
clf = DecisionTreeClassifier()

# 训练模型
clf.fit(X_train, y_train)

# 预测测试集
y_pred = clf.predict(X_test)

# 计算模型准确率
accuracy = accuracy_score(y_test, y_pred)
print("Model accuracy:", accuracy)

import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score

# 步骤 2: 加载或创建数据集
iris = load_iris()
X = iris.data
y = iris.target

# 步骤 3: 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 步骤 4: 创建并训练朴素贝叶斯分类器
gnb = GaussianNB()
gnb.fit(X_train, y_train)

# 步骤 5: 评估分类器性能
y_pred = gnb.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

import numpy as np
from sklearn import svm
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 创建一个简单的数据集
X = np.array([[1, 2], [2, 3], [3, 3], [2, 1]])
y = np.array([0, 0, 1, 1])

# 将数据集分割为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建 SVM 分类器实例
clf = svm.SVC(kernel='linear')  # 使用线性核函数

# 在训练集上训练分类器
clf.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=42)

# 训练模型
clf.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report, confusion_matrix

# 加载 Iris 数据集
iris = load_iris()
X = iris.data
y = iris.target

# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 对特征进行标准化处理
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 创建 KNN 分类器实例
knn = KNeighborsClassifier(n_neighbors=3)

# 训练分类器
knn.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = knn.predict(X_test)

# 评估分类器的性能
print("混淆矩阵:")
print(confusion_matrix(y_test, y_pred))

print("\n分类报告:")
print(classification_report(y_test, y_pred))

from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt

# 生成模拟数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)

# 可视化原始数据
plt.scatter(X[:, 0], X[:, 1], c='lightblue', marker='o', s=50)
plt.title('原始数据')
plt.show()

# 创建 K-means 聚类器实例
kmeans = KMeans(n_clusters=4)

# 对数据进行拟合
kmeans.fit(X)

# 获取聚类标签
labels = kmeans.labels_

# 获取聚类中心
centroids = kmeans.cluster_centers_

# 可视化聚类结果
plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis', marker='o', s=50)
plt.scatter(centroids[:, 0], centroids[:, 1], c='red', marker='x', s=200, alpha=0.5)
plt.title('K-means 聚类结果')
plt.show()

import tensorflow as tf
from tensorflow.keras.datasets import iris
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 加载鸢尾花数据集
(x_train, y_train), (x_test, y_test) = iris.load_data()

# 对数据进行预处理
y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)

# 创建神经网络模型
model = Sequential([
    Dense(64, activation='relu', input_shape=(4,)),
    Dense(32, activation='relu'),
    Dense(3, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 训练模型
model.fit(x_train, y_train, epochs=10, batch_size=32)

# 测试模型
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print('Test accuracy:', test_acc)

import tensorflow as tf
import numpy as np
import random
import gym
from collections import deque

# 设置超参数
BUFFER_SIZE = int(1e5)
BATCH_SIZE = 64
GAMMA = 0.99
TAU = 1e-3
LR = 1e-3
UPDATE_RATE = 10

# 定义经验回放存储
class ReplayBuffer:
    def __init__(self, capacity):
        self.buffer = deque(maxlen=capacity)

    def push(self, state, action, reward, next_state, done):
        self.buffer.append((state, action, reward, next_state, done))

    def sample(self, batch_size):
        return random.sample(self.buffer, batch_size)

# 定义 DQN 模型
class DQN:
    def __init__(self, state_size, action_size):
        self.state_size = state_size
        self.action_size = action_size
        self.model = self._build_model()
        # 修复缺失的目标网络初始化
        self.target_model = tf.keras.models.clone_model(self.model)
        self.step = 0

    def _build_model(self):
        model = tf.keras.Sequential()
        model.add(tf.keras.layers.Dense(24, input_dim=self.state_size, activation='relu'))
        model.add(tf.keras.layers.Dense(24, activation='relu'))
        model.add(tf.keras.layers.Dense(self.action_size, activation='linear'))
        model.compile(loss='mse', optimizer=tf.keras.optimizers.Adam(learning_rate=LR))
        return model

    def remember(self, state, action, reward, next_state, done):
        self.replay_buffer.push((state, action, reward, next_state, done))

    def act(self, state):
        if np.random.rand() <= 0.01:
            return random.randrange(self.action_size)
        act_values = self.model.predict(state)
        return np.argmax(act_values[0])

    def replay(self, batch_size):
        minibatch = self.replay_buffer.sample(batch_size)
        for state, action, reward, next_state, done in minibatch:
            target = self.model.predict(state)
            if done:
                target[0][action] = reward
            else:
                Q_future = max(self.target_model.predict(next_state)[0])
                target[0][action] = reward + GAMMA * Q_future
            self.model.fit(state, target, epochs=1, verbose=0)
        if self.step % UPDATE_RATE == 0:
            self.target_model.set_weights(self.model.get_weights())

    def load(self, name):
        self.model.load_weights(name)

    def save(self, name):
        self.model.save_weights(name)

# 创建环境
env = gym.make('CartPole-v1')
state_size = env.observation_space.shape[0]
action_size = env.action_space.n

# 初始化 DQN 和回放存储
dqn = DQN(state_size, action_size)
replay_buffer = ReplayBuffer(BUFFER_SIZE)

# 训练过程
total_steps = 10000
for step in range(total_steps):
    state = env.reset()
    state = np.reshape(state, [1, state_size])
    for episode in range(100):
        action = dqn.act(state)
        next_state, reward, done, _ = env.step(action)
        next_state = np.reshape(next_state, [1, state_size])
        replay_buffer.push((state, action, reward, next_state, done))
        state = next_state
        if done:
            break
    # 补全训练循环逻辑
    if len(replay_buffer.buffer) > BATCH_SIZE:
        dqn.replay(BATCH_SIZE)
        dqn.step += 1

人工智能 10 大热门算法详解

人工智能 10 大热门算法详解

1. 线性回归

更多推荐文章

相关免费在线工具

2. 逻辑回归

3. 决策树

4. 朴素贝叶斯

5. 支持向量机（SVM）

6. 集成学习

7. K 近邻算法

8. K-means 算法

9. 神经网络

10. 深度强化学习 (DQN)

更多推荐文章

相关免费在线工具

人工智能 10 大热门算法详解

人工智能 10 大热门算法详解

1. 线性回归

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 逻辑回归

3. 决策树

4. 朴素贝叶斯

5. 支持向量机（SVM）

6. 集成学习

7. K 近邻算法

8. K-means 算法

9. 神经网络

10. 深度强化学习 (DQN)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具