如何通过 3 个简单步骤在 Windows 上本地运行 DeepSeek

如何通过 3 个简单步骤在 Windows 上本地运行 DeepSeek

它是免费的——社区驱动的人工智能💪。

        当 OpenAI 第一次推出定制 GPT 时,我就明白会有越来越多的人为人工智能做出贡献,并且迟早它会完全由社区驱动。

        但从来没有想过它会如此接近😂让我们看看如何在 Windows 机器上完全免费使用第一个开源推理模型! 

步骤 0:安装 Docker 桌面

        我确信很多人已经安装了它,所以可以跳过,但如果没有 — — 这很简单,只需访问Docker 的官方网站,下载并运行安装 👍

        如果您需要一些特定的设置,例如使用 WSL,那么有很多指导视频,请查看!我将继续下一步。

步骤 1:安装 CUDA 以获得 GPU 支持

        如果您想使用 Nvidia 显卡运行 LLM,则必须安装 CUDA 驱动程序。(嗯……是的,它们需要大量的计算能力)

        打开CUDA 下载页面,根据需要点击“Windows”和其他选项,然后选择“本地”作为安装程序类型:

下载并完成安装即可👍,此处需要重新启动。 

第 2 步:安装 Ollama 并下载模型

前往Ollama 网站并点击下载按钮 😆

        Ollama是一款开源 AI 工具,使用户能够在其设备上本地运行大型语言模型,为自然语言处理任务提供定制化、高效和离线功能。

安装后,打开“Windows PowerShell”

并通过运行来验证您的安装ollama -v

再次打开ollama网站并选择您的型号:

        有几种选择,我建议从 7b 开始,并检查它如何与您的机器配合使用。例如,我运行 i7-11 系列处理器和 NVIDIA GeForce RTX 2080 SUPER 以及 8GB GPU,我可以在正常(可以说是“可接受的”)速度下使用 14b 型号。

正如我所说,它需要大量的计算能力 

选择后,点击复制按钮: 

并在 PowerShell 中运行:

它将像上面一样下载并打开 shell,您可以在这里直接与它聊天,但是让我们/bye对它说,并继续设置一个实际的 UI,而不是从 PowerShell 提示 💪

步骤3:安装Open-WebUI

打开github 页面,找到“ Open WebUI with Nvidia GPU support”

复制该命令并再次在 PowerShell 中运行它。它将下载所有需要的 docker 镜像并运行容器,您可以通过http://localhost:3000/访问该容器

对于任何 LLM 用户来说,这都是一个熟悉的用户界面,左侧边栏用于聊天,左上角可用于选择已安装的模型等。

Open-WebUI 具有大量功能,例如 RAG、图像生成、网页浏览等。您可以在此处查看完整列表 

社区驱动的人工智能← 获取有关人工智能的更多内容 👍

所有信息和观点均仅代表我个人的见解。

如果您喜欢此文章,请收藏、点赞、评论,谢谢,祝您快乐每一天。  

Read more

【Docker进阶篇】告别OOM Kill!Java容器化内存与CPU限制实战指南

【Docker进阶篇】告别OOM Kill!Java容器化内存与CPU限制实战指南

🍃 予枫:个人主页 📚 个人专栏: 《Java 从入门到起飞》《读研码农的干货日常》 💻 Debug 这个世界,Return 更好的自己! 引言 做Java容器化部署的小伙伴,大概率都踩过这样的坑:明明给容器配置了–memory限制,JVM也设了-Xmx参数,结果应用还是频繁被OOM Kill;要么就是CPU限制设太高,资源浪费严重,设太低又导致应用卡顿。今天就彻底搞懂Java容器化中CPU和内存限制的核心逻辑,避开配置陷阱,让应用稳定运行不翻车! 文章目录 * 引言 * 一、为什么Java容器化,内存和CPU配置容易出问题? * 二、容器内存限制(--memory)配置指南(重点避坑) * 2.1 容器内存的组成的部分 * 2.2 内存配置黄金比例(实战可用) * 实战示例(重点) * 2.3 关键避坑点(必看) * 三、容器CPU限制(--cpus)

By Ne0inhk
Flutter 三方库 openapi_dart_common 的鸿蒙化适配指南 - 实现具备强类型契约的高性能 API 通讯模型、支持端侧 OpenAPI/Swagger 协议的自动化生成与对齐实战

Flutter 三方库 openapi_dart_common 的鸿蒙化适配指南 - 实现具备强类型契约的高性能 API 通讯模型、支持端侧 OpenAPI/Swagger 协议的自动化生成与对齐实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 openapi_dart_common 的鸿蒙化适配指南 - 实现具备强类型契约的高性能 API 通讯模型、支持端侧 OpenAPI/Swagger 协议的自动化生成与对齐实战 前言 在进行 Flutter for OpenHarmony 的企业级前后端分离开发时,如何保证客户端请求代码与后端 API 定义的绝对同步?手动编写 API 模型不仅低效,且极易引发类型不匹配导致的生产 Bug。openapi_dart_common 是 OpenAPI (Swagger) 官方生成器在 Dart 端的基石库。它提供了一套标准的序列化、参数处理及抽象拦截器机制。本文将探讨如何在鸿蒙端构建极致稳健的工程化接口层。 一、原直观解析 / 概念介绍 1.1

By Ne0inhk
Flutter 三方库 mobx_codegen — 自动化驱动的高性能响应式状态管理(适配鸿蒙 HarmonyOS Next ohos)

Flutter 三方库 mobx_codegen — 自动化驱动的高性能响应式状态管理(适配鸿蒙 HarmonyOS Next ohos)

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net。 在 Flutter 状态管理的璀璨星空中,MobX 以其“透明的函数式响应式编程”(TFRP)特性脱颖而出。它让开发者能以声明式的方式描述状态,而让框架自动处理状态变更到 UI 刷新的全过程。 在 Flutter for OpenHarmony 开发中,手动编写 MobX 繁琐的连接代码不仅效率低,且容易出错。mobx_codegen 库通过解析注解,自动生成高性能的底层观察逻辑。今天,我们将探索如何利用自动化力量,在鸿蒙平台上构建出极其灵动的响应式应用。 一、为什么需要 mobx_codegen? 1.1 MobX 的魔法核心 MobX 包含三个核心概念:Observables(被观察的状态)、Actions(改变状态的动作)和 Reactions(对新状态的自动响应)

By Ne0inhk

服务器HBA卡与RAID卡:到底有什么区别?

1.本质定义与功能定位 1.1 HBA卡(主机总线适配器) 定义:HBA(Host Bus Adapter)是连接服务器内部I/O通道与外部存储设备的硬件接口卡,主要承担协议转换和物理连接功能。 核心功能: * 提供高速数据传输通道 * 实现协议转换(如SCSI、SAS、SATA、FC等) * 将存储设备透明呈现给操作系统 * 支持直接设备访问,无中间处理层 1.2 RAID卡(磁盘阵列控制器) 定义:RAID(Redundant Array of Independent Disks)卡是专门管理多个硬盘组成磁盘阵列的硬件控制器,具备数据冗余和性能优化功能。 核心功能: * 实现RAID级别配置(RAID 0/1/5/6/10等) * 提供数据冗余保护与容错机制 * 优化磁盘读写性能(条带化、缓存等) * 支持热插拔与故障磁盘替换

By Ne0inhk