前言
本文主要介绍如何在本地服务器部署无需依托高昂价格的 GPU,也可以在本地运行离线 AI 项目的开源 AI 项目 LocalAI。随着 AI 大模型的发展,各大厂商都推出了自己的线上 AI 服务,比如写文章的、文字生成图片或者视频的等等。但是使用这些 AI 软件时,都需要将文件数据传输到商家的服务器上,所以不少用户就会存在这样的担忧:我的数据会泄露吗?我的隐私能得到保护吗?
今天就和大家分享一款可以本地部署的开源 AI 项目,它就是在 github 上已经获得了 27.7K star 的明星项目 LocalAI!它可以在本地直接运行大语言模型 LLM、生成图像、音频等。关键是不需要高端昂贵的 GPU,是的,直接在消费级硬件上通过 CPU 就能推理运行,真正降低了 AI 使用的门槛。
LocalAI 的安装方式也非常简单,支持通过 Shell 脚本或 Docker 容器来本地部署。本例中,将通过 docker 来演示如何快速启动 LocalAI 并进行大模型加载与跨网络环境远程使用。
1. Docker 部署
本例使用 Ubuntu 22.04 进行演示,使用 Docker 进行部署,如果没有安装 Docker,可以查看官方文档进行安装。
安装好 Docker 后,打开终端执行这行命令启动容器即可:
sudo docker run -ti --name local-ai -p8080:8080 localai/localai:latest-cpu
这里使用的镜像是仅使用 CPU 来运行的镜像,如果大家有 Nvidia 显卡的好 GPU,也可以使用下方命令拉取支持 N 卡的镜像来运行容器:
sudo docker run -ti --name local-ai -p8080:8080 --gpus all localai/localai:latest-gpu-nvidia-cuda-12
更多项目配置与使用详情大家也可以访问作者的 github 主页进行查看:https://github.com/mudler/LocalAI
2. 简单使用演示
容器启动后,我们在 Ubuntu 中使用浏览器访问 http://localhost:8080 即可打开 LocalAI 的 Web UI 页面。
能看到页面中央提示我们现在还没有添加大模型,我们可以点击 Gallery,在跳转页面选择一个大模型。
可以看到在这个界面中有 600 多个大模型,并且可以根据用途标签(文字转语音、图片生成、文章生成等等)进行筛选或者在下方输入框搜索指定的模型。
我这里以添加 llama-3.2-1b 模型来进行演示:点击 install 按钮安装等待完成即可。
安装完成后,点击页面上方导航条中的 HOME 回到主页即可发现刚刚添加的 llama-3.2 模型。
想要使用这个 AI 大模型,点击上方导航中的 chat 即可与它聊天了。
点击右侧的模型选择,下拉框中会显示你已经安装的大模型。
目前我只安装了这一个,如果想继续安装其他大模型,可以点击页面上方导航栏中的 Models 进行选择。(跳转的就是首次挑选模型安装的那个页面)
3. 远程访问配置
不过我们目前只能在本地局域网内访问刚刚部署的 LocalAI 来使用 AI 大模型聊天,如果想不在同一局域网内时,也能在外部网络环境使用手机、平板、电脑等设备远程访问与使用它,应该怎么办呢?我们可以使用内网穿透工具来实现远程访问的需求。无需公网 IP,也不用设置路由器那么麻烦。
下面是安装内网穿透工具的通用步骤:
通常可以通过注册相关服务获取临时隧道地址。使用一键脚本安装命令(具体命令请参考所选工具文档):
# 示例命令,请替换为实际工具的安装脚本
sudo curl https://get.tool.sh | sh
安装完成后,执行下方命令查看服务状态:
sudo systemctl status tool
工具安装和成功启动服务后,在浏览器上输入主机 IP 加管理端口即访问管理界面,使用注册的账号登录,登录后即可看到 web 配置界面,接下来在 web 界面配置即可。


