别在自己造轮子了!推荐一款功能炸裂的开源人工智能解决方案,内置产品级IOC、以图搜图,人像搜索

别在自己造轮子了!推荐一款功能炸裂的开源人工智能解决方案,内置产品级IOC、以图搜图,人像搜索


💂 个人网站:IT知识小屋🤟 版权: 本文由【IT学习日记】原创、在ZEEKLOG首发、需要转载请联系博主💬 如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦

文章目录

简介

本项目是一款依托于JAVA实现的通用人工智能解决方案,涵盖了模型训练、推理到Web/桌面应用的一整套AI功能。支持产品级OCR文字识别(可自定义模板)、图像搜索、人脸检索、智能抠图、照片上色、图像增强、机器翻译、RAG搜索以及大模型接入等,可开箱即用。

系统采用主流技术栈:SpringBoot + Vue搭建,后端使用SpringBoot提供API服务,前端基于Vue实现可视化管理,支持模块化部署和二次开发。项目代码完全开源,模块之间高度解耦,用户可按需引入,灵活扩展,特别适合需要快速集成 AI 功能的企业与个人开发者。


开发环境

CPU Windows x64, Linux x64, macOS x64 GPU (CUDA) Windows x64, Linux x64 

模型下载:https://pan.baidu.com/s/16933J3dX16xnjbYaay-4og?pwd=cwxk


功能模块

1、AI训练平台【模型定制】

  • 项目位置:/2_training_platform
  • 使用人群:面向java程序员,满足图像识别分类定制化需求
  • 功能清单:支持图像分类模型训练、支持图像1:1

数据上传:

超参数配置:

训练可视化:

2、AI Web应用

 - 项目位置:/4_web_app - 技术栈:前端VUE,后端Springboot - 使用方式:可直接部署使用,使用UI或者调用API集成到现有的系统中 - 功能清单:图像生成、人脸搜索、以图搜图、以文搜图、一键抠图、文本搜索、图像生成 

OCR:自定义模版识别(项目位置:/4_web_app/iocr)

  • 参照锚点设置
  • 内容识别区设置

以图搜图

 - 项目位置:/4_web_app/image_search,一共提供了三个不同的版本 - 无向量引擎的版本,适合100万图片以下:mini_image_search - 向量引擎的版本,无管理系统的精简版:simple_image_search - 向量引擎的版本,完整的产品级应用:image_search 
  • 图片上传:支持服务器端文件夹上传(大量图片使用,如千万张图片入库)、提取人脸特征方式、支持客户端文件夹上传
  • 图像搜索

跨模态:以文搜图,以图搜图

 - 项目位置:/4_web_app/image_text_search,提供了2个不同的版本 - 无向量引擎的版本,适合100万图片以下:mini_image_text_search - 向量引擎的版本,适合100万图片以上:image_text_search 
  • 图片上传:提取特征
  • 以文搜图:输入文本如:雪地上两只狗
  • 以图搜图

人脸搜索

 - 项目位置:/4_web_app/face_search 
  • 上传图片:点击提取人脸特征按钮
  • 人脸搜索

一键抠图

 - 项目位置:/4_web_app/image_seg,提供了2个不同的版本 - 一键抠图完整版,包含:框选一键抠图,通用一键抠图,人体一键抠图,动漫一键抠图:image_seg - 框选一键抠图:image_seg_sam2 
  • 框选一键抠图
  • 框选一键抠图

文本搜索

 - 项目位置:/4_web_app/text_search,提供了2个不同的版本 - 随时对数据进行插入、删除、搜索、更新等操作,结合大模型实现RAG功能,根据需要替换其它的特征提取模型:1_sdks\2_nlp_sdks\embedding - 无向量引擎的版本,适合100万条数据以下:simple_text_search - 向量引擎的版本,适合100万条数据以上:text_search 
  • 上传数据:点击提取特征按钮
  • 文本搜索

图像生成

 - 项目位置:/4_web_app/aigc_image_gen - 图像生成模型链接: https://pan.baidu.com/s/1znJi092mth3z68Oq_j2lsA?pwd=dmra - 预处理模型链接: https://pan.baidu.com/s/1h75UaEqg_paias8Z1pEjOQ?pwd=yqek 

Canny 辅助生成:Canny边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,常用于生成线稿

线稿提取辅助生成:Lineart边缘检测预处理器,可很好识别出图像内各对象的边缘轮廓,用于生成线稿

3、AI能力平台【开箱即用】

 - 项目位置:/3_api_platform - 技术栈:前端VUE,后端Springboot - 应用:可以直接部署使用,使用UI或者调用API集成到现有的系统中 - 支持的能力清单:OCR文字识别、机器翻译、语音识别、一键高清、 一键抠图、黑白照片上色、图像生成 - 模型下载:https://pan.baidu.com/s/1RIKaZJXMPbGXnB2sKtWsgQ?pwd=1uuf 
  • OCR文字识别:自由文本识别,支持旋转、倾斜的图片
  • 语音识别:英文语音识别、文语音识别
  • 机器翻译:支持202种语言互相翻译
  • 图像增强:图片一键高清,提升图片4倍分辨率
  • 人体一键抠图

开源地址&使用手册

点击下方的【IT学习日记】回复【资源】领取!

如果这篇文章对您有帮助,请一定帮我点个 “关注”“点赞”,这对我非常重要。我将会继续推荐更多优质项目和新闻。

写在最后

1000+优质开源项目更新进度:286/1000。如需更多类型优质项目推荐,请在文章后留言。

在这里插入图片描述

Read more

VRCT语音翻译工具实战指南:打破VRChat语言壁垒的智能解决方案

VRCT语音翻译工具实战指南:打破VRChat语言壁垒的智能解决方案 【免费下载链接】VRCTVRCT(VRChat Chatbox Translator & Transcription) 项目地址: https://gitcode.com/gh_mirrors/vr/VRCT 在VRChat的全球化社交环境中,语言差异常常成为交流的障碍。VRCT作为一款专为VRChat设计的智能语音翻译工具,通过先进的语音识别和实时翻译技术,让不同语言的玩家能够无障碍沟通。这款开源工具真正实现了"语言无国界"的VR社交体验!🎯 新手入门:VRCT工具快速安装配置步骤 从官方仓库下载最新版本 访问项目仓库获取最新的安装包,支持Windows系统一键安装。整个过程简单直观,即使是技术新手也能轻松完成。 基础功能设置与界面熟悉 启动VRCT后,你会看到一个清晰的用户界面,分为两大核心区域: 左侧控制面板包含: * 翻译功能开关(Translation) * 语音转文字功能(Voice2Chatbox) * 扬声器转录功能(Speaker2Log) * 前台显示控制(Foreg

By Ne0inhk
无人机结构设计核心要点解析

无人机结构设计核心要点解析

一、 核心组成部分 1.机身/机架 功能:承载所有设备的平台,是无人机的“骨架”。 要点: 布局:多旋翼常见的布局有X型、H型、+型等,影响飞行的稳定性和前向飞行的效率。 臂长:决定了螺旋桨尺寸和轴距(对角电机距离),直接影响抗风性、载重和机动性。 减震:通常在相机或飞控安装处使用柔性材料(如硅胶垫)来隔离电机和螺旋桨的振动,对航拍图像质量至关重要。 模块化:便于维修、更换和运输。 2.动力系统 电机: 类型:主要使用无刷电机,效率高、寿命长。 KV值:每伏特电压对应的空载转速。低KV值配大螺旋桨用于大载重;高KV值配小螺旋桨用于竞速。 电子调速器: 接收飞控指令,精确控制电机的转速和转向。 需要有足够的电流容量和良好的散热。 螺旋桨: 尺寸与螺距:直径和螺距决定了推力与效率。大直径/低螺距适合稳定悬停;小直径/高螺距适合高速飞行。

By Ne0inhk
MySQL:表的增删查改

MySQL:表的增删查改

CRUD : Create(创建), Retrieve(读取),Update(更新),Delete(删除) 一、Create(insert) 语法: INSERT [INTO] table_name       [(column [, column] ...)]       VALUES (value_list) [, (value_list)] ... value_list: value, [, value] ... [ ]内的是可以省略的 案例: 创建一个学生表  1.1 单行数据 + 指定列插入  value_list 数量必须和定义表的列的数量及顺序一致  可以不用指定id,因为mysql会用默认的值进行自增  1.2 单行数据 + 全列插入 全列插入可以省略values左侧的列属性   1.3 多行数据 + 全列插入 多行数据用逗号隔开

By Ne0inhk

2026年10大网络爬虫工具横评:从Scrapy到Bright Data,我为什么最终选择了“不写代码”?

作为一个写了多年爬虫、踩过无数反爬坑、被Cloudflare封到怀疑人生的全栈工程师。今天这篇文章,不是那种泛泛而谈的“Top 10工具推荐”,而是一次真实的技术选型复盘——在2025年底,我们团队为一个跨境电商竞品监控项目重新评估所有主流爬虫方案后,最终放弃自研、全面转向SaaS服务的决策过程。 如果你也曾: * 在凌晨三点调试Scrapy的IP代理池; * 被LinkedIn的JS指纹检测搞得想砸键盘; * 或者在老板问“为什么数据还没回来?”时无言以对…… 那么,请继续往下读。这可能是你今年看到的最实用的一篇爬虫工具评测。 我们到底要抓什么? 项目需求很典型: ✅ 实时监控全球50+电商平台(Amazon、eBay、Walmart、Zalando等) ✅ 抓取商品价格、库存、评论、促销信息 ✅ 每日抓取量 > 200万条 ✅ 数据延迟 < 15分钟 ✅ 关键要求:不能被封,不能丢数据 过去三年,我们用的是 Scrapy + 自建住宅代理池 + Playwright渲染 的混合架构。听起来很酷,但维护成本高得离谱—

By Ne0inhk