全国大学生智能车竞赛智慧医疗机器人惯导与避障思路分享

前言

在第 20 届全国大学生智能车竞赛（智慧医疗机器人创意赛）中，我们团队获得了国一。作为队长兼技术主力，我想分享一下在备赛过程中的一些思路。为了保持比赛的公平性和竞争性，部分核心代码（如惯导和避障思路）未开源，但主要技术逻辑如下。

本文记录了备赛过程中的关键经验，包括网络问题优化、上位机辅助处理、半场扫码策略、P 点准确返回方法、STM32 源码修改以及数据处理脚本。

网络问题

第一年参赛时，我们遇到了严重的网络延迟问题。第二年备赛，我们非常重视网络稳定性。

初期使用华为 AX3 Pro，在校赛时表现良好。校赛夺冠后，我们升级了设备，最终选用华为 BE7 Pro。在实验室调试时，该路由器无延迟。赛场上我们使用了 165 信道，该信道干扰较少。虽然区域赛前调试发现部分设备（如 ROG 路由器）在 165 信道有延迟，但整体表现稳定。

文章配图

图 1 华为 BE7 Pro 路由器

文章配图

图 2 华为 BE7 Pro 路由器

建议上位机使用网线连接路由器，避免使用板载无线网卡。在区域赛调试时，曾尝试使用路由器的中继模式上网，但开启中继后无法修改信道，导致第 3 轮出现严重延迟。最终放弃云端 API，改用本地部署的大模型作为备用方案。

现场网络问题严重影响比赛，建议提前准备本地部署方案，避免依赖云端 API。

上位机辅助处理

在上位机视角中，桶和 P 点底部会有红线。这是通过 bridge_client.py 单独开启的 Python 脚本接收 YOLO 结果，并使用 tkinter 库绘制出来的。画出障碍物位置可以帮助机师快速确定障碍物位置。

import tkinter as tk
import time
from rclpy.node import Node
from rclpy.qos import QoSProfile, ReliabilityPolicy
from sensor_msgs.msg import Image
from cv_bridge import CvBridge
from ai_msgs.msg import PerceptionTargets

class LLM2Origincar:
    def __init__(self, host, port):
        self.ros = None
        self.host = host
        .port = port
        .roadblock_list = []
        .end_list = []
        .init_ros()
        .init_topic()
        .init_thread()
        .keep()

     ():
        
        .yolo_sub = Topic(.ros, , , latch=)
        .yolo_sub.subscribe(.yolo_sub_callback)

     ():
        .roadblock_list.clear()
        .end_list.clear()
         target  msg[]:
             target[] == :
                rect = target[][][]
                .roadblock_list.append({
                    : rect[],
                    : rect[],
                    : rect[] + rect[],
                })
             target[] == :
                rect = target[][][]
                .end_list.append({
                    : rect[],
                    : rect[],
                    : rect[],
                    : rect[] + rect[],
                    : target[][][],
                })

     ():
        root = tk.Tk()
        root.overrideredirect()
        root.geometry()
        root.attributes(, )
        root.attributes(, )
        canvas = tk.Canvas(root, width=, height=, bg=, highlightthickness=)
        canvas.pack()

        :
             :
                canvas.delete()
                canvas.create_line(, , , , fill=, width=)
                canvas.create_line(, , , , fill=, width=)

                 .roadblock_list:
                     obst  .roadblock_list:
                        b = (obst[] * )
                        canvas.create_line(
                            (obst[] * ),
                            b,
                            ((obst[] + obst[]) * ),
                            b,
                            fill=, width=
                        )

                 .end_list:
                     end  .end_list:
                        x1 = (end[] * )
                        y1 = (end[] * )
                        x2 = ((end[] + end[]) * )
                        y2 = (end[] * )
                        canvas.create_line(x1, y2, x2, y2, fill=, width=)
                        canvas.create_text(
                            ((x1 + x2) / ),
                            (y1 - )  (y1 - ) >   ,
                            text=.(end[]),
                            fill=
                        )
                time.sleep()
         KeyboardInterrupt:
            root.destroy()

import rclpy from rclpy.node import Node import cv2 import numpy as np from sensor_msgs.msg import Image from std_msgs.msg import String, Int32 from nav_msgs.msg import Odometry from origincar_msg.msg import Sign from cv_bridge import CvBridge TASK1 = 1 TASK2_WAITFOR_CMD = 2 TASK2 = 3 TASK3 = 4 TASK_STOP = 5 class QrCodeDetection(Node): def __init__(self): super().__init__('QRcodeSub') self.Sign4ReturnSub = self.create_subscription(Int32, 'sign4return', self.sign4return_callback, 10) self.ImageSub = self.create_subscription(Image, '/aurora/rgb/image_raw', self.image_callback, 10) self.OdomSub = self.create_subscription(Odometry, '/odom_combined', self.Odom_callback, 10) self.qrcode_publisher = self.create_publisher(String, "/qrcode_information", 10) self.info_result = String() self.sign_publisher = self.create_publisher(Sign, '/sign_switch', 10) self.sign_msg = Sign() self.detector = cv2.wechat_qrcode_WeChatQRCode( "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/detect.prototxt", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/detect.caffemodel", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/sr.prototxt", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/sr.caffemodel" ) self.bridge = CvBridge() self.node_run = False self.task = TASK1 def image_callback(self, msg): if self.node_run and (self.task == TASK1 or self.task == TASK2): cv2_image = self.bridge.imgmsg_to_cv2(msg, desired_encoding='mono8')[155:, :] res = self.detector.detectAndDecode(cv2_image)[0] if res: self.node_run = False for r in res: self.info_result.data = str(r) self.qrcode_publisher.publish(self.info_result) self.get_logger().info("\033[94m{}\033[0m".format(self.info_result.data)) if self.info_result.data == "AntiClockWise": self.sign_msg.sign_data = 4 elif self.info_result.data == "ClockWise": self.sign_msg.sign_data = 3 else: try: data = int(r) if data % 2: self.sign_msg.sign_data = 3 else: self.sign_msg.sign_data = 4 except: pass self.sign_publisher.publish(self.sign_msg) self.info_result.data = "None" self.sign_msg.sign_data = 0 else: return def sign4return_callback(self, msg): if msg.data == 0 or msg.data == -1: self.task = TASK1 self.node_run = False elif msg.data == 5: self.task = TASK2 elif msg.data == 6: self.task = TASK3 def Odom_callback(self, msg): if self.task == TASK1 and msg.pose.pose.position.x > 2: self.node_run = True def main(args=None): rclpy.init(args=args) qrCodeDetection = QrCodeDetection() while rclpy.ok(): rclpy.spin(qrCodeDetection) qrCodeDetection.destroy_node() rclpy.shutdown() if __name__ == '__main__': main()

import argparse import os import shutil import time from pathlib import Path import torch import torch.backends.cudnn as cudnn import cv2 from models.experimental import attempt_load from utils.datasets import LoadImages from utils.utils import non_max_suppression, scale_coords, xyxy2xywh from utils.torch_utils import select_device, time_synchronized ''' 用训练过的模型贴标签 ''' def auto_annotate(source, weights, output, img_size=640, conf_thres=0.25, iou_thres=0.45, view_img=False): """ 使用 YOLOv5 模型自动标注图像参数: source (str): 输入图像文件夹路径 weights (str): 模型权重路径 output (str): 输出文件夹路径 img_size (int): 推理尺寸 conf_thres (float): 置信度阈值 iou_thres (float): IOU 阈值 device (str): 使用的设备 (cpu, 0, 1, ...) view_img (bool): 是否显示结果图像 """ # 初始化 device = select_device(device) half = device.type != 'cpu' # 半精度仅在 CUDA 上支持 # 创建输出文件夹 # if os.path.exists(output): # shutil.rmtree(output) # os.makedirs(output) # 创建新的输出文件夹 # os.makedirs(os.path.join(output, 'labels')) # 创建标签文件夹 # 加载模型 model = attempt_load(weights, map_location=device) # 加载 FP32 模型 imgsz = img_size if half: model.half() # 转换为 FP16 # 获取类别名称 names = model.module.names if hasattr(model, 'module') else model.names # 设置数据加载器 dataset = LoadImages(source, img_size=imgsz) # 运行推理 t0 = time.time() img = torch.zeros((1, 3, imgsz, imgsz), device=device) # 初始化图像 _ = model(img.half() if half else img) if device.type != 'cpu' else None # 运行一次 for path, img, im0s, _ in dataset: img = torch.from_numpy(img).to(device) img = img.half() if half else img.float() # uint8 to fp16/32 img /= 255.0 # 0 - 255 to 0.0 - 1.0 if img.ndimension() == 3: img = img.unsqueeze(0) # 推理 t1 = time_synchronized() pred = model(img, augment=False)[0] # 应用 NMS pred = non_max_suppression(pred, conf_thres, iou_thres, classes=None, agnostic=False) t2 = time_synchronized() # 处理检测结果 p, im0 = path, im0s.copy() txt_path = str(Path(output) / Path(p).stem) + ('.txt') # 标签保存路径 # 确保标签文件存在（即使为空） open(txt_path, 'w').close() # 创建空文件或清空现有文件 # 归一化增益 whwh gn = torch.tensor(im0.shape)[[1, 0, 1, 0]] # 处理检测结果（如果有） if pred is not None: for i, det in enumerate(pred): # 每张图像的检测结果 if det is not None and len(det): # 将边界框从 img_size 调整到 im0 大小 det[:, :4] = scale_coords(img.shape[2:], det[:, :4], im0.shape).round() # 写入结果 # 修改写入标签的部分： with open(txt_path, 'w') as f: if det is not None and len(det): for *xyxy, conf, cls in reversed(det): xywh = (xyxy2xywh(torch.tensor(xyxy).view(1, 4)) / gn).view(-1).tolist() # 格式化输出：6 位小数，无行末空格 line = "%d %.6f %.6f %.6f %.6f" % (cls, *xywh) f.write(line + "\n") # 注意：换行符前无空格 else: f.write("") # 空文件（或按需写入占位符） # 打印时间 (推理 + NMS) print(f'{Path(p).name} done. ({t2 - t1:.3f}s)') # 显示结果 (可选) if view_img: cv2.imshow(Path(p).name, im0) if cv2.waitKey(1) == ord('q'): # 按 q 退出 raise StopIteration print(f'Done. ({time.time() - t0:.3f}s)') if __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('--source', type=str, default='dataset_process/new1/images', help='输入图像文件夹路径') parser.add_argument('--weights', type=str, default='runs/2025.7.28/weights/last.pt', help='模型权重路径') parser.add_argument('--output', type=str, default='dataset_process/new1/labels', help='输出标签路径') parser.add_argument('--img-size', type=int, default=640, help='推理尺寸 (像素)') parser.add_argument('--conf-thres', type=float, default=0.25, help='目标置信度阈值') parser.add_argument('--iou-thres', type=float, default=0.45, help='NMS 的 IOU 阈值') parser.add_argument('--device', help='cuda 设备，如 0 或 0,1,2,3 或 cpu') parser.add_argument('--view-img', action='store_true', help='显示结果') opt = parser.parse_args() print(opt) with torch.no_grad(): auto_annotate( source=opt.source, weights=opt.weights, output=opt.output, img_size=opt.img_size, conf_thres=opt.conf_thres, iou_thres=opt.iou_thres, device=opt.device, view_img=opt.view_img )

import torch import torchvision.transforms as T import torchvision.transforms.functional as TF from pathlib import Path import shutil from PIL import Image import random from multiprocessing import Pool import os ''' 数据增强 ''' class YOLOAugment: def __init__(self, output_dir): self.output_dir = output_dir Path(f"{output_dir}/images").mkdir(parents=True, exist_ok=True) Path(f"{output_dir}/labels").mkdir(parents=True, exist_ok=True) # 定义基础增强（仅影响图像） self.img_augment = T.Compose([ T.ColorJitter(brightness=0.3, contrast=0.3, saturation=0.2), T.GaussianBlur(kernel_size=(3, 7)) ]) def apply_augment(self, img_path, label_path, aug_id): """处理单张图像和对应标签""" # 读取原始数据 img = Image.open(img_path).convert('RGB') with open(label_path) as f: bboxes = [list(map(float, line.strip().split())) for line in f] # 转换为 Tensor 格式 img_tensor = TF.to_tensor(img) bboxes_tensor = torch.tensor(bboxes) # 应用图像增强（不影响框） img_tensor = self.img_augment(img_tensor) # 保存增强结果 stem = Path(img_path).stem self._save_results(img_tensor, bboxes_tensor, stem, aug_id) return img, bboxes def _save_results(self, img_tensor, bboxes, stem, aug_id): """保存增强图像和标签""" # 保存图像 aug_img = TF.to_pil_image(img_tensor) aug_img.save(f"{self.output_dir}/images/{stem}_aug{aug_id}.jpg") # 保存标签（YOLO 格式） with open(f"{self.output_dir}/labels/{stem}_aug{aug_id}.txt", 'w') as f: for bbox in bboxes.numpy(): line = " ".join(map(str, bbox)) f.write(line + '\n') def process_file(args): """多进程处理函数""" img_path, label_path, output_dir, aug_per_image = args augmenter = YOLOAugment(output_dir) for i in range(1, aug_per_image + 1): augmenter.apply_augment(img_path, label_path, i) # 保留原始文件 shutil.copy(img_path, f"{output_dir}/images/{Path(img_path).name}") shutil.copy(label_path, f"{output_dir}/labels/{Path(label_path).name}") if __name__ == "__main__": root_path = os.path.dirname(__file__) # 配置参数 input_dir = os.path.join(root_path, "new1") # 原始数据集路径 output_dir = os.path.join(root_path, "new1_aug") # 输出路径 aug_per_image = 3 # 每张图片生成 4 个增强版本 num_workers = 4 # 并行进程数 # 准备列表 tasks = [] for img_file in Path(f"{input_dir}/images").glob("*.*"): if img_file.suffix.lower() in ('.jpg', '.png', '.jpeg'): label_file = Path(f"{input_dir}/labels/{img_file.stem}.txt") if label_file.exists(): tasks.append((str(img_file), str(label_file), output_dir, aug_per_image)) # 多进程处理 print(f"开始增强 {len(tasks)} 张图像...") with Pool(processes=num_workers) as pool: pool.map(process_file, tasks) # 统计结果 orig_count = len(tasks) aug_count = orig_count * aug_per_image print(f"处理完成！\n" f"- 原始图像保留：{orig_count} 张\n" f"- 增强图像生成：{aug_count} 张\n" f"- 总数据量：{orig_count + aug_count} 张")

import os import zipfile import math from pathlib import Path ''' 将数据集分好份打包好 ''' def create_task_packs(images_dir, labels_dir, output_dir, tasks=3, label_txt=False): """ 创建包含匹配 images 和 labels 的 task 压缩包 :param images_dir: 图片文件夹路径 :param labels_dir: 标注文件夹路径 :param output_dir: 输出目录 :param tasks: 需要划分的任务数 """ # 获取匹配的文件对（确保严格对应） image_files = sorted([f for f in os.listdir(images_dir) if f.endswith(('.jpg', '.png'))]) label_files = sorted([f for f in os.listdir(labels_dir) if f.endswith('.txt')]) # 验证一致性 image_stems = {Path(f).stem for f in image_files} label_stems = {Path(f).stem for f in label_files} unmatched = image_stems.symmetric_difference(label_stems) if unmatched: print(f"⚠️ 警告：发现 {len(unmatched)} 个不匹配文件（示例：{list(unmatched)[:3]}）") print("建议先运行数据校验脚本修复不一致问题！") return # 计算每个 task 应包含的文件数 total_pairs = len(image_files) pairs_per_task = math.ceil(total_pairs / tasks) print(f"数据集统计:") print(f"- 图片数量：{len(image_files)}") print(f"- 标注数量：{len(label_files)}") print(f"- 将分成 {tasks} 个任务包，每个约 {pairs_per_task} 对数据\n") # 创建输出目录 os.makedirs(output_dir, exist_ok=True) for task_num in range(1, tasks + 1): start_idx = (task_num - 1) * pairs_per_task end_idx = min(start_idx + pairs_per_task, total_pairs) task_images = image_files[start_idx:end_idx] task_labels = [Path(f).stem + '.txt' for f in task_images] # 自动匹配对应的 labels zip_path = os.path.join(output_dir, f"task_{task_num}.zip") print(f"创建任务包 {task_num}:") print(f"- 包含图片：{len(task_images)} 张") print(f"- 包含标注：{len(task_labels)} 个") print(f"- 保存到：{zip_path}") with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf: # 添加图片 for img in task_images: img_path = os.path.join(images_dir, img) zipf.write(img_path, f"images/{img}") # 添加对应的标注 for label in task_labels: label_path = os.path.join(labels_dir, label) if os.path.exists(label_path): # 双重验证 zipf.write(label_path, f"labels/{label}") else: print(f"⚠️ 缺失标注文件：{label}") if label_txt is not False: label_info = Path(label_txt).open("r").read() zipf.writestr(f"labels/labels.txt", label_info) # 每个任务里面都放进一个 labels.txt print("-" * 50) print(f"\n🎉 任务包创建完成！共生成 {tasks} 个压缩包，保存在：{output_dir}") if __name__ == "__main__": root_path = os.path.dirname(__file__) # 配置参数 dataset_dir = os.path.join(root_path, "new1") # 数据集根目录 output_dir = os.path.join(root_path, "package") # 输出目录 label_txt = os.path.join(root_path, "labels.txt") # 标签文件 num_tasks = 4 # 需要划分的任务数量 # 运行打包 create_task_packs( images_dir=os.path.join(dataset_dir, "images"), labels_dir=os.path.join(dataset_dir, "labels"), output_dir=output_dir, tasks=num_tasks, # label_txt=label_txt, )

全国大学生智能车竞赛智慧医疗机器人惯导与避障思路分享

前言

网络问题

上位机辅助处理

更多推荐文章

相关免费在线工具

半场扫码

准确返回 P 点

思路 1——使用地图的固定元素来校准

思路 2——不重置里程计，使用 YOLO 识别 P 点结果来校正终点

修改 STM32 源码

补充

后记

附：

这份是让模型贴标签的：

这份是删除无效数据的：

这份是数据增强的：

这份是让队友打工的：

更多推荐文章

相关免费在线工具

全国大学生智能车竞赛智慧医疗机器人惯导与避障思路分享

前言

网络问题

上位机辅助处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

半场扫码

准确返回 P 点

思路 1——使用地图的固定元素来校准

思路 2——不重置里程计，使用 YOLO 识别 P 点结果来校正终点

修改 STM32 源码

补充

后记

附：

这份是让模型贴标签的：

这份是删除无效数据的：

这份是数据增强的：

这份是让队友打工的：

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具