智能车竞赛惯导校准与视觉避障实战思路分享

前言

在智能车竞赛中，我们团队取得了优异成绩。作为技术负责人，我想分享一下备赛过程中的一些技术思路。为了保持竞争力，部分核心算法细节将不公开。

本文记录了备赛过程中的全流程经验，包括网络优化、上位机辅助处理、扫码策略、P 点返回校准、STM32 源码修改及数据处理脚本。

网络问题

参赛初期常遇到严重的网络延迟问题——上位机延迟。第二年备赛时我们非常重视此问题。

初期使用家用路由器，在校赛期间表现良好。赛后升级了高性能无线路由器。调试时建议携带专用路由器，实验室环境下可消除延时。赛场上建议使用较少占用的信道（如 165 信道），但需注意现场干扰情况。

文章配图图 1 高性能无线路由器

连接方式上，上位机和终端最好都使用网线连接路由器，避免使用板载无线网卡。

调试阶段若开启中继模式可能导致信道不可调，进而引发轮次增加后的延时。建议放弃云端 API 调用，转用本地部署方案。

现场网络环境复杂，部分队伍因网络问题未能晋级。图生文环节对网络依赖较高，云端 API 质量虽好但易受现场影响，本地部署模型效果有限。

上位机辅助处理

在上位机视角中，桶和 P 点底部会有红线标识。这是通过上位机的 bridge_client.py 单独运行 Python 脚本接收 YOLO 结果，并使用 tkinter 库绘制实现的。画出障碍物位置可以帮助操作者快速确定障碍物位置。

import tkinter as tk
from rclpy.node import Node
from rclpy.qos import QoSProfile, ReliabilityPolicy
from std_msgs.msg import String, Int32
from sensor_msgs.msg import Image
from nav_msgs.msg import Odometry
from origincar_msg.msg import Sign
from cv_bridge import CvBridge
import cv2
import numpy as np
import keyboard
from threading import Thread

class LLM2Origincar:
    def __init__(self, host, port):
        self.ros = None
        .host = host
        .port = port
        .roadblock_list = []
        .end_list = []
        .init_ros()
        .init_topic()
        .init_thread()
        .keep()

     ():
        
        .yolo_sub = Topic(.ros, , , latch=)
        .yolo_sub.subscribe(.yolo_sub_callback)

     ():
        .roadblock_list.clear()
        .end_list.clear()
         target  msg[]:
             target[] == :
                rect = target[][][]
                .roadblock_list.append({
                    : rect[],
                    : rect[],
                    : rect[] + rect[],
                })
             target[] == :
                rect = target[][][]
                .end_list.append({
                    : rect[],
                    : rect[],
                    : rect[],
                    : rect[] + rect[],
                    : target[][][],
                })

     ():
        :
             :
                canvas.delete()
                canvas.create_line(, , , , fill=, width=)
                canvas.create_line(, , , , fill=, width=)
                 .roadblock_list:
                     obst  .roadblock_list:
                        b = (obst[] * )
                        canvas.create_line(
                            (obst[] * ),
                            b,
                            ((obst[] + obst[]) * ),
                            b,
                            fill=,
                            width=
                        )
                 .end_list:
                     end  .end_list:
                        x1 = (end[] * )
                        y1 = (end[] * )
                        x2 = ((end[] + end[]) * )
                        y2 = (end[] * )
                        canvas.create_line(x1, y2, x2, y2, fill=, width=)
                        canvas.create_text(((x1+x2)/), (y1-)  (y1-) >   , text=.(end[]), fill=)

import rclpy from rclpy.node import Node import cv2 import numpy as np from sensor_msgs.msg import Image from std_msgs.msg import String, Int32 from nav_msgs.msg import Odometry from origincar_msg.msg import Sign from cv_bridge import CvBridge TASK1 = 1 TASK2_WAITFOR_CMD = 2 TASK2 = 3 TASK3 = 4 TASK_STOP = 5 class QrCodeDetection(Node): def __init__(self): super().__init__('QRcodeSub') self.Sign4ReturnSub = self.create_subscription(Int32, 'sign4return', self.sign4return_callback, 10) self.ImageSub = self.create_subscription(Image, '/aurora/rgb/image_raw', self.image_callback, 10) self.OdomSub = self.create_subscription(Odometry, '/odom_combined', self.Odom_callback, 10) self.qrcode_publisher = self.create_publisher(String, "/qrcode_information", 10) self.info_result = String() self.sign_publisher = self.create_publisher(Sign, '/sign_switch', 10) self.sign_msg = Sign() self.detector = cv2.wechat_qrcode_WeChatQRCode( "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/detect.prototxt", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/detect.caffemodel", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/sr.prototxt", "/userdata/WorkSpace/codes/src/qrcode/qrcode/model/sr.caffemodel" ) self.bridge = CvBridge() self.node_run = False self.task = TASK1 def image_callback(self, msg): if self.node_run and (self.task == TASK1 or self.task == TASK2): cv2_image = self.bridge.imgmsg_to_cv2(msg, desired_encoding='mono8')[155:,:] res = self.detector.detectAndDecode(cv2_image)[0] if res: self.node_run = False for r in res: self.info_result.data = str(r) self.qrcode_publisher.publish(self.info_result) self.get_logger().info("{}".format(self.info_result.data)) if self.info_result.data == "AntiClockWise": self.sign_msg.sign_data = 4 elif self.info_result.data == "ClockWise": self.sign_msg.sign_data = 3 else: try: data = int(r) if data % 2: self.sign_msg.sign_data = 3 else: self.sign_msg.sign_data = 4 except: pass self.sign_publisher.publish(self.sign_msg) self.info_result.data = "None" self.sign_msg.sign_data = 0 else: return def sign4return_callback(self, msg): if msg.data == 0 or msg.data == -1: self.task = TASK1 self.node_run = False if msg.data == 5: self.task = TASK2 elif msg.data == 6: self.task = TASK3 def Odom_callback(self, msg): if self.task == TASK1 and msg.pose.pose.position.x > 2: self.node_run = True if __name__ == '__main__': rclpy.init(args=None) qrCodeDetection = QrCodeDetection() while rclpy.ok(): rclpy.spin(qrCodeDetection) qrCodeDetection.destroy_node() rclpy.shutdown()

import argparse import os import shutil import time from pathlib import Path import torch import torch.backends.cudnn as cudnn import cv2 from models.experimental import attempt_load from utils.datasets import LoadImages from utils.utils import non_max_suppression, scale_coords, xyxy2xywh from utils.torch_utils import select_device, time_synchronized def auto_annotate(source, weights, output, img_size=640, conf_thres=0.25, iou_thres=0.45, view_img=False): device = select_device(device) half = device.type != 'cpu' model = attempt_load(weights, map_location=device) imgsz = img_size if half: model.half() names = model.module.names if hasattr(model, 'module') else model.names dataset = LoadImages(source, img_size=imgsz) t0 = time.time() img = torch.zeros((1, 3, imgsz, imgsz), device=device) _ = model(img.half() if half else img) if device.type != 'cpu' else None for path, img, im0s, _ in dataset: img = torch.from_numpy(img).to(device) img = img.half() if half else img.float() img /= 255.0 if img.ndimension() == 3: img = img.unsqueeze(0) t1 = time_synchronized() pred = model(img, augment=False)[0] pred = non_max_suppression(pred, conf_thres, iou_thres, classes=None, agnostic=False) t2 = time_synchronized() p, im0 = path, im0s.copy() txt_path = str(Path(output) / Path(p).stem) + ('.txt') open(txt_path, 'w').close() whwh gn = torch.tensor(im0.shape)[[1, 0, 1, 0]] if pred is not None: for i, det in enumerate(pred): if det is not None and len(det): det[:, :4] = scale_coords(img.shape[2:], det[:, :4], im0.shape).round() with open(txt_path, 'w') as f: if det is not None and len(det): for *xyxy, conf, cls in reversed(det): xywh = (xyxy2xywh(torch.tensor(xyxy).view(1, 4)) / gn).view(-1).tolist() line = "%d %.6f %.6f %.6f %.6f" % (cls, *xywh) f.write(line + "\n") else: f.write("") print(f'{Path(p).name} done. ({t2 - t1:.3f}s)') if view_img: cv2.imshow(Path(p).name, im0) if cv2.waitKey(1) == ord('q'): raise StopIteration print(f'Done. ({time.time() - t0:.3f}s)') if __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument('--source', type=str, default='dataset_process/new1/images', help='输入图像文件夹路径') parser.add_argument('--weights', type=str, default='runs/2025.7.28/weights/last.pt', help='模型权重路径') parser.add_argument('--output', type=str, default='dataset_process/new1/labels', help='输出标签路径') parser.add_argument('--img-size', type=int, default=640, help='推理尺寸 (像素)') parser.add_argument('--conf-thres', type=float, default=0.25, help='目标置信度阈值') parser.add_argument('--iou-thres', type=float, default=0.45, help='NMS 的 IOU 阈值') parser.add_argument('--device', help='cuda 设备，如 0 或 0,1,2,3 或 cpu') parser.add_argument('--view-img', action='store_true', help='显示结果') opt = parser.parse_args() print(opt) with torch.no_grad(): auto_annotate( source=opt.source, weights=opt.weights, output=opt.output, img_size=opt.img_size, conf_thres=opt.conf_thres, iou_thres=opt.iou_thres, device=opt.device, view_img=opt.view_img )

import torch import torchvision.transforms as T import torchvision.transforms.functional as TF from pathlib import Path import shutil from PIL import Image import random from multiprocessing import Pool import os class YOLOAugment: def __init__(self, output_dir): self.output_dir = output_dir Path(f"{output_dir}/images").mkdir(parents=True, exist_ok=True) Path(f"{output_dir}/labels").mkdir(parents=True, exist_ok=True) self.img_augment = T.Compose([ T.ColorJitter(brightness=0.3, contrast=0.3, saturation=0.2), T.GaussianBlur(kernel_size=(3, 7)) ]) def apply_augment(self, img_path, label_path, aug_id): img = Image.open(img_path).convert('RGB') with open(label_path) as f: bboxes = [list(map(float, line.strip().split())) for line in f] img_tensor = TF.to_tensor(img) bboxes_tensor = torch.tensor(bboxes) img_tensor = self.img_augment(img_tensor) stem = Path(img_path).stem self._save_results(img_tensor, bboxes_tensor, stem, aug_id) return img, bboxes def _save_results(self, img_tensor, bboxes, stem, aug_id): aug_img = TF.to_pil_image(img_tensor) aug_img.save(f"{self.output_dir}/images/{stem}_aug{aug_id}.jpg") with open(f"{self.output_dir}/labels/{stem}_aug{aug_id}.txt", 'w') as f: for bbox in bboxes.numpy(): line = " ".join(map(str, bbox)) f.write(line + '\n') def process_file(args): img_path, label_path, output_dir, aug_per_image = args augmenter = YOLOAugment(output_dir) for i in range(1, aug_per_image + 1): augmenter.apply_augment(img_path, label_path, i) shutil.copy(img_path, f"{output_dir}/images/{Path(img_path).name}") shutil.copy(label_path, f"{output_dir}/labels/{Path(label_path).name}") if __name__ == "__main__": root_path = os.path.dirname(__file__) input_dir = os.path.join(root_path, "new1") output_dir = os.path.join(root_path, "new1_aug") aug_per_image = 3 num_workers = 4 tasks = [] for img_file in Path(f"{input_dir}/images").glob("*.*"): if img_file.suffix.lower() in ('.jpg', '.png', '.jpeg'): label_file = Path(f"{input_dir}/labels/{img_file.stem}.txt") if label_file.exists(): tasks.append((str(img_file), str(label_file), output_dir, aug_per_image)) print(f"开始增强 {len(tasks)} 张图像...") with Pool(processes=num_workers) as pool: pool.map(process_file, tasks) orig_count = len(tasks) aug_count = orig_count * aug_per_image print(f"处理完成！\n" f"- 原始图像保留：{orig_count} 张\n" f"- 增强图像生成：{aug_count} 张\n" f"- 总数据量：{orig_count + aug_count} 张")

import os import zipfile import math from pathlib import Path def create_task_packs(images_dir, labels_dir, output_dir, tasks=3, label_txt=False): image_files = sorted([f for f in os.listdir(images_dir) if f.endswith(('.jpg', '.png'))]) label_files = sorted([f for f in os.listdir(labels_dir) if f.endswith('.txt')]) image_stems = {Path(f).stem for f in image_files} label_stems = {Path(f).stem for f in label_files} unmatched = image_stems.symmetric_difference(label_stems) if unmatched: print(f"⚠️ 警告：发现 {len(unmatched)} 个不匹配文件（示例：{list(unmatched)[:3]}）") print("建议先运行数据校验脚本修复不一致问题！") return total_pairs = len(image_files) pairs_per_task = math.ceil(total_pairs / tasks) print(f"数据集统计:") print(f"- 图片数量：{len(image_files)}") print(f"- 标注数量：{len(label_files)}") print(f"- 将分成 {tasks} 个任务包，每个约 {pairs_per_task} 对数据\n") os.makedirs(output_dir, exist_ok=True) for task_num in range(1, tasks + 1): start_idx = (task_num - 1) * pairs_per_task end_idx = min(start_idx + pairs_per_task, total_pairs) task_images = image_files[start_idx:end_idx] task_labels = [Path(f).stem + '.txt' for f in task_images] zip_path = os.path.join(output_dir, f"task_{task_num}.zip") print(f"创建任务包 {task_num}:") print(f"- 包含图片：{len(task_images)} 张") print(f"- 包含标注：{len(task_labels)} 个") print(f"- 保存到：{zip_path}") with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf: for img in task_images: img_path = os.path.join(images_dir, img) zipf.write(img_path, f"images/{img}") for label in task_labels: label_path = os.path.join(labels_dir, label) if os.path.exists(label_path): zipf.write(label_path, f"labels/{label}") else: print(f"⚠️ 缺失标注文件：{label}") if label_txt is not False: label_info = Path(label_txt).open("r").read() zipf.writestr(f"labels/labels.txt", label_info) print("-" * 50) print(f"\n🎉 任务包创建完成！共生成 {tasks} 个压缩包，保存在：{output_dir}") if __name__ == "__main__": root_path = os.path.dirname(__file__) dataset_dir = os.path.join(root_path, "new1") output_dir = os.path.join(root_path, "package") label_txt = os.path.join(root_path, "labels.txt") num_tasks = 4 create_task_packs( images_dir=os.path.join(dataset_dir, "images"), labels_dir=os.path.join(dataset_dir, "labels"), output_dir=output_dir, tasks=num_tasks, # label_txt=label_txt, )

智能车竞赛惯导校准与视觉避障实战思路分享

前言

网络问题

上位机辅助处理

更多推荐文章

相关免费在线工具

半场扫码

准确返回 P 点

思路 1——使用地图的固定元素来校准

思路 2——不重置里程计，使用 YOLO 识别 P 点结果来校正终点

修改 STM32 源码

补充

附

这份是让模型贴标签的：

这份是删除无效数据的：

这份是数据增强的：

这份是让队友打工的：

更多推荐文章

相关免费在线工具

智能车竞赛惯导校准与视觉避障实战思路分享

前言

网络问题

上位机辅助处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

半场扫码

准确返回 P 点

思路 1——使用地图的固定元素来校准

思路 2——不重置里程计，使用 YOLO 识别 P 点结果来校正终点

修改 STM32 源码

补充

附

这份是让模型贴标签的：

这份是删除无效数据的：

这份是数据增强的：

这份是让队友打工的：

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具