first commit

This commit is contained in:
admin
2026-05-20 15:05:35 +08:00
commit ac09b26253
2048 changed files with 189478 additions and 0 deletions

View File

@@ -0,0 +1,167 @@
#!/bin/bash
# =================================================================
# YOLO 模型批量并行预测脚本
# =================================================================
# - 此脚本会自动为每个模型架构查找其训练好的 'best.pt'
# - 使用 'echo "1" |' 来自动选择找到的第一个训练版本
# - 在不同的指定GPU上并行执行预测任务
# =================================================================
# --- 1. Conda 环境设置 ---
CONDA_BASE_PATH="/home/wkmgc/miniconda3" # <--- 在这里修改为您自己的 Conda 路径
CONDA_ENV_NAME="${SEG_CONDA_ENV:-seg_smp}" # 可用 SEG_CONDA_ENV=SMP bash yolo_predict.sh 临时覆盖
pt_name="best.pt" # <--- 在这里修改为您想使用的权重文件名,例如 "best.pt" 或 "epoch100.pt"
conf_threshold=0.2 # <--- [新增] 默认的置信度阈值
heatmap_method="None" # <--- [!! 新增 !!] 默认不运行热度图
# 循环解析参数
while [[ $# -gt 0 ]]; do
key="$1"
case $key in
--pt_name)
if [ -n "$2" ] && [[ "$2" != -* ]]; then
pt_name="$2"
shift # 移过 --pt_name
shift # 移过它的值
else
echo "错误: --pt_name 参数需要一个值。" >&2
exit 1
fi
;;
--conf)
if [ -n "$2" ] && [[ "$2" != -* ]]; then
conf_threshold="$2"
shift # 移过 --conf
shift # 移过它的值
else
echo "错误: --conf 参数需要一个值。" >&2
exit 1
fi
;;
--heatmap_method)
if [ -n "$2" ] && [[ "$2" != -* ]]; then
heatmap_method="$2"
shift # 移过 --heatmap_method
shift # 移过它的值
else
echo "错误: --heatmap_method 参数需要一个值 (例如 'GradCAM' 或 'All')。" >&2
exit 1
fi
;;
*)
# 移过未知参数,不报错
shift
;;
esac
done
# 初始化并激活 Conda 环境
if [ -f "${CONDA_BASE_PATH}/etc/profile.d/conda.sh" ]; then
source "${CONDA_BASE_PATH}/etc/profile.d/conda.sh"
conda activate "${CONDA_ENV_NAME}"
if [ $? -ne 0 ]; then
echo "错误: 激活 Conda 环境 '${CONDA_ENV_NAME}' 失败!"
exit 1
fi
echo "Conda 环境 '${CONDA_ENV_NAME}' 已成功激活。"
else
echo "错误: 找不到 conda.sh 脚本。请检查您的 CONDA_BASE_PATH 设置是否正确。"
exit 1
fi
# --- 2. 模型与 GPU 配置 ---
# 此处的分组应与 train.sh 保持一致,以确保能正确找到模型并分配资源
GPUS_GROUP_0="0"
GPUS_GROUP_1="1"
GPUS_GROUP_2="2"
GPUS_GROUP_3="3"
# TODO #
GPUS_GROUP_4="0"
GPUS_GROUP_5="1"
GPUS_GROUP_6="2"
GPUS_GROUP_7="3"
# 从 yolo_config.py/train.sh 中选择的模型列表
GROUP_0_MODELS=("YOLO11l-seg")
GROUP_1_MODELS=("YOLOv8n-seg" "YOLOv8m-seg")
GROUP_2_MODELS=("YOLO11n-seg" "YOLO11s-seg" "YOLO11m-seg")
GROUP_3_MODELS=("YOLOv9e-seg")
GROUP_4_MODELS=("YOLO11x-seg")
GROUP_5_MODELS=("YOLOv9c-seg" "YOLOv8s-seg")
GROUP_6_MODELS=("YOLOv8l-seg" "YOLO12-seg")
GROUP_7_MODELS=("YOLOv8x-seg")
# 1. 从 config.py 中读取 PREDICT_BEST_MODEL_DIR 的值
PREDICT_BEST_MODEL_DIR=$(python -c "from yolo_config import PREDICT_BEST_MODEL_DIR; print(PREDICT_BEST_MODEL_DIR)")
# 检查是否成功获取了 PREDICT_BEST_MODEL_DIR
if [ -z "$PREDICT_BEST_MODEL_DIR" ] || [ ! -e "$PREDICT_BEST_MODEL_DIR" ]; then
echo "PREDICT_BEST_MODEL_DIR: $PREDICT_BEST_MODEL_DIR"
echo "Error: Could not read PREDICT_BEST_MODEL_DIR from yolo_config.py. Exiting."
echo "Error 2: Or the directory specified by PREDICT_BEST_MODEL_DIR does not exist. Please create it first."
exit 1
fi
# 2. 定义带有时间戳的日志目录名
LOG_DIR_NAME="yolo_predict_logs_parallel_$(date +%Y-%m-%d_%H-%M-%S)"
# 3. 拼接成最终的完整路径
LOG_DIR="$PREDICT_BEST_MODEL_DIR/$LOG_DIR_NAME"
mkdir -p "${LOG_DIR}"
echo "所有模型的预测日志将保存在 ./${LOG_DIR}/ 目录中。"
echo "----------------------------------------------------"
# --- 3. 预测执行函数 ---
# 定义一个函数来启动一组预测,以避免代码重复
start_prediction_group() {
# 使用 nameref (引用) 来传递数组
local -n models=$1
local gpus=$2
local group_name=$3
echo ">>> 准备启动 ${group_name} 的预测任务 (后台运行)..."
# 遍历指定组中的所有模型
for model_key in "${models[@]}"; do
if [ "${heatmap_method}" == "None" ]; then
# --- 模式 1: 运行标准预测 (原有逻辑) ---
echo " -> 正在后台启动 [标准预测]: ${model_key} on GPUs: ${gpus}"
# [注意] 我为您添加了 --conf 参数,您原有的脚本 没有传递它
echo "1" | CUDA_VISIBLE_DEVICES=${gpus} python yolo_predict_V2.py --model "${model_key}" --pt_name "${pt_name}" --conf "${conf_threshold}" > "${LOG_DIR}/${model_key}_predict.log" 2>&1 &
echo " - 模型 ${model_key} 的预测已在后台启动。日志文件: ${LOG_DIR}/${model_key}_predict.log"
else
# --- 模式 2: 运行热度图可视化 ---
echo " -> 正在后台启动 [热度图可视化]: ${model_key} on GPUs: ${gpus} (Method: ${heatmap_method})"
# [注意] 我们使用 yolo_predict_visualize_nn.py 并传递新参数
echo "1" | CUDA_VISIBLE_DEVICES=${gpus} python yolo_predict_visualize_nn.py --model "${model_key}" --target_layers "default" --cam_method "${heatmap_method}" --pt_name "${pt_name}" > "${LOG_DIR}/${model_key}_heatmap.log" 2>&1 &
echo " - 模型 ${model_key} 的热度图已在后台启动。日志文件: ${LOG_DIR}/${model_key}_heatmap.log"
fi
echo " - 等待 5 秒,确保 GPU 资源稳定分配..."
sleep 5
done
echo ">>> ${group_name} 的所有模型均已启动。"
echo "----------------------------------------------------"
}
# --- 4. 依次启动所有预测任务 ---
# 脚本将快速地按顺序启动每一组任务到后台
start_prediction_group GROUP_0_MODELS "${GPUS_GROUP_0}" "第零组"
start_prediction_group GROUP_1_MODELS "${GPUS_GROUP_1}" "第一组"
start_prediction_group GROUP_2_MODELS "${GPUS_GROUP_2}" "第二组"
start_prediction_group GROUP_3_MODELS "${GPUS_GROUP_3}" "第三组"
start_prediction_group GROUP_4_MODELS "${GPUS_GROUP_4}" "第四组"
start_prediction_group GROUP_5_MODELS "${GPUS_GROUP_5}" "第五组"
start_prediction_group GROUP_6_MODELS "${GPUS_GROUP_6}" "第六组"
start_prediction_group GROUP_7_MODELS "${GPUS_GROUP_7}" "第七组"
# --- 5. 等待所有后台任务完成 ---
echo ""
echo "--- 所有模型均已在后台启动。现在等待所有预测任务完成... ---"
# 'wait' 命令会暂停脚本,直到所有由此脚本启动的后台子进程全部执行完毕
wait
echo "--- 所有后台预测任务已全部完成! ---"
# --- 6. 退出脚本 ---
echo "预测流程结束。"
conda deactivate
echo "已取消激活 Conda 环境。"