3902 积分	0 好友	510 主题

Kaggle航拍小目标检测实战：YOLOv11挑战Leonardo多光谱数据集

发表于 2026-3-27 04:58:53 | 查看: 252| 回复: 0

竞赛官网：https://www.kaggle.com/competitions/leonardo-airborne-object-recognition-challenge/

在执法或搜救等飞行任务中，通过飞机的光电传感器实时、准确地识别目标是保障任务成功的关键。尽管现代目标检测模型在理想、可控的实验室环境中表现出色，但当它们面对真实、复杂的空中成像场景时，挑战便接踵而至：

海上航拍场景中的障碍物与直升机

本次竞赛的目标是开发一个鲁棒的目标检测模型。这个模型需要能够适应高度多变、充满不确定性的空中场景，在追求高精度的同时，还必须做到快速和轻量化，以满足真实机载环境的运行需求。

数据集：包含从真实飞行视频录像中提取的航拍图像，涵盖了可见光（RGB） 和红外光（Infrared） 两种光谱。
任务类型：目标检测（Object Detection）。
代码限制：
- 必须通过 Kaggle Notebook 提交。
- CPU/GPU 运行时间均不得超过 9 小时。
- 禁用互联网访问，但允许使用公开的外部数据和预训练模型。
奖金设置：总奖金 50,000 美元（包括排名前五的排名奖和专门的效率奖）。

数据集包含约 40,000 张 图像，源自直升机摄像头的实时视频流，涵盖了从城市、海洋、乡村到山区等多种作业环境。其核心价值在于高度模拟了真实航拍任务中的各种不确定性：

数据集共标注了 7 类 需要识别的目标对象：

竞赛提供的数据组织形式如下：

文件/文件夹名称	描述
train/	包含约 17,700 张 PNG 格式训练图像。
train.csv	训练集标注文件，包含：`ImageId`、`class`、`bbox`（相对坐标：`x_min y_min x_max y_max`，范围 0.0-1.0）。
test/	测试集图像。提交后，系统会将样例替换为约 20,000 张隐藏测试图像。
sample_submission.csv	提交格式示例。

比赛设立了双重维度的评估体系，不仅看精度，也看效率：

核心指标（mAP）：使用 PASCAL VOC 2010 mean Average Precision (mAP) @ IoU > 0.5。
- 提交格式：ImageId, PredictionString（包含标签、置信度及归一化后的坐标 x_min y_min x_max y_max）。
效率指标（Efficiency Prize）：为了鼓励开发者设计轻量化模型，特设效率奖。评分公式综合考虑了模型的预测精度（mAP）与在Kaggle环境中的运行时间（Runtime），旨在寻找精度与速度的帕累托最优解。

对于想要深入数据科学竞赛，尤其是计算机视觉和目标检测领域的朋友来说，这类结合了实际应用背景和技术挑战的赛题是绝佳的练手机会。你可以在 云栈社区 找到更多相关的开源实战项目分享和技术讨论，与同行一起交流模型优化的技巧与心得。