请参阅此出版物的讨论、统计数据和作者简介：https: //www.researchgate.net/publication/311501413

单幅无人机图像中道路区域的检测

《IEEE 智能交通系统学报》文章 • 2016 年 12 月
DOI：10.1109/TITS.2016.2622280

CITATIONS

READS

5 位作者，包括：

周海玲南洋理工大学 44 篇论文 968 次引用

Lei Wei 迪肯大学 62 篇出版物 1,046 次引用

◻

查看个人资料

◻

查看个人资料

单幅无人机图像中道路区域的检测

周海玲、孔辉、魏磊（IEEE 会员）、Douglas Creighton（IEEE 会员）和 Saeid Nahavandi（IEEE 高级会员）

抽象的

航拍图像中道路区域的自动检测仍然是一个颇具挑战性的研究课题。大多数现有方法能够很好地满足用户在道路区域内提供一些类似种子的点/笔划作为道路区域的初始位置，或检测特定道路（例如铺设良好的道路或笔直的道路）的需求。本文提出了一种全自动方法，可以从单幅无人机 (UAV) 图像中检测一般道路。该方法主要包含两个部分：道路/非道路种子点的自动生成和道路区域的种子分割。为了确定道路的可能位置（即道路种子），本文基于道路图像的笔划宽度变换 (SWT) 提出了一种独特的道路特征。据我们所知，这是首次引入 SWT 作为道路特征，并在实验中证明了其在图像中有效捕捉道路区域的能力。然后，我们将不同的道路特征（包括基于 SWT 的几何信息、颜色和宽度）结合起来，对道路候选区域进行分类。基于候选区域，本文构建高斯混合模型来生成道路种子和背景种子。最后，基于这些道路和背景种子点，提出一种凸主动轮廓模型分割方法来提取完整的道路区域。在多种无人机影像上的实验结果证明了所提方法的有效性。与现有技术的比较表明，该方法对不同道路区域均具有良好的鲁棒性和准确性。

索引词 - 道路检测、遥感、分割、无人机 (UAV)、航空图像、笔画宽度变换 (SWT)。

一、引言

卫星图像用于提取道路网络，尤其用于 GIS 数据采集和更新。然而，一些应用，例如灾害监测、交通监控[1]-[3]和应急疏散规划[4], [5]，需要实时处理传感数据，而卫星图像不如野外无人机采集的数据[4]那么合适。随着相关硬件的发展，无人机作为一种能够高效采集野外数据的低成本平台[6]被广泛应用。这是无人机图像处理技术发展的主要驱动力。

稿件收到日期：2015 年 8 月 5 日；修改日期：2016 年 2 月 26 日和 2016 年 10 月 15 日；接受日期：2016 年 10 月 23 日。本研究部分由澳大利亚迪肯大学智能系统研究与创新研究所（IISRI）资助；部分由江苏省自然科学基金（合同号：BK20151491）资助；部分由国家自然科学基金（合同号：61672287）资助。本文副主编为 P. Ioannou。（通讯作者：周海玲和孔辉。）
H. Zhou、L. Wei、D. Creighton 和 S. Nahavandi 就职于澳大利亚维多利亚州吉朗市迪肯大学智能系统研究与创新研究所（电子邮箱： hailing.zhou@hotmail.com ；lei.wei@ deakin.edu.au ； douglas.creighton@deakin.edu.au ；saeid.nahavandig@ deakin.edu.au ）。
H. Kong 就职于南京理工大学计算机科学与工程学院，中国南京（电子邮件： konghui@njust.edu.cn ）。

本文中的一个或多个图表的彩色版本可以在 http://ieeexplore.ieee.org 上在线获取。

数字对象标识符 10.1109/TITS.2016.2622280

图 1. 卫星和航拍图像中的道路示例。我们可以看到，基于线的道路模型对于 (a) 这样的图像效果很好；但它们并不适用于 (b) 这样的情况，而这正是本文的重点（低空和中空航拍图像）。
近年来，道路处理和分析越来越受到关注。对于许多基于无人机的应用而言，无人机需要了解道路区域的位置。

在文献 [7]-[10] 中，基于卫星图像的道路检测已得到广泛研究，从早期的基于启发式推理和直线的技术，到通过使用动态规划、多光谱融合和人工辅助使方法更复杂。相比之下，基于无人机图像的道路检测仍处于早期阶段，用于提取无人机图像中的道路（特别是中低空无人机），现有方法大多使用简单的基于颜色的阈值或直线检测来识别道路区域 [8]。在卫星图像中，道路区域通常非常狭窄，因此道路可以建模为直线或曲线 [11]。在无人机图像中，道路区域内的强度/颜色可能不均匀，图像内和/或图像间道路的宽度差异很大，道路可能铺设得不好。参考图 1 作为说明。因此，卫星图像中使用的道路检测方法大多不适用于无人机图像。

上述观察促使我们设计自己的无人机图像道路模型。众所周知，道路本质上包含两个属性：几何形状和辐射度。我们始终可以将道路描绘成“近乎”均匀的细长区域，其宽度“大致”恒定。

^{1}

这意味着单条道路的颜色和宽度变化是有限的。我们的基本思路是引入能够表征这些属性的模型。图像的笔触宽度变换 (SWT) [18] 可以计算每个像素笔触像素的宽度，从而能够清晰地显示道路宽度的变化。道路区域的宽度分布与其他环境（例如房屋、灌木丛和树木）的宽度分布不同，从而能够指示初始道路区域。作为 SWT 的补充特征，道路颜色也

在许多道路场景中，道路区域的颜色与上下文区域的颜色难以区分。因此，本文利用高斯混合模型（GMM）对道路和上下文区域的颜色分布进行建模，进一步细化了道路区域的初始化。基于 SWT 和 GMM 的模型结果均为道路区域中一组离散的点集。

为了获得完整的连续道路分割，需要一个同时具备几何和辐射知识的全局模型。然而，全局模型通常在给定道路区域的先验知识的情况下表现良好。因此，我们引入基于 SWT 和 GMM 的模型来为全局分割提供初始化。Graphcut[27]、随机游走[28]和测地线方法[29]是适合此目的的著名全局模型。通过仔细研究[12]和[20]中的这些模型，我们发现它们对初始化很敏感，并且在鲁棒性方面性能有限。例如，虽然 Graphcut 在我们之前的工作[13]中得到了成功应用，但它不能很好地处理可能具有复杂形状的通用道路，从而导致“捷径”问题[20]。在本文中，我们引入了凸活动轮廓（CAC）模型，该模型能够利用边界和区域信息来搜索全局“最优”解。

本文的主要贡献如下。我们提出了基于 SWT 的模型，并与基于 GMM 的模型相结合，该模型描述道路的几何和辐射特性，以指示道路和非道路的初始区域。据我们所知，这是迄今为止首次提出引入 SWT 作为道路特征的研究。然后，我们将提取的道路和非道路信息整合到 CAC 模型中，以全局优化道路分割。其中，CAC 能量函数经过精心设计，使结果符合种子值，边界与实际道路边界对齐。需要注意的是，直接将全局模型应用于道路检测通常会导致过度分割，并产生一些不重要的解决方案。因此，大多数当前的研究依赖于用户[9]、[21]、[34]的手动辅助来提取种子。相比之下，我们提出的方法包含两个部分：种子选择和道路分割，可以实现全自动检测。在各种无人机道路图像上的实验结果证明了所提出方法对各种航拍图像的有效性。

本文其余部分安排如下。第二部分回顾了最相关的工作。第三部分介绍了我们基于 SWT 和 GMM 的种子选择模型。第四部分详细描述了 CAC 模型如何解决道路检测问题。第五部分讨论了实验结果，第六部分给出了结论。

本文重点研究低空和中空航拍图像中的道路检测，这将有利于无人机的多种应用，例如交通监控、路径规划和巡检。[11] 中开展的早期研究针对的是分辨率在每像素 0.2 米到 0.5 米之间的特定航拍图像，其中道路宽度约为 15 个像素。

路边候选区域的检测方法是：找到宽度固定的平行边对，然后根据强度和连通性进行分组。在 [4] 和 [16] 中，假设道路强度与邻域区域差异很大，并且道路可以用线性线段局部近似。基于此假设，采用基于强度的阈值技术获取初始道路区域，然后对局部线段检测进行改进。

在 [14] 和 [15] 中，基于视觉的无人机导航得到了发展。为了在每一帧图像中定位道路，需要从样本图像中学习道路结构并将其应用于新图像 [14]。通过检测线段对来计算消失点，并利用消失点对图像进行校正以获得校正后的水平扫描。然后通过查找每个水平扫描横截面轮廓中较大的强度变化来识别道路边界。在 [17] 中，基于先验色调和纹理信息的聚类技术用于将每个图像像素分类为目标和背景，然后拟合边界线以细化所需区域。在 [15] 中，他们提出使用高斯混合模型 (GMM) 从给定的样本图像中学习道路颜色分布，然后通过检查符合 GMM 的像素概率来确定每帧中的道路像素。然而，基于 GMM 的检测通常对道路颜色的变化很敏感。此外，不同图像之间道路颜色差异较大，例如包含铺设良好的道路和未开发的土路的图像，这超出了 GMM 的建模能力。在本文中，我们寻求更合适的道路特征来初始化道路区域。

近年来，先进的成像技术已应用于道路提取。在[30]中，激光雷达（LIDAR）系统安装在微型无人机上，用于采集包括道路三维空间位置和强度在内的数据。结合高度和强度信息，可以准确地从树木和建筑物等周围环境中提取道路表面。在[31]中，立体航空影像用于农村地区的道路提取。他们利用强度和三维几何特性对道路进行建模，然后使用动态规划优化模型。然而，这是一种半自动化方法。需要一些种子点来初始化优化过程。

基于目前的研究，典型的道路提取流程已趋于清晰：种子检测，然后基于种子进行传播。在 [33] 中，他们提取边缘像素作为道路基元。利用边缘像素作为观测值，估计道路中心位置的概率密度函数，然后搜索最大极值以找到道路中心。在 [32] 中，他们提出了一种基于足迹的道路轨迹方法，可以自动提取城市地区的道路网络。使用辐条轮算子获取道路足迹，该足迹是道路提取方法的起点（即种子）。从种子开始，使用迭代线段生长过程跟踪道路。结果，提取出近似道路网络结构的内接线。道路的矩形性是该方法的基础，但对于铺设不完善的道路，该方法可能会面临挑战。

我们之前的研究 [2], [6] 侧重于加速无人机每个帧中的道路检测，其中初始化

图2.种子选择流程。
道路位置的获取是通过从样本图像中学习道路颜色来实现的，就像 [15] 中提到的那样。道路追踪可以充分利用视频中道路的连续时空信息，从而可以根据之前的结果快速推断道路区域。因此，对基于视觉的无人机自主导航进行道路初始化非常重要。之后，应用追踪来快速定位新图像中的道路。我们之前的方法是通过从大量图像中学习颜色模型来初始化道路区域。这种方法的性能在很大程度上取决于训练样本中的道路颜色，因此在我们之前的工作中只能检测到特定的道路。为了改进这种方法，本文实现了在单张图像中检测通用道路。针对我们的任务，提出了独特的道路特征：基于 SWT 的几何特征。SWT 和 GMM 的结合能够对图像中的道路进行初始化。

三、道路和非道路种子的选择

在本节中，我们介绍了选择道路和非道路种子的算法。为了初始化任意航拍图像中的道路区域，提出了一个重要的几何特征 SWT 来表征道路的几何属性。由于仅有道路几何特征是不够的，我们结合基于 GMM 的模型来表征道路的颜色属性。图 2 展示了该算法的流程。首先，根据给定图像构建 SWT 图。然后对 SWT 特征进行分组和分类以找到道路候选区域。使用获得的候选区域的像素创建道路 GMM。最后，根据每个像素拟合道路 GMM 的概率来选择道路/非道路种子。

A. 笔画宽度变换

笔画宽度变换最早在 [18] 中提出。它最初是作为文本检测的预处理步骤引入的。SWT 算法计算每个像素的笔画宽度，SWT 的输出是笔画宽度值的映射。SWT 的计算仅在图像边缘位置进行。边缘像素的 SWT 计算为从给定像素

p

开始的线段，沿着起始像素的梯度方向遍历，直到梯度方向与起始边缘像素一致的另一个边缘像素

q

。两个像素之间的距离

‖ \vec{p q} ‖

被设置为线段

[p, q]

上所有像素的 SWT 值。参见图 3 中的图示，其中的线段表示不同的笔画宽度。在本文中，我们扩展了 SWT 图，将线段关联到

图 3. SWT 根据 (b) 的 Canny 边缘将图像 (a) 转换为 ©。

图 4. Canny 边缘增强。(a) 输入图像；(b) Canny 边缘；(c) 均值平移平滑；(d) 使用均值平移和基于色调的检测增强的 Canny 边缘。从 (b) 和 (d) 的结果可以看出，我们的增强方案能够很好地处理细小边缘和低对比度边缘。
具有颜色值，其中颜色值是线段上像素的中值。

显然，SWT 依赖于 Canny 边缘检测器的结果。然而，边缘检测器对噪声敏感，容易产生许多不重要的边缘。此外，检测器对强度的变化很敏感，这常常导致重要边缘的丢失。图 4 显示了一个示例。为了解决这些问题，执行了两个预处理程序。首先，应用边缘保留和降噪的平滑滤波器。我们选择基于 [22] 工作的均值漂移滤波器，因为它在结构保留和区域平滑方面具有良好的性能。其次，由于道路区域的色调值通常与周围区域不同，因此添加了基于色调的边缘检测以增强基于强度的 Canny 检测器。

B. 寻找候选道路

在我们的工作中，基于 SWT 图，我们可以获得一组具有四维属性的线段，即中值 SWT 和线段上对应像素的颜色。下一步是将这些线段进行聚类，并将其分组为道路候选。

考虑到道路这一“概念”，如果线段的长度和颜色相似，则可以将其归为一个簇。为此，我们将 K 均值算法 [23] 应用于线段的长度和颜色，如图 5 所示。在 K 均值算法中，

K

设置为 5。我们发现它在实验中效果良好。然后，通过 [19] 的方法，将相邻的线段分组，形成一个连通分量。注意，我们执行连通

图 5. 道路候选区域。左列：图 1(b) 和图 3(a) 的 SWT。中间列：基于 SWT 线段长度和颜色数据的 K 均值聚类。右列：被分类为道路的连通分量。
在 K 均值聚类之前进行成分分析，可以消除与道路区域上的线段相连的异常线段。

我们现在需要识别可能属于道路的连通分量。首先，我们修剪掉一些不重要的或不太可能是道路区域的分量。为此，我们从包含各种道路和非道路分量的训练数据集中学习了一个增强分类器。有 50 张航拍图像用于训练。我们手动指定道路和非道路区域。连通分量在道路和非道路区域中分别收集。在道路和非道路分量上计算特征以进行增强训练。这些特征包括线段数、像素数、平均笔画宽度、边界框的纵横比以及每个连通分量内笔画宽度的方差。使用分类器，图像中的每个连通分量都会被标记为道路或非道路类别。图 5 显示了一些标记结果。

从图5的结果可以看出，道路候选中可能存在异常值，例如图5©中红色标记的像素。为了进一步提高候选的可靠性，我们考虑将道路像素的颜色分布作为附加信息来重新选择道路像素。

道路的一个重要特征是它们主要表现为近乎同质的区域。为了对颜色进行建模，我们使用了 GMM 算法，因为它在图像分割中非常有效 [2], [6], [13]。高斯分量的数量对 GMM 算法至关重要。在我们之前的研究 [6] 中，我们研究并得出结论，使用 3 个高斯分量对道路进行建模可获得最佳性能。具有 3 个分量的 GMM 能够恰当地描述同质颜色，并且还具有消除异常值的额外效果。

本文简要介绍了从道路候选点构建高斯混合模型 (GMM) 的步骤。更多详情，请参阅我们之前的研究 [2], [6]。首先，将道路候选点的像素聚类成 3 组，每组作为一个高斯分量。

μ_{i}

表示高斯分量的平均颜色值，

Σ_{i}

表示高斯分量的协方差矩阵，

3 \times 3

表示高斯分量的权重。

图 6. 种子选择。(a) 和 (c) 为概率图。(b) 和 (d) 分别以蓝色和红色标记的道路和非道路种子的结果。道路种子实际上是道路候选像素与概率值较高的像素的交集，而非道路种子则是概率值较低的像素。

图 7. 道路分割的 CAC 模型说明。（a）边界项

g (x)

，（b）区域项

r (x)

，© 带有

u (x) > 0.5

的分割结果。
分量，其中

i = 1, 2, 3

。GMM 定义为

{(μ_{1}, Σ_{1}, w_{1}), (μ_{2}, Σ_{2}, w_{2}), (μ_{3}, Σ_{3}, w_{3})}

。使用以下公式计算每个像素颜色

c

符合 GMM 的概率：

P_{G M M} (c) = \sum_{i = 1}^{3} [w_{i} \frac{1}{\sqrt{\det (Σ_{i})}} e^{(- \frac{1}{2} {(c - μ_{i})}^{T} Σ_{i}^{- 1} (c - μ_{i}))}] .

使用对数似然值

\log P

创建概率图。示例如图 6 所示。通过丢弃概率值较小的像素，可以细化道路候选区域。此外，基于非道路像素与候选区域颜色差异较大的假设，还可以获取非道路种子。如图 6 所示，概率较小的暗像素对应于非道路区域。

IV. 基于 CAC 的道路检测

获得的种子点是散乱的点或线，不足以进行道路检测。为了提取完整的道路区域，需要基于区域的分割。我们选择 CAC 模型而非 Graphcut，因为它在处理复杂形状的道路方面具有优势，并且对种子点变化具有鲁棒性。该模型由经典的活动轮廓模型（也称为蛇形模型）[24]演变而来，该模型会局部调整轮廓以贴近物体的边界。但它的一个缺点是经常陷入局部最小值。CAC 模型

图 8. 增强前后 SWT 的对比，左右两幅图重复显示。上行：输入图像和增强图像。中间行：种子提取结果。下行：道路检测结果。
通过建立凸模型[25]并引入快速求解器[26]来寻找全局最小值，解决了这个问题。我们将简要回顾 CAC 模型及其求解器，然后详细描述如何扩展能量函数以实现我们的目的。

A. CAC 模型和高效求解器

[25] 建立的 CAC 模型将图像分割表述为以下优化问题：

min_{0 \leq u \leq 1} {E = \int_{Ω} g ‖ \nabla u ‖ d x + λ \int_{Ω} r u d x}

\nabla

表示一阶梯度算子，

‖ \cdot ‖

表示欧氏范数。

u

是在图像域

Ω

上定义的分割函数，取值范围为 0 到 1。能量

E

已被证明是凸的，因此存在一个全局最小化器

u

，将

Ω

分割成一个封闭子集

Ω_{C} = {x

：

u (x) > T} . T

是一个阈值

T \in [0, 1]

，通常为

T = 0.5

。

基本上，

E

由两个由权衡参数

λ > 0

平衡的项组成。

第一项是边界项，它确保轮廓 $C$ 具有平滑的边界，并沿着 $g$ 最小的曲线延伸。 $g$ 的一个常见选择是边缘指示函数 $g (x) = 1 / (1 + ‖ \nabla I (x) ‖^{2})$ ，其中 $I$ 是图像的强度函数。
第二项是区域项，它有利于具有 $r . r$ 中定义的相干属性的分割区域 $Ω_{C}$ （或 $Ω - Ω_{C}$ ），通常设置为相对于强度函数 $I$ 的保真度度量，例如 $r (x) = {(I (x) - c_{i n})}^{2} -$ ${(I (x) - c_{out})}^{2}$ ，其中 $c_{in}$ 和 $c_{out}$ 分别是分割区域 $Ω_{C}$ 和 $Ω - Ω_{C}$ 的平均强度。
为了求解 (2)，我们需要迭代更新 $r$ ，然后计算 $u$ ，直到 $Ω_{C}$ 和 $Ω - Ω_{C}$ 不再变化，这就是众所周知的轮廓演化过程。瓶颈在于当 $r$ 固定时，最小化器 $u$ 的计算。为此，Goldstein 等人最近提出了一种基于 Split Bregman 方法的高效求解器 [26]。其基本思想是通过使用可微惩罚项来强制执行不等式约束，将问题 (2) 转化为无约束问题。
函数，如（3）所示。

(u^{*}, d^{*}) = \arg min_{0 \leq u \leq 1, d} \int_{Ω} (g ‖ d ‖ + λ r u) d x + \frac{η}{2} ‖ d - \nabla u ‖^{2}

为了严格执行约束

d = \nabla u

，Goldstein 等人采用了高效的 Bregman 迭代。

B. 使用种子 CAC 进行道路检测

CRC 模型最初是为自动图像分割而设计的，但对于复杂图像，它通常会返回带有琐碎区域的过度分割结果。在本研究中，我们需要修改模型以纳入种子信息，类似于 [20]。为了实现这一点，式（2）中的边界项和区域项定义如下，图 7 展示了一些结果。

种子提供了道路和非道路区域颜色分布的线索。我们使用高斯混合模型 (GMM) 来表示颜色分布，如第 III-C 节所述。我们根据道路和非道路种子创建两个 GMM，分别记为 GMM1 和 GMM2。然后，我们将这些颜色信息合并到 CAC 模型的区域项中，如下所示。

r (x) = \log P_{G M M 2} (c (x)) - \log P_{G M M 1} (c (x)),

其中

c (x)

表示像素

x

处的 RGB 值。该定义有利于获得与 GMM 一致的分割结果。如果颜色

c (x)

接近道路模型（即

\log P_{G M M 1} (c (x)) > \log P_{G M M 2} (c (x))

和

r

为负），则在 (2) 最小化过程中，

u

的值会趋于增加，从而导致

u (x) > T

的出现，最终将像素归类为道路。

$g$ 的原始定义是 $g_{I} = 1 / (1 + ‖ \nabla I ‖^{2})$ ，它仅仅基于强度函数 $I$ ，而这通常存在平滑弱边缘的问题。为了解决这个问题，我们建议将 GMM 概率图（即 $\log P_{G M M 1}$ ）和色调图像结合起来，如下所示

g = g_{P} + g_{h} + g_{I}

图 9. SWT 线段聚类性能评估。文中给出了详细的分析。
其中

g_{P}

、

g_{h}

和

g_{I}

分别是概率图、色调图像和强度图像上的边缘指示函数。
在执行轮廓演化过程之前，任何活动轮廓模型都需要初始化。本文使用了一个简单的阈值结果

r (x)

，该结果在实验中效果良好。阈值选择为道路种子点处

r (x)

的平均值。

此外，我们需要保证分割结果与种子点相符。换句话说，

u

预计在道路种子点的位置较大，而在非道路种子点的位置较小。为了实现这一点，我们在轮廓演化过程中强制实施严格的约束，即分别给道路种子点（以及非道路种子点）的位置分配一个极小的

r

值和一个极大的

r

值。

五、实验结果与讨论

本节将进行实验以评估我们提出的方法。为了证明我们提出的方法的有效性，我们使用 200 幅航拍图像进行测试，并额外使用 50 幅航拍图像进行训练和验证。这些图像来自互联网和我们的无人机。图像集包含各种道路，包括不同分辨率、宽度和形状的铺设良好的道路和欠发达道路。道路图像也表现出颜色、光照和对比度的变化。数据集可从 https://sites.google.com/site/hailingzhouwei/ 下载。

本文通过将结果与地面实况逐像素比较来进行定量评估。我们将地面实况定义为每幅测试图像中手动标注的道路区域。引入两个定量测量指标：精度

p

和错误率

ϵ

。

p

表示正确分类的道路像素占检测到的道路像素总数的百分比，定义为

p = T P / (T P + F P)

。

ϵ

表示错误分类的图像像素占地面实况道路像素总数的百分比，定义为

ϵ = (F P + F N) / (T P + F N)

。

T P

图 10. 种子选择结果。从左到右：连通域图示、分类器选定的道路候选域以及以蓝色/红色显示的道路/非道路种子域。请注意，为了清晰起见，图中未显示小连通域。

图 11。高阈值和低阈值的设置。 (a) 从左到右的种子分别为 (

R_{h} = 230, R_{l} = 20

)、 (

R_{h} = 230, R_{l} = 50

) 和 (

R_{h} = 190

R_{l} = 50

)。 (b) 相应的分割结果，我们可以看到使用不同的设置可以检测到相似的道路区域。

F P

和

F N

分别表示真阳性、假阳性和假阴性。期望结果具有高精度和低错误率。我们使用 C++ 语言编写的 Microsoft Visual Studio 2012 在搭载 Intel i7-2600K 3.40 GHz CPU 的台式机上实现了该方法。

A. 种子提取

如本文所述，SWT 特征对于描述道路至关重要。然而，传统的 SWT 算法在低对比度和道路噪声的图像上经常出现问题，无法提供种子提取所需的道路几何信息。为了解决这个问题，本文提出了两种预处理方法来增强 SWT。图 8 通过比较种子提取和道路检测的结果，评估了增强前后 SWT 的性能。

为了将 SWT 线段分组成有意义的聚类，K 均值算法应用于 SWT 的长度和颜色。图 9 比较了使用和不使用 K 均值算法的性能，以及仅基于长度属性和仅基于颜色属性的聚类性能。图 9(a)-mid

图 12. 使用不同种子进行道路检测。(a) 道路检测的种子；(b) 图切割的结果；(c) 随机游走的结果；(d) CAC 模型的结果。从结果可以看出，我们的方法可以使用不同的种子实现更稳健的分割。
显示了未使用 K 均值的 SWT 线段，其中大多数 SWT 线段是相连的。通常会产生单个较大的组件。在图 9(a)-right 中，仅基于长度属性进行聚类，其中大多数线段是分离的且没有连接。通常会产生许多包含少量线段的琐碎组件。在图 9(a)-mid 和 (a)-right 中找不到有效的道路组件。图 9(b) 显示了仅基于颜色属性的聚类结果、检测到的道路候选以及使用 CAC 模型的最终道路分割。相比之下，图 9© 显示了基于长度和颜色属性的聚类的相应结果。可以看出，基于颜色的聚类容易给道路检测引入颜色噪声，如 (b)-mid 和 (b)-right 所示。通过在聚类中同时考虑颜色和长度属性，可以解决问题，如 ©-mid 和 ©-right 所示。

图 10 展示了一些种子选择的结果。图 10 左侧展示了使用 [19] 算法对 SWT 线段进行聚类后获得的连通分量的示例。每个连通分量都用特定的颜色渲染，并被旋转的边界框包围。然后，这些连通分量被分类以找到道路候选区域，如图 10 中间所示。图 10 右侧展示了获得的道路/非道路种子，这些种子是通过对颜色与候选 GMM 拟合的像素概率进行阈值化来确定的。

下面将讨论用于选择道路和非道路种子的高阈值

R_{h}

和低阈值

R_{l}

的设置。我们在不同的图像上验证了该设置，结果表明

R_{h} = 230

和

R_{l} = 20

在我们的实验中效果良好。图 11 展示了不同设置的种子以及最终检测到的道路区域，从图中可以看出，最终的分割结果对不同的设置都具有相当的鲁棒性。这归功于 CAC 全局优化的引入。更多演示如图 12 所示。

图 13. (2) 中参数

λ

的不同设置。从左到右：(a)

λ = 1 e - 5, λ = 1 e - 4, λ = 1 e - 3

；(b)

λ = 1 e - 5, λ = 5 e - 4

，

λ = 1 e - 4

。

B. 道路提取

引入 CAC 模型后，可以提取出准确的道路区域，如图 12、图 15、图 16 和图 17 所示，更多结果见补充材料。我们将 CAC 模型与现有的图切、随机游走等模型进行了比较，对于宽度和颜色恒定的简单道路，这三个模型可以得到相似的结果，但对于复杂道路，图切和随机游走高度依赖于种子，不同的种子位置或数量会产生不同的分割结果，如图 12 所示。从结果中我们可以看出，CAC 模型对种子的变化具有更强的鲁棒性。性能评估的统计数据见表 1。为了公平起见，使用单条道路的图像来比较图切和随机游走的平均精度、错误率和运行时间。平均运行时间是在平均分辨率为

617 \times 411

的图像上计算的。

CAC 模型中有一个参数

λ

，用于控制分割的细节和平滑度。较低的值通常会减少分割细节，并增加边界的平滑度。表 II 给出了在不同设置下针对

λ

的精度和错误率的统计分析。图 13 中展示了一些示例，从中我们可以看出

图 15. 不同场景下单条道路提取结果。可以看出，我们的方法并不局限于检测宽度恒定的直线道路。我们的方法还可以检测到形状弯曲、宽度变化、对比度低且边界不清晰的一般道路。更多结果请参阅补充材料。

图 16. 检测复杂道路（例如交叉路口和环形交叉路口）的结果。我们的方法在各种条件下都能获得良好的检测效果，包括道路与背景对比度低、未开发的土路以及杂乱的背景。更多结果请参阅补充材料。

表一
所提算法的性能评估

方法	$p$	$ϵ$	运行时间
我们与 CAC 合作的方法	$92.3 %$	$9.8 %$	0.961秒
带有 graphcut	$87.5 %$	$12.5 %$	0.958秒
随机游走	$83.9 %$	$18.2 %$	28.324 秒

λ

非常小的 CAC 模型容易导致较大的

F P

误差，而

λ

非常大的 CAC 模型容易导致较大的

F N

误差。根据我们的实验，

λ = 1 e - 4

的性能最佳，分割细节和平滑度达到了平衡。

表二
不同值

λ

的精度和错误率统计

$λ$	$1 e - 5$	$5 e - 5$	$1 e - 4$	$5 e - 4$	$1 e - 3$	$5 e - 3$
$p$	$83.7 %$	$88.2 %$	$92.3 %$	$88.6 %$	$89.7 %$	$91.6 %$
$ϵ$	$18.4 %$	$11.9 %$	$9.8 %$	$13.5 %$	$16.7 %$	$21.4 %$

C. 比较

我们将我们的方法与现有的中低空航拍图像中的道路检测技术进行了比较。视觉比较如图 14 所示。虽然 [16] 中的方法在笔直的沙漠道路上效果显著，但它通常

表三
低空和中空航拍图像中道路检测的性能比较

方法	$p$	$ϵ$	运行时间
LIN 数据集
方法[16]	$66.9 %$	$34.7 %$	0.864秒
方法[6]	$93.2 %$	$8.6 %$	0.105秒
我们的方法	$92.8 %$	$9.1 %$	0.218秒
复杂数据集
方法[6]	$67.0 %$	$41.8 %$	0.265秒
我们的方法	$91.5 %$	$10.6 %$	0.857秒

（一个）

（二）

图 17.城市扩张图像中的道路检测。
在曲率较大的弯道和有交叉路口和环岛的复杂道路上检测失败。主要原因是 [16] 中的方法依赖于霍夫线变换，而该变换不适用于检测弯道。此外，基于直方图的阈值化或朴素贝叶斯分类器算法无法检测到所有道路区域。由于在道路检测中引入了基于 SWT 的特征和全局区域边界优化，我们的方法在各种道路上都表现良好。此外，它的速度也更快。表三给出了性能比较的统计数据。从结果中我们可以看出，我们提出的方法在检测不同图像中的一般道路方面表现出色。

现有的大多数方法在宽度恒定的直路上效果很好 [7]-[9]，[11]。对于形状复杂的道路，通常需要人工协助提取 [21]。在我们的工作中，由于局部和全局模型能够正确地表示道路的几何和辐射知识，所提出的方法可以自动检测包括道路网络在内的一般道路。图 15 显示在图像中检测单条道路的一些结果。图 16 显示在检测包括环形交叉路口或交叉口在内的具有挑战性的道路的一些结果。我们还在卫星图像上测试了我们的方法，以检测城市地区的道路网络，如图 17 所示。从结果中我们可以看出，我们的方法与道路形状、宽度、方向或强度变化无关。它在不同场景下都能很好地工作，包括弯曲的道路、杂乱的环境、未开发的土路、低分辨率和对比度。

六、结论与讨论

本文提出了一种新的无人机航拍图像道路自动检测方法。该方法主要包括两个部分：种子选择和道路分割。在种子选择部分，我们采用基于 SWT 和 GMM 的模型。
引入特征来表征道路的几何和辐射特性，进而提供道路/非道路的初始化。从获得的种子点开始，采用 CAC 模型通过全局优化道路的区域边界特性，在整个图像域内传播道路区域。总体而言，该方法在大多数图像上表现良好，包括城市和乡村图像中具有挑战性的道路。对于不同的道路，该方法都能实现稳健性和准确性。实验结果证明了所提方法的有效性。

种子提取在我们的方法中至关重要。为了找到种子，我们利用基于 SWT 和 GMM 的特征，根据道路独特的几何形状和辐射特性对道路进行建模。为了评估在无人机搭载 GPS 飞行时种子的有效性，我们将在未来采用反复试验的方法。如果最终的道路检测结果足够好，则所选道路种子出错的可能性非常低。从这个角度来看，可以基于图匹配策略将最终分割的道路区域的骨架与 GPS 的道路地图进行比较。如果获得较高的匹配分数，则道路分割是准确的，这也反映了道路种子选择的准确性；否则，所选道路种子不令人满意。根据我们的实验，如果存在影响 SWT 清晰度的噪声或具有与道路相似的 SWT 特征的物体（例如交通拥挤的道路或狭长的河流/街区），种子选择可能会失败。

参考

[1] B. Coifman、M. McCord、M. Mishalani 和 K. Redmill，“无人机地面运输监视”，载于《第 83 届年度会议运输研究委员会会议纪要》，2004 年 7 月，第 1-9 页。
[2] H. Zhou, H. Kong, J. Alvarez, D. Creighton 和 S. Nahavandi，“航拍视频中的快速道路检测和跟踪”，载于《IEEE Intell. Vehicles Symp.》期刊，2014 年 6 月，第 712-718 页。
[3] Z. Kim，“通过学习一个例子实现实时道路检测”，载于《IEEE 应用计算视觉研讨会文集》，2005 年 1 月，第 455-460 页。
[4] Y. Lin 和 S. Saripalli，“通过空中沙漠图像进行道路检测和跟踪”，J. Intell. Robot. Syst.，第 65 卷，第 1 期，第 345-359 页，2012 年 1 月。
[5] 佐治亚理工学院无人机研究设施。2016 年 11 月 29 日访问。[在线]。网址： http://www.uavrf.gatech.edu/
[6] H. Zhou, H. Kong, L. Wei, D. Creighton 和 S. Nahavandi，“无人机高效道路检测与跟踪”，IEEE Trans. Intell. Transp. Syst.，第 16 卷，第 1 期，第 297-309 页，2015 年 2 月。
[7] A. Gruen 和 H. Li，“通过动态规划从航空和卫星图像中提取道路”，ISPRS J. Photogram. Remote Sens.，第 50 卷，第 4 期，第 11-20 页，1995 年 8 月。
[8] W. Shi 和 C. Zhu，“从高分辨率卫星图像中提取道路网络的线段匹配方法”，IEEE Trans. Geosci. Remote Sens.，第 40 卷，第 2 期，第 511-514 页，2002 年 2 月。
[9] S. Movaghati、A. Moghaddamjoo 和 A. Tavakoli，“使用粒子滤波和扩展卡尔曼滤波从卫星图像中提取道路”，IEEE Trans. Geosci. Remote Sens.，第 48 卷，第 7 期，第 2807-2817 页，2010 年 7 月。
[10] JD Wegner、JA Montoya-Zegarra 和 K. Schindler，“用于道路网络提取的高阶 CRF 模型”，IEEE CVPR 论文集，2013 年 6 月，第 1698-1705 页。
[11] A. Baumgartner、C. Steger、H. Mayer、H. Ebner 和 W. Eckstein，“农村地区自动道路提取”，国际摄影遥感建筑，第 32 卷，第 3 期，第 107-112 页，1999 年。
[12] AK Sinop 和 L. Grady，“一种统一图割和随机游走的种子图像分割框架，产生了一种新算法”，载于 Proc. Int. Conf. Comput. Vis.，2007 年 10 月，第 1-8 页。
[13] H. Zhou, J. Zheng, 和 L. Wei，“使用图割和主动轮廓的纹理感知图像分割”，《模式识别》，第 46 卷，第 6 期，第 1719-1733 页，2013 年 6 月。
[14] S. Rathinam、Z. Kim 和 R. Sengupta，“使用无人机 1 对局部线性结构进行基于视觉的监测”，J. Infrastruct. Syst.，第 14 卷，第 1 期，第 52-63 页，2008 年。
[15] E. Frew 等人，“使用小型自主飞机进行基于视觉的道路跟踪”，载于《IEEE Aerosp. Conf.》第 5 卷，2004 年 3 月，第 3006-3015 页。
[16] Y. Lin 和 S. Saripalli，“通过航空图像检测道路”，载于 Proc. IEEE Int. Conf. Robot. Autom.，2012 年 5 月，第 3588-3593 页。
[17] A. Xu 和 G. Dudek，“基于视觉的飞行器边界跟踪框架”，载于 Proc. Int. Conf. Intell. Robots Syst.，2010 年 10 月，第 81-86 页。
[18] B. Epshtein、E. Ofek 和 Y. Wexler，“通过笔画宽度变换检测自然场景中的文本”，载于 Proc. Int. Conf. Comput. Vis. Pattern Recognit.，2010 年 6 月，第 2963-2970 页。
[19] BKP Horn，机器人视觉。美国纽约州纽约市：McGraw-Hill，1986 年。
[20] TNA Nguyen、J. Cai、J. Zhang 和 J. Zheng，“使用凸主动轮廓实现稳健交互式图像分割”，IEEE 图像处理学报，第 21 卷，第 8 期，第 3734-3743 页，2012 年 8 月。
[21] D. Chaudhuri、NK Kushwaha 和 A. Samal，“通过定向形态增强和分割技术从高分辨率卫星图像中半自动检测道路”，IEEE J. Sel. Topics Appl. Earth Observ. Remote Sens.，第 5 卷，第 5 期，第 1538-1544 页，2012 年 10 月。
[22] D. Comaniciu 和 P. Meer，“均值漂移：一种稳健的特征空间分析方法”，IEEE 模式分析与机器智能汇刊，第 24 卷，第 5 期，第 603-619 页，2002 年 5 月。
[23] T. Kanungo、DM Mount、NS Netanyahu、CD Piatko、R. Silverman 和 AY Wu，“一种高效的 K 均值聚类算法：分析与实现”，IEEE 模式分析与机器智能汇刊，第 24 卷，第 7 期，第 881-892 页，2002 年 7 月。
[24] M. Kass、A. Witkin 和 D. Terzopoulos，《蛇形：主动轮廓模型》，《国际计算机视觉杂志》，第 1 卷，第 4 期，第 321-331 页，1988 年。
[25] X. Bresson、S. Esedoglu、P. Vandergheynst、J.-P. Thiran 和 S. Osher，“主动轮廓/蛇形模型的快速全局最小化”，J. Math. Imag. Vis.，第 28 卷，第 2 期，第 151-167 页，2007 年 6 月。
[26] T. Goldstein、X. Bresson 和 S. Osher，“分裂 Bregman 方法的几何应用：分割和表面重建”，J. Sci. Comput.，第 45 卷，第 1 期，第 272-293 页，2010 年 10 月。
[27] Y. Boykov 和 M. Jolly，“交互式图割用于对 ND 图像中的对象进行最佳边界和区域分割”，载于第 8 届 IEEE 国际计算机视觉会议 (ICCV)，2001 年 7 月，第 105-112 页。
[28] L. Grady，“随机游走在图像分割中”，IEEE 模式分析与机器智能汇刊，第 28 卷，第 11 期，第 1768-1783 页，2006 年 11 月。
[29] X. Bai 和 G. Sapiro，“用于快速交互式图像和视频分割与抠图的测地线框架”，载于 IEEE 第 11 届国际计算机视觉大会 (ICCV)，2007 年 10 月，第 1-8 页。
[30] Y. Lin、J. Hyyppá 和 A. Jaakkola，“用于精细测绘的微型无人机载激光雷达”，IEEE Geosci. Remote Sens. Lett.，第 8 卷，第 3 期，第 426-430 页，2011 年 5 月。
[31] AP Dal Poz、RAB Gallis、JFC da Silva 和 É. FO Martins，“使用立体航空图像提取农村地区的对象空间道路”，IEEE Geosci. Remote Sens. Lett.，第 9 卷，第 4 期，第 654-658 页，2012 年 7 月。
[32] J. Hu, A. Razdan, JC Femiani, M. Cui 和 P. Wonka，“通过追踪道路足迹从航空图像中提取道路网络并检测交叉口”，IEEE Trans. Geosci. Remote Sens.，第 45 卷，第 12 期，第 4144-4157 页，2007 年 12 月。
[33] C. Unsalan 和 B. Sirmacek，“使用概率和图论方法进行道路网络检测”，IEEE Trans. Geosci. Remote Sens.，第 50 卷，第 11 期，第 4441-4453 页，2012 年 11 月。
[34] AP Dal Poz、RAB Gallis 和 JFC da Silva，“通过对象空间中的动态规划优化从高分辨率航空图像中半自动提取三维道路”，IEEE Geosci. Remote Sens. Lett.，第 7 卷，第 4 期，第 796-800 页，2010 年 10 月。

周海玲于2006年获得西安电子科技大学计算机科学学士学位（荣誉），并于2012年获得新加坡南洋理工大学博士学位。她是澳大利亚迪肯大学智能系统研究与创新研究所的研究员。她的主要研究领域是交通建模与仿真、模式识别和图像分割。

孔辉于2007年获得新加坡南洋理工大学博士学位。他是南京理工大学计算机科学与工程学院的教授。他的研究方向包括计算机视觉、图像处理、无人机和机器学习。

雷炜 (M'13) 于 2006 年获得天津大学计算机科学学士学位，并于 2011 年获得南洋理工大学博士学位。他是澳大利亚迪肯大学智能系统研究与创新中心的高级博士后研究员。他的研究兴趣包括触觉渲染、触觉碰撞检测、网络化触觉、医学触觉、人机交互和图像处理。

道格拉斯·克莱顿（Douglas Creighton，M'10）于 1997 年获得澳大利亚国立大学系统工程学士（荣誉）学位和物理学理学学士学位，并于 2004 年获得澳大利亚迪肯大学博士学位。他是迪肯大学智能系统研究与创新研究所的教授兼副主任。

Saeid Nahavandi (SM'07) 在英国杜伦大学获得博士学位。他是澳大利亚迪肯大学阿尔弗雷德·迪肯教授、工程系主任以及智能系统研究与创新研究所所长。他在各种国际期刊和会议上发表了 450 多篇论文。他是澳大利亚工程师协会和工程技术学会的院士。他是《IEEE 系统期刊》的联合主编，以及《国际智能自动化与软计算期刊》的南太平洋地区编辑。

$^{1}$ 我们假设安装在无人机上的摄像头大致指向下方，但如果稍微指向前方也是可以接受的。