专家约稿

水产动物目标探测与追踪技术及应用研究进展

于红

(大连海洋大学 信息工程学院,设施渔业教育部重点实验室,辽宁省海洋信息技术重点实验室,辽宁 大连 116023)

摘要:水产动物目标探测与追踪研究对智慧渔业、精准养殖具有重要的意义,本文全面梳理了基于声学传感器、光学摄像机及声学与光学结合的水产动物数据采集技术,系统阐述了数据集构建、数据预处理、水产动物目标识别、水产动物目标跟踪等技术研究进展及其在海洋渔业领域的应用现状,分析了水产动物目标探测与追踪技术研究及应用中面临的问题和挑战,对未来的研究方向进行了展望,提出了加快水产动物水下目标探测与追踪数据集及开放共享服务平台构建、实现水产动物精准探测与实时追踪关键技术突破、推动基于水产动物精准探测与实时追踪的智能监控设备研发等建议,旨在为加速推动智慧渔业、精准养殖及提升海洋渔业现代化水平提供参考。

This is an open access article, free of all copyright, and may be freely reproduced, distributed, transmitted, modified, built upon, or otherwise used by anyone for any lawful purpose. The work is made available under the Creative Commons CC0 public domain dedication.

关键词: 水产动物;水下目标识别;水下目标跟踪;深度学习

准确掌握水产动物的分布情况、生长状况、健康状况、行为特征等已成为智慧渔业、精准养殖的一项基础性工作,目标探测与追踪技术是水产动物分布及状况观察和测量的重要支撑技术。近年来,随着智慧渔业、精准养殖等概念的提出,水产动物探测与追踪及应用研究成为新的热点,引起了学者们的广泛关注[1-3],由于水产动物探测与追踪具有环境复杂性、目标动态性、形态多样性等特点,导致高质量的水产动物探测与追踪数据获取难,进而给水产动物的探测与追踪及应用研究带来挑战,如何提高水产动物的精准探测、实时追踪和有效应用是目前智慧渔业、精准养殖领域的关键问题。为更好地进行研究,学者们对相关问题进行了分析和梳理,段延娥等[4]对基于计算机视觉的水产动物视觉特征测量研究进行了综述,分析了基于传统的图像采集、轮廓提取、特征标定等计算机视觉方法的水产动物视觉检测技术及其在水产动物识别、分类和疾病诊断等方面的应用研究;何佳等[5]对基于计算机视觉的鱼类行为识别与量化研究进行了综述,总结了基于计算机视觉的鱼类游泳行为、摄食行为及体色变化识别等研究现状,分析了相关研究的难点及存在的问题;林森等[6]对水下光学图像中目标探测关键技术研究进行了综述,重点分析了水下图像增强和复原技术,为水产动物探测和追踪研究奠定了基础;郭戈等[7]对基于声呐的水下目标检测、识别与跟踪研究进行了综述,概述了基于声呐的水下目标探测、去噪、图像分割等研究算法,分析了相关研究的技术难点,总结了基于声呐的水下目标检测、识别与跟踪研究的关键问题及发展方向。上述文献分别从不同方面分析水产动物水下目标探测与追踪研究现状,文献[5]主要关注基于计算机视觉的鱼类行为研究,忽略了计算机视觉在其他水产动物识别及其他场景鱼类识别的应用研究;文献[6]重点关注通用的水下图像增强和复原技术,未考虑水产动物识别和跟踪的特殊性;文献[7]只关注基于声呐的水下目标检测与跟踪研究,未涉及基于视觉的水下目标检测与跟踪技术。事实上,水下目标探测与追踪研究涉及鱼、虾、蟹、参、贝等不同的水产动物,每种水产动物有各自的特点,采用的技术包括声学技术和光学技术,目前逐渐向着声学和光学结合的方向发展,因此,需要全面、系统地综述水产动物水下目标探测与追踪及应用技术。本文中,以鱼、虾、蟹、参、贝等水产动物为研究对象,对基于光学和声学的水产动物水下数据采集技术、目标探测、追踪及应用研究进行系统梳理和分析,旨在为加速推动智慧渔业、精准养殖及提升海洋渔业现代化水平提供参考。

1 水产动物水下数据采集技术

数据采集是水产动物目标探测的基础,后续的目标识别、检测、分类、跟踪等研究均需要基于所采集的数据,由于不同水产动物的水下数据采集技术不同,采集到的数据类型也不同,相应的目标探测及追踪方法也会不同。

1.1 基于声学传感器的数据采集技术

由于声波在水中传播的衰减较小,采用声学手段进行水下目标探测有一定的优势,因此,水下声学传感器成为主要的水产动物水下数据采集手段之一[1]。早期的声学传感器主要采用分裂波束式回波探测技术,该技术主要通过对回波强度进行目标估算,在水质浑浊情况下,由于噪声等干扰导致生成的声学图像精度不高,进而导致探测误差较大[2]。美国华盛顿大学的Belcher等[3]针对水质浑浊情况下目标探测精度不高的问题,提出了用带有矩形孔隙的声学透镜形成收发波束的多波束声呐——双频识别声呐(Dual-frequency Identification Sonar,DIDSON),其在昏暗或浑浊水质条件下可以生成较为清晰的图像,已成为广泛使用的水产动物声学探测技术[8-9]

1.2 基于光学摄像机的数据采集技术

随着光学成像技术、计算机视觉技术的不断发展,光学摄像机成为水产动物水下数据采集的新手段[10-17],由于光学数据具有更加丰富的信息,可为后续的数据分析处理提供更多的特征,进而提高数据分析的效果,因此,已逐渐成为主要的数据采集手段。水产动物目标探测的应用场景不断变化,所需要的数据类型存在差异,采用的光学摄像技术向多元化方向发展,目前主要有以下4种基于光学的水产动物水下数据采集方法。

1) 基于单目多光谱摄像机方法。对于简单背景下单个目标识别、低密度群体目标探测、高密度群体密度分析等目标探测任务[11-13],可以使用二维光学图像数据开展研究,一般采用基于单目多光谱摄像机进行水产动物水下数据采集,即在水上或水下某个固定位置安装一个多光谱摄像机或者在渔船或水下机器人等水上、水下移动装备上搭载一个多光谱摄像机,这种方式可获得单一角度的数据。

2) 基于双目多光谱摄像机方法。二维数据不能满足复杂背景下高密度水产动物个体体质量、体长测量等应用场景的任务需求[14],此时需要对三维图像或视频数据进行分析,双目多光谱摄像机可以实现三维水产动物目标探测图像或视频数据采集。一般通过在单目多光谱摄像机的基础上增加摄像机形成双目立体视觉效果,从而获取三维数据,但这种数据采集方法需要解决双目摄像机数据校准和数据融合两个关键问题。

3) 基于单目深度摄像机方法。由于双目多光谱摄像机一方面需要增加设备成本,另一方面还需解决数据校准和数据融合等问题,因此,有学者提出了基于单目深度摄像机的水产动物水下数据采集技术[15], 该技术主要采用红外摄像机进行图像采集,基于“水体吸收红外光,目标反射红外光,且不同位置的目标对红外光的反射强度不同”这一原理,构建深度图像实现三维效果,但该技术需要解决水面噪声和反光等关键问题。

4) 基于单目高光谱相机方法。单目多光谱摄像机采集的数据对光线昏暗、水质浑浊、背景复杂等环境下的多目标识别问题难以取得好的效果,为此,有学者提出基于单目高光谱相机的水产动物水下数据采集技术[16-17]。高光谱成像技术是一种超多通道(一般有上百个通道)、连续窄波段、高光谱分辨率的影像数据组成技术,高光谱相机拍摄几百个连续的窄带光谱数据,可以涵盖从紫外光、可见光到红外光的丰富光谱信息,高光谱图像可以在光谱维度上对数据进行细粒度分割,相当于获得一个数据立方体,为目标的精准探测提供了更加丰富的特征。但这种高光谱数据量大且冗余度高,对高光谱数据分析需要解决实时性问题。

1.3 声学和光学结合的数据采集技术

在光线昏暗、水质浑浊条件下,声学手段可以采集到较大范围的水产动物目标数据,但由于声学信号数据包含的信息量少,不能满足具体目标类别的确认任务需求;而光学手段虽然可以获取包含丰富信息的数据,但在光线昏暗、水质浑浊条件下难以采集到高质量的数据,而且光学信号覆盖范围小,如果需要在较大空间范围内进行实时的目标探测,需要密集安装大量的数据采集设备,一方面增加了目标探测的成本,另一方面也增加了数据通信的成本,因此,难以提出有效的基于光学手段的数据采集方案。在探测空间范围较大、环境条件动态变化等条件下,学者们提出了基于声学和光学结合的水产动物目标探测技术[18],该技术可以充分利用两种技术手段的优势,在光线昏暗条件下采用声学手段进行数据采集,在光线条件好的情况下,采用光学手段采集数据,但在进行数据分析时,需要实现光学数据和声学数据的融合。

2 水产动物目标探测与追踪

2.1 数据集的构建

数据是水产动物目标探测与追踪研究的基础,没有高质量的数据,就无法进行水产动物目标探测与追踪研究,目前该领域大多数研究都是由团队根据研究任务的特点自行构建小规模数据集,为了满足各种目标探测与追踪算法实验要求,多数研究人员会采用旋转、部分遮黑、仿射、模糊及GAN网络等方法进行数据增广,基本可以满足探测与追踪基础算法研究需要[19-20]。但是,由于缺少大规模公开数据集,难以对算法效果进行评测,一定程度上制约了相关技术的发展。由于水产动物的生长环境较为复杂,数据获取难度较大,水下目标探测数据集构建成为具有挑战性的任务,为推动水产动物探测研究,学者们开展了一系列数据集构建研究工作,几项典型的数据集构建工作如表1所示。

表1 典型的水产动物水下目标探测数据集比较
Tab.1 Comparison of the object detection dataset among typical aquatic animals

数据集dataset 水产动物类别aquatic animal category数据模态data modal数据量amountof data(支持)创建机构(support)create institution数据应用场景data application scenario数据特点data characteristicsFish4Knowledge[21]鱼类视频700 KB欧盟第七框架委员会(爱丁堡大学)海洋生态研究未考虑类别不平衡问题 LifeCLEF 2014[22]鱼类视频图像图像图像820 MB35 KB1 MB卡塔尼亚大学、爱丁堡大学鱼类探测和分类基于F4KFingerlingsOfPintado[23]鱼苗视频448巴西联邦教育学院鱼苗计数真实生产环境URPC[24]海参、海胆、扇贝图像18982中国国家自然科学基金委水下机器人目标抓取未考虑类别不平衡和真实应用场景UDD[24]海参、海胆、扇贝图像2227原图、18 KB增广图、590 KB预训练图大连理工大学水下机器人目标抓取考虑类别不平衡、开放海域真实场景

1) Fish4Knowledge。 该数据集是由欧盟第七框架委员会支持的项目,由爱丁堡大学等组成的项目团队完成,主要目的是为了辅助进行海洋生态系统研究,项目团队发布了10个不同相机拍摄的包含70万个10分钟左右的视频剪辑,数据量超过9万小时,占用100 TB存储空间,可用于鱼类目标探测与追踪、鱼类识别与分析等研究,但是数据集未考虑数据的类别不平衡问题[21]

2) LifeCLEF 2014。该数据集是由卡塔尼亚大学和爱丁堡大学组成的项目团队在Fish4Knowledge数据集的基础上构建的面向基于视频和图像的鱼类个体识别、种类识别等任务,由4个不同的子数据集构成,每个子数据集用于不同的研究任务,其中1个数据集由8个标注的视频组成,包括35 000多个标注框,另外3个数据集分别包括2 000万张图像、3.5万张图像和100万张图像[22],采用文献[25]中提出的方法进行数据标注。

3) FingerlingsOfPintado。该数据集(本文作者根据原论文内容给定的数据集名称,原数据集没有命名)是由巴西联邦教育学院等机构组成的项目团队基于真实大西洋马鲛育苗生产环境构建的鱼苗计数视频数据集,数据集中包含448个mp4格式的高清视频,每个视频持续时间在3秒左右,视频中的每一条鱼都做了人工标注,视频中包含的鱼苗数量从1到50个不等,其中50%以上的视频中只包含1个鱼苗,包含鱼苗数量在10~20之间的视频数量占比超过10%[23]

4) URPC。该数据集是由中国国家自然科学基金委资助建立的用于水下机器人目标抓取的海参、海胆和扇贝等海珍品图像数据集,其中包含18 982张标注图像,图像主要是从6个视频中截取的,由于同一个视频中图像的相似度较高,因此,数据多样性不高,进而导致用该数据集训练的算法泛化能力不强[24]

5) UDD。该数据集是由大连理工大学水下机器人团队构建的用于水下机器人目标抓取的海参、海胆和扇贝等海珍品图像数据集,其中潜水员和水下机器人在真实生产环境下拍摄了2 227张原始图像,为了解决数据样本数量少和样本不均衡问题,采用GAN网络对原始图像进行了增广,建立了由1.8 万张图像构成的增广数据集,为了满足数据预训练的要求,又进一步扩充了样本,构成了由59万张图像构成的预训练数据集[24]

2.2 数据预处理

由于水产动物生长环境复杂,无论是声学数据还是光学数据都不可避免地会包含噪声,而且由于水下环境昏暗、水质浑浊及水面的折射与散射等现象会导致光学数据存在偏色、模糊、对比度低等问题,要想实现水产动物目标的精准探测,需要有效的数据预处理技术。

2.2.1 水产动物水下数据增强 水产动物图像增强主要针对光学图像中存在的对比度低、模糊和偏色等问题,目前水产动物水下图像增强包括3大类,即基于像素校正的图像增强方法、基于物理模型的方法和基于深度学习的方法,每一类方法中又包含多种具体方法,几种常用的水产动物水下图像增强方法如表2所示。

1)基于像素校正的方法。这类方法主要从图像的直观视觉特征出发进行图像增强,图像是由像素组成的,图像的特性通过每一个像素反映出来,水下图像存在颜色偏差、模糊等质量问题的主要原因是构成图像的每一个像素值出现了偏差,因此,通过修正每一个像素值来进行图像质量校正[26]。Liu等[27]采用直方图均衡化的方法进行了大西洋鲑图像增强,杨卫中等[28]采用对比度受限直方图均衡化方法进行了水下海参图像增强,赵德安等[29-30]采用Retinex 算法进行了水下河蟹图像增强。

2)基于物理模型的方法。这类方法从图像的成像机理上分析图像质量退化的原理,建立水下图像质量退化的数学模型,通过模型反演图像退化过程,从而获得理想情况下未退化图像,这需要有理想情况下清晰图像的先验模型。Tang等[19]采用暗通道先验模型进行了水下游泳梭子蟹图像增强,张俊龙等[31]采用暗通道先验模型进行了观测视频中鱼类图像增强。

3)基于深度学习的方法。这是一种数据驱动的方法,采用深度学习的方法从大量的数据中学习图像退化模型并用学习到的模型优化图像质量,实现图像增强,该方法需要有大量数据做支撑。Ye等[32]提出了一个用于水下图像颜色校正的无监督自适应网络,Hou等[33]提出了用于水下图像增强的残差网络。

3种图像增强方法的比较:基于像素校正的方法比较直观、计算量小,但无法关注细节,增强后可能会损失细节信息;基于物理模型的方法在有清晰图像的情况下效果较好,计算量也不大,但在实际应用中很难获取与拟增强图像对应的清晰图像的先验模型;在有大量数据做支撑的情况下,基于深度学习的方法能关注到细节特征,进而提高增强效果,但该方法的效果依赖于大量的数据,而且该方法的计算量较大。

表2 典型的水产动物图像增强算法
Tab.2 Typical underwater image enhancement algorithm for aquatic animals

算法类别algorithm category典型算法a typical algorithm算法思想algorithm thought应用实例example of applicationa method based on pixel correction直方图均衡化、CLA-HE Retinex算法通过建立像素分布映射,重新调整图像的像素值来改善图像质量海参识别[28]、鱼的识别与行为分析[27]、蟹的识别[29-30]a physical model-based approachDCP先验算法从成像理论模型分析水下图像质量退化的原因,找到影响图像质量的通道,采用先验模型进行图像增强鱼的分类[31]、蟹的检测[19]a deep learning-based approachCNN、GAN网络从大量的数据中学习图像质量退化的模型,并根据学习到的模型优化图像质量,实现图像增强真实海域海参、海胆、扇贝识别[33]

2.2.2 水产动物水下图像去噪 噪声是影响水下图像质量的另一个主要因素,图像去噪是水产动物水下图像预处理技术,主要有光学和声学水产动物图像去噪技术。

1) 光学水产动物水下图像去噪技术。光学水产动物水下图像可能会因为气泡、反光、杂质等产生噪声,目前常用的去噪方法包括滤波、K-SVD等。Liu等[27]采用均值滤波方法去除水下大西洋鲑图像中的噪声,李娟等[34]采用基于阈值的小波去噪法去除水下海参图像中的噪声,赵德安等[30-31]采用K-SVD去噪法去除水下活蟹图像中的噪声。

2) 声学水产动物水下图像去噪技术。声学水产动物水下图像可能会因为气泡、礁石和其他非目标生物等产生噪声,目前常用的去噪方法包括迭代最小二乘法、KOVESI、滤波、小波等。荆丹翔等[8]采用固定窗口的迭代最小二乘法去除水下鱼群图像数据的噪声,张翔等[9]用KOVESI法去除水库鱼群图像中的噪声,Said等[35]用中值滤波方法去除水下声学图像噪声,De Robertis等[36]用小波去噪进行水下声呐图像去噪。

2种图像去噪方法的比较:声学图像的维度较低,噪声分离的可用特征较少,因此,可以选择较为传统的去噪算法;而光学图像的维度较高,噪声识别的可用特征较多。要想取得较好的去噪效果,可以选择更复杂的模型去噪,因此,可以选择基于深度学习的去噪算法。

2.3 水产动物水下目标识别

2.3.1 不同水产动物识别 目前的研究主要包括鱼、虾、蟹、海参、海胆、扇贝等水产动物的目标识别[37-41],表3列出各种水产动物识别研究情况。从总体上看:鱼类识别研究起步较早,研究成果较多,识别算法从传统算法发展到基于深度学习的算法,国内外很多机构开展了相关研究,已经形成了良好的研究生态,具有良好的发展前景[42-43];虾的识别研究起步也较早,但一直比较散乱,以传统识别算法为主,缺少持续研究,也无有影响力的研究机构,未建立有效的研究生态[44-45];蟹的识别研究虽然起步较晚,但起点较高,研究团队开展了系统研究,基本形成了一定优势[46];海参识别研究起步较晚,相关研究比较零散,成果不多,未能形成有影响力的团队和系统的工作[28];扇贝识别研究起步较早,研究比较零散,未能形成有影响力的团队和系统的工作[47];近几年,中国自然基金委组织了海珍品水下抓捕大赛,海参、扇贝、海胆作为主要的比赛识别生物,竞赛承办单位大连理工大学建立了相应的数据集[24],国内开展相关研究的团队增加,主要采用深度学习算法,目前相应的识别研究取得了较好的识别效果[48-49],在国内形成了有一定影响力的团队,具有良好的发展前景。

表3 不同水产动物目标识别研究情况
Tab.3 Current research on the object recognition for aquatic animals

水产动物aquatic animal研究内容research content识别算法特点feature of recognition algorithm数据采集技术data acquisition technique研究发展趋势research development trend鱼fish[42-43]外观识别、分类、密度估计、体长测量等早期以传统方法为主,目前以深度学习算法为主光学、声学及其二者结合研究起步较早,研究成果较多,研究机构较多,国内外均有优势机构,已经形成研究生态虾shrimp[44-45]外观识别、密度估计、体长测量等以传统识别方法为主光学、声学研究起步较早,时间跨度大,研究成果不多,但研究机构分布较广,没有优势机构,未形成研究生态 蟹crab[46]外观识别、密度估计早期以传统方法为主,目前以深度学习算法为主光学研究起步较晚,成果数量不多,但主要集中在国内的二三个研究机构,初步形成特色和优势 海参sea cucumber[28]外观识别、检测(判断是否为海参)早期以传统方法为主,目前以深度学习算法为主光学起步较晚,研究成果不多,早期研究机构比较分散,目前比较集中,已初步形成研究生态扇贝scallop[47]外观识别、检测早期以传统方法为主,目前以深度学习算法为主光学研究起步较早,研究成果不多,研究机构比较集中,早期单独研究扇贝,目前与海参、海胆一起研究,已初步形成研究生态海胆sea urchin[47]检测以深度学习算法为主光学研究起步较晚,已与海参、海胆一起研究,已初步形成研究生态

2.3.2 水产动物水下目标识别算法 水产动物水下目标识别的主要算法包括两大类,一类是传统算法,另一类是基于深度学习的算法, 图1给出了近5年两类算法发表的成果所占比例统计,从图中可以看出,早期以传统算法为主,近年来随着深度学习的不断发展,用深度学习算法进行水产动物目标识别的比例不断增加。

1)传统识别算法。目标识别主要任务是进行特征提取和特征匹配,传统的水产动物识别算法主要是采用人工特征选择方法,在进行人工特征选择的时候需要根据水产动物种类及所做的识别任务的特点进行特征选择,如鱼的识别一般选择形状、颜色、纹理等特征[50-52],虾和海参识别选择形状特征和轮廓特征[34,53], 蟹和扇贝识别选择轮廓和纹理特征[40,46-47]。传统的水产动物识别算法的特征匹配一般采用常用的机器学习算法,如AdaBoost[12,46,51]、主成分分析[12]、模板匹配法[47]、神经网络[40]等算法。

图1 近5年水产动物水下目标识别方法类别统计
Fig.1 Chart of underwater object recognition method for aquatic animals in the past 5 years

2)基于深度学习的算法。基于深度学习的水产动物识别算法是近年来发展起来的一种算法,笔者查阅到的文献中,基于深度学习的算法中90%以上是2018年以后发表的,而2020年发表的成果中90%以上是采用深度学习算法发表的。基于深度学习的算法主要通过大量样本数据的学习,自动进行特征提取,并利用学习到的模型自动完成目标识别,算法的关键问题是模型选择和算法优化。目前笔者在文献中查阅到了大量的基于深度学习的算法模型,其中VGG16[11,54-56]、改进的YOLOv3[19,29,41,57]、ResNet[58]、CNN[43,59-60] 等模型选择较多,根据任务特点的不同,也有选择AlexNet[20,61]、InceptionV3[62]、GAN网络[18]、轻量级EfficientNet[30]、改进DenseNet[39]和Faster R-CNN[48]等模型,从总体上看,该领域的大多数研究会根据深度学习网络模型的发展,选择适合于解决该问题的新模型。由于基于深度学习的算法性能依赖于大规模高质量的数据,而水产动物水下数据质量不高、数量不多,为解决数据数量不足、质量不高的问题,多数算法进行了优化,主要采用两种方式优化,一是通过数据增广的方式增加数据集的数据量,优化样本分布[19-20,54],二是通过迁移学习优化网络结构,降低学习成本[54-55,57-58,61-62]

传统识别方法与深度学习算法的比较:传统识别方法采用人工特征提取方法,优点是可以有效利用人的经验,选择重要的特征,缺点是会忽略一些细节特征或者不易被人发现的隐含特征,因此,传统识别方法对于简单的、小规模的、特征明显的目标识别问题效果较好,但对于环境复杂的水产动物水下目标识别效果不好;深度学习是采用数据驱动的方法自动学习目标的特征,由于机器自动学习,可以学习各类特征,特别是可以从大量数据中挖掘一些不易被人发现的、隐含的特征,因此,识别效果较好,但该方法依赖大量数据,另外,由于维数较高,深度学习的模型一般较为复杂,如果应用在真实的水下目标识别场景,需要做模型的轻量化。

由于深度学习算法在各个领域均取得了较好的效果,因此,目前也是水产动物水下目标识别的主流方法,几种主要深度学习网络模型的特点如下。

(1)LeNet:LeCun在1989年提出的用于解决手写体数字识别问题的模型,该模型主要包含卷积层、池化层和全连接层,由于其设计了最大池化以提高特征提取的效果,故对解决手写体数字识别等背景简单、特征维度不高的问题具有较好的效果,在水产动物识别中,用于背景简单的单个水产动物目标识别等问题时具有较好的效果。

(2)AlexNet:Hinton和Alex设计的网络模型,该模型增加了卷积层和最大池化层的数量,为了解决层数增加带来的各种问题,对网络结构进行了优化,在卷积层后面增加Relu激活函数以解决梯度消失问题,同时可以增加收敛速度,增加局部响应归一化LRN层以提高识别的准确性;在全连接层使用dropout避免过拟合现象,用于简单背景的水下视频中活鱼识别取得了较好的效果。

(3)VGG16:在AlexNet基础上进一步增加网络深度,同时对卷积核进行了改进,选择更小的卷积核以减少参数数量,在鱼的种类识别中取得了较好的效果。

(4)ResNet:何恺明在2015年提出的一种网络模型,主要引入了残差块和跳接的思想解决由于网络层数增加带来的梯度消失和梯度爆炸问题,在海参识别和鱼的识别等方面取得了较好的效果。

(5)DenseNet:在ResNet的基础上进一步优化网络结构,减少冗余计算,通过将网络中的每一层都直接与其前面层相连以提高特征的利用率,同时降低每一层网络的宽度,减小卷积的输出通道数以降低计算量,在海珍品目标识别中取得了较好的效果。

(6)YOLO(You Only Look Once):采用预定义候选区技术将候选区和对象识别两个阶段合二为一的模型,该模型主要解决深度模型识别速度慢的问题,是一种快速识别的模型,适合于在真实生产环境下的实时水产动物目标识别。

(7)GAN网络:该模型包括生成器和判别器两部分,是一种通过生成器和判别器相互博弈进行学习的模型,主要用于水下图像增强以提高数据质量,从而提升目标识别的效果,比较适合于解决具有复杂背景的水下目标识别问题。

2.4 水产动物目标追踪

水产动物具有移动性,要准确掌握水产动物的分布情况、生长状况和行为特征,除了需要研究其探测技术之外,追踪技术也是非常重要的。水产动物目标追踪是在目标识别的基础上研究目标的动态变化情况,目前常见的用于水产动物目标追踪的方法包括卡尔曼滤波法、Viterbi数据关联法和可变多核追踪法。

1)卡尔曼滤波法。卡尔曼滤波是在一段连续的视频中获得运动目标的连续关联状态的常用方法之一[63],但是由于水产动物生活环境较为复杂,动物运动本身具有多变性,而且鱼类等水产动物身体具有变形的特点,因此,实际应用过程中常采用扩展的卡尔曼滤波法,该方法将非线性问题转化为线性问题,可以解决由于形状多变等导致的水产动物跟踪不准确问题[7,64]

2) Viterbi数据关联法。在多数情况下,水产动物呈聚集状态,即水产动物目标跟踪是多目标跟踪问题。在进行多目标跟踪时,由于包含多个目标的连续两个视频帧中的目标之间需要建立多对多的关联,因此,需要采用数据关联法进行水产动物群体跟踪[7,64]。为了克服低照度场景下水产动物目标频繁进出视野所带来的不稳定性, Chuang等[65]提出了基于改进的Viterbi数据关联法。

3) 可变多核追踪法。针对水产动物频繁进出感受野,而在不同视频帧中水产动物的位姿会发生变化这一问题,Wang等[66]提出了一个多核追踪算法以建立连续多个视频帧中相同目标之间的关联,由于多核的混合模型可以匹配不同视频中的不同姿态,因此,可以提高目标关联的准确性。为了进一步提升追踪算法的鲁棒性,Chuang等[67]提出可变多核追踪法,表示整个目标的一组核以可变的方式组织,进一步丰富了核的内容,提高了核的适应性,进而提高关联的准确性。

以上3种针对水产动物的目标追踪方法主要采用基于检测的追踪机制,此类方法也是目前基于计算机视觉的目标追踪的主流方法之一[68],该机制的主要挑战是追踪器的学习方法不完善[69],为了解决该挑战性问题,Wang等[70]提出了一种基于元学习方法的高性能追踪器,通过选择受过梯度下降训练的现代目标探测器、用模型无关的元学习进行离线训练、用初始帧进行域适配等过程,分别基于RetinaNet 和FCOS两个现代目标探测器构建了两个追踪器,有效解决了追踪器的学习问题。基于检测的追踪机制虽然取得了较好的追踪效果,但需要两步才能完成追踪,因此,也会存在时空信息利用不足、对探测结果过度依赖等问题。为解决上述问题,Pang等[68]提出了简洁的一步训练模型——TubeTK, 该模型通过引入“bounding-tube”表示短视频片段中目标的时空位置,从而只需要一步训练就可以实现目标追踪。Pang等[68]提出的方法对短时追踪取得了较好的效果,但是多数情况下需要进行水产动物目标的长时追踪,多数长时追踪都采用Siamese体系结构[71],但该结构不能有效利用长时追踪目标中的更新信息,于是Dai等[72]提出了一个离线训练的元更新器,利用几何信息、判别信息、外观信息和时序信息等自动学习tracker的更新控制条件,结果显著提高了长时目标追踪效果。

3 水产动物目标探测与追踪技术的应用

水产动物目标探测与追踪技术主要应用于水产动物的精准投喂、自动监控、测量分级和智能抓取等方面。

1) 精准投喂。精准投喂是水产动物目标探测与追踪技术的一个主要应用方向,目前已经有了较为系统的研究。Liu等[27]提出了一种基于计算机视觉的大西洋鲑鱼群喂养活动度量方法,通过识别视频中的大西洋鲑进行不同视频帧的密度分析,基于密度分析结果进行喂养活动分析;Sadoul等[73]提出了基于计算机视觉的养鱼池中鱼群消散行为和游泳行为监测方法,基于监测结果分析鱼群进食前后的估计行为变化,为精准投喂提供决策依据;陈彩文等[74]提出了一种基于鱼群纹理特征识别与分析的鱼群摄食活动强度评估方法;陈明等[75]提出了一种基于特征加权融合的鱼类摄食活动强度评估方法,该方法基于鱼类摄食图像识别结果进行不同摄食阶段鱼类摄食活动强度评估,并采用加权融合方法确定评价因子权重。

2) 行为监控。日常行为监控是水产动物养殖生产过程中最重要的工作,特别是在高密度工厂化养殖条件下,养殖生产技术人员需要随时关注水产动物的状况,及时处理各种异常行为。基于目标探测与追踪技术的水产动物日常行为监控已成为工厂化养殖生产管理的一种重要手段。Zhao等[76]提出了一种基于改进的移动影响映射和RNN鱼群局部异常行为检测、定位和识别方法,采用粒子平流模式抽取整个鱼群的移动特征,构建鱼群内部相互作用特征的移动影响映射,并采用RNN量化识别已经定位的局部异常行为;Tsao等[77]提出了一种基于声呐扫描图像分析的鱼类行为分析方法,通过声呐图像特征提取、识别等分析鱼类行为;Ina等[78]提出了基于视频图像的死亡鱼类识别方法,并分析了东方蓝鳍鲔幼虫阶段的下沉式死亡机制。

3) 测量分级。水产动物的体长、体质量及外观特征测量是其分级分类、疾病诊断的依据,由于基于目标探测与追踪技术的水产动物测量和分级技术是一种非接触式的、无伤害的测量方式,近年来成为新的研究热点。王振宇等[79]以大泷六线鱼为例研究了基于水下目标探测技术的水产动物体长测量的可行性;Huang等[80]提出了基于关键点的鱼体长测量,该方法通过检测鱼体中线关键点位置进行鱼类体长测量。

4) 智能抓取。海珍品抓取需要潜水员潜入海底进行作业,是一种高危职业,基于水产动物目标探测与追踪技术的海珍品抓取研究成为新的热点。刘萍等[41]提出了基于改进YOLOv3的海洋生物识别算法,采用预训练的UGAN-P生成网络与YOLOv3进行融合实现网络增强,取得了较好的海珍品识别效果,为海珍品智能抓取提供了技术支持;徐凤强等[39]提出了基于卷积神经网络的水产动物检测算法,利用真实生产环境下采集的水下图像数据集训练特定的网络模型以实现海珍品的准确检测;Xu等[48]提出了一种基于Faster R-CNN水产动物识别和KCF水产动物追踪算法以实现水下小目标智能抓取,取得了较好的效果。

4 存在问题及展望

4.1 存在问题

水产动物目标探测与追踪技术经过多年的发展已经形成了从数据采集、数据集构建、数据预处理、目标识别、目标追踪到技术应用等较为完整的技术体系,特别是面向智慧渔业、精准养殖等实际需求开展了各类研究,取得了显著的成果,这些技术为海洋渔业产业的发展奠定了基础,但目前该领域研究依然存在一定的问题,主要问题如下。

1)数据集不够完善。目前水产动物目标探测与追踪技术研究相关的数据集多数是在可控条件下进行数据采集,数据集涉及的水产动物种类不全、规模不大、质量不高,不能准确反映复杂多变的水产动物生长环境,因此,无法支撑面向真实生产需要的水产动物目标探测与追踪技术研究需要。

2) 关键核心技术未突破。水产动物探测与追踪研究起步晚、支持的项目数量不多、从事相关研究人员数量较少,而水产动物生长环境复杂、噪声多、目标探测与追踪技术难度大,目前水产动物目标识别与追踪技术研究还比较初级,很多关键核心技术尚未完全突破。

3) 设备研发投入不足。目前的水产动物探测与追踪技术应用研究主要侧重于结合具体应用场景的目标识别与追踪技术研究,缺少面向海洋渔业资源调查、海洋牧场资源评估、开放海域海珍品抓取、工厂化生产环境下精准养殖等领域实际应用问题的智能化水产动物探测与追踪设备的研发,特别是具有环境适应性的高鲁棒性、高可靠性、高稳定性的设备研发成果较少。

4.2 展望

水产动物目标探测与追踪技术是人工智能技术在海洋渔业领域有效应用的基础,是智慧渔业、精准养殖的重要支撑,对提升传统的海洋渔业具有重要的作用,为了加速推进智慧渔业、精准养殖,提升海洋渔业的现代化水平,未来水产动物目标探测与追踪研究应在以下几个方面开展工作。

1) 加快水产动物水下目标探测与追踪数据集及开放共享服务平台构建。高质量的数据是目标探测与追踪技术研究的基础,水产动物数据获取困难已成为制约水产动物探测与追踪技术研究的主要瓶颈,随着越来越多的学者关注该领域,根据水产动物生长环境特点,研究有效的水产动物目标探测与追踪数据采集技术、数据标注技术等,建立水产动物目标探测与追踪数据标准,建立涵盖鱼类、虾类、蟹类、贝类、棘皮类等典型水产动物的体系化、标准化、高质量、大规模、系统化的水产动物数据集,加快构建水产动物水下目标探测与追踪数据开放共享平台,以推动水产动物水下目标探测与追踪技术的进步。

2) 着力实现水产动物精准探测与实时追踪关键技术突破。支持融合水产动物行为特征、水下目标成像机制、人类视觉认知推理机制等内容的技术研究,突破解决水产动物水下目标探测与追踪算法的速度和准确性之间的矛盾,研究水产动物精准探测与实时追踪关键技术,提升探测与追踪技术的速度和准确性。

3) 推动基于水产动物精准探测与实时追踪的智能监控设备的研发。支持建立信息技术、材料科学、物理海洋等多学科交叉合作机制,联合攻关,突破解决水产动物智能监测和监控设备的通信、能源、防水、防腐等问题,以及模型轻量化、设备稳定性、可靠性等技术问题,研发基于水产动物精准探测与实时追踪的智能监控设备,推动水产动物精准探测与实时追踪技术在渔业产业的有效应用。

致谢:论文撰写过程中,林远山和吴俊峰老师协助查阅了部分文献;赵梦、杨鹤等研究生协助进行了文稿校对和排版工作!

参考文献:

[1] JUELL J E,WESTERBERG H.An ultrasonic telemetric system for automatic positioning of individual fish used to track Atlantic salmon (Salmo salar L.) in a sea cage[J].Aquacultural Engineering,1993,12(1):1-18.

[2] LUBIS M Z,MANIK H M.Acoustic systems (split beam echo sounder) to determine abundance of fish in marine fisheries[J].Journal of Geoscience,Engineering,Environment,and Technology,2017,2(1):76-83.

[3] BELCHER E,HANOT W,BURCH J.Dual-frequency identification sonar (DIDSON)[C]//Proceedings of the 2002 International Symposium on Underwater Technology.Tokyo,Japan:IEEE,2002:187-192,doi:10.1109/UT.2002.1002424.

[4] 段延娥,李道亮,李振波,等.基于计算机视觉的水产动物视觉特征测量研究综述[J].农业工程学报,2015,31(15):1-11.

DUAN Y E,LI D L,LI Z B,et al.Review on visual characteristic measurement research of aquatic animals based on computer vision[J].Transactions of the Chinese Society of Agricultural Engineering,2015,31(15):1-11.(in Chinese)

[5] 何佳,黄志涛,宋协法,等.基于计算机视觉技术的水产养殖中鱼类行为识别与量化研究进展[J].渔业现代化,2019,46(3):7-14.

HE J,HUANG Z T,SONG X F,et al.Research progress on recognition and quantification of fish behavior in aquaculture based on computer vision technology[J].Fishery Modernization,2019,46(3):7-14.(in Chinese)

[6] 林森,赵颍.水下光学图像中目标探测关键技术研究综述[J].激光与光电子学进展,2020,57(6):060002.

LIN S,ZHAO Y.Review on key technologies of target exploration in underwater optical images[J].Laser & Optoelectronics Progress,2020,57(6):060002.(in Chinese)

[7] 郭戈,王兴凯,徐慧朴.基于声呐图像的水下目标检测、识别与跟踪研究综述[J].控制与决策,2018,33(5):906-922.

GUO G,WANG X K,XU H P.Review on underwater target detection,recognition and tracking based on sonar image[J].Control and Decision,2018,33(5):906-922.(in Chinese)

[8] 荆丹翔,周晗昀,韩军,等.基于成像声呐DIDSON的水域内鱼群数量估计方法[J].应用声学,2019,38(4):705-711.

JING D X,ZHOU H Y,HAN J,et al.Fish abundance estimation based on an imaging sonar[J].Applied Acoustics,2019,38(4):705-711.(in Chinese)

[9] 张翔,沈蔚,童剑锋,等.基于DIDSON双频识别声纳技术的青草沙水库鱼类资源量评估[J].上海海洋大学学报,2017,26(4):561-569.

ZHANG X,SHEN W,TONG J F,et al.Evaluation of fish resources in Qingcaosha Reservoir based on dual frequency identification sonar technology[J].Journal of Shanghai Ocean University,2017,26(4):561-569.(in Chinese)

[10] 徐建瑜,崔绍荣,苗香雯,等.计算机视觉技术在水产养殖中的应用与展望[J].农业工程学报,2005,21(8):174-178.

XU J Y,CUI S R,MIAO X W,et al.Application and prospect of computer vision technology in aquaculture[J].Transactions of the Chinese Society of Agricultural Engineering,2005,21(8):174-178.(in Chinese)

[11] BANAN A,NASIRI A,TAHERI-GARAVAND A.Deep learning-based appearance features extraction for automated carp species identification[J].Aquacultural Engineering,2020,89:102053.

[12] 刘世晶,王帅,陈军,等.基于改进主成分分析和AdaBoost算法的运动虾苗识别方法[J].农业工程学报,2017,33(1):212-218.

LIU S J,WANG S,CHEN J,et al.Moving larval shrimps recognition based on improved principal component analysis and AdaBoost[J].Transactions of the Chinese Society of Agricultural Engineering,2017,33(1):212-218.(in Chinese)

[13] ZHOU Y Z,YU H,WU J F,et al.Fish density estimation with multi-scale context enhanced convolutional neural network[J].Journal of Communications and Information Networks,2019,4(3):80-88.

[14] MAO J F,XIAO G,SHENG W G,et al.Research on realizing the 3D occlusion tracking location method of fish’s school target[J].Neurocomputing,2016,214:61-79.

[15] PAUTSINA P,TYS D,et al.Infrared reflection system for indoor 3D tracking of fish[J].Aquacultural Engineering,2015,69:7-17.

[16] PETTERSEN R,BRAA H L,GAWEL B A,et al.Detection and classification of Lepeophterius salmonis (Krøyer,1837) using underwater hyperspectral imaging[J].Aquacultural Engineering,2019,87:102025.

[17] FU X P,SHANG X D,SUN X D,et al.Underwater hyperspectral target detection with band selection[J].Remote Sensing,2020,12(7):1056.

[18] TERAYAMA K,SHIN K,MIZUNO K,et al.Integration of sonar and optical camera images using deep neural network for fish monitoring[J].Aquacultural Engineering,2019,86:102000.

[19] TANG C,ZHANG G,HU H G,et al.An improved YOLOv3 algorithm to detect molting in swimming crabs against a complex background[J].Aquacultural Engineering,2020,91:102115.

[20] MENG L,HIRAYAMA T,OYANAGI S.Underwater-drone with panoramic camera for automatic fish recognition based on deep learning[J].IEEE Access,2018,6:17880-17886.

[21] FISHER R B,CHEN-BURGER Y H,GIORDANO D,et al.Fish4Knowledge:collecting and analyzing massive coral reef fish video data[M].Cham:Springer International Publishing,2016.

[22] SPAMPINATO C,PALAZZO S,BOOM B,et al.Overview of the lifeCLEF 2014 fish task[C]//Proceedings of Working Notes for CLEF 2014 Conference.Sheffield,UK,2014:616-624.

[23] HE J Y,VAN OSSENBRUGGEN J,DE VRIES A P.Fish4label:accomplishing an expert task without expert knowledge[R/OL].(2013-05-15)[2020-09-01].http://homepages.inf.ed.ac.uk/rbf/Fish4Knowledge/PAPERS/oair2013-demo.pdf.

[24] GARCIA V,SANT’ANA D A,ZANONI V A G,et al.A new image dataset for the evaluation of automatic fingerlings counting[J].Aquacultural Engineering,2020,89:102064.

[25] WANG Z H,LIU C W,WANG S J,et al.UDD:an underwater open-sea farm object detection dataset for underwater robot picking[EB/OL].(2003-05-08)[2020-09-01].https://arxiv.org/pdf/2003.01446.pdf.

[26] 罗强,吴俊峰,于红,等.一种基于改进直方图均衡化的显著图提取算法[J].小型微型计算机系统,2018,39(5):1092-1096.

LUO Q,WU J F,YU H,et al.Saliency detection algorithm based on improved histogram equalization[J].Journal of Chinese Computer Systems,2018,39(5):1092-1096.(in Chinese)

[27] LIU Z Y,LI X,FAN L Z,et al.Measuring feeding activity of fish in RAS using computer vision[J].Aquacultural Engineering,2014,60:20-27.

[28] 杨卫中,徐银丽,乔曦,等.基于对比度受限直方图均衡化的水下海参图像增强方法[J].农业工程学报,2016,32(6):197-203.

YANG W Z,XU Y L,QIAO X,et al.Method for image intensification of underwater sea cucumber based on contrast-limited adaptive histogram equalization[J].Transactions of the Chinese Society of Agricultural Engineering,2016,32(6):197-203.(in Chinese)

[29] 赵德安,刘晓洋,孙月平,等.基于机器视觉的水下河蟹识别方法[J].农业机械学报,2019,50(3):151-158.

ZHAO D A,LIU X Y,SUN Y P,et al.Detection of underwater crabs based on machine vision[J].Transactions of the Chinese Society for Agricultural Machinery,2019,50(3):151-158.(in Chinese)

[30] 赵德安,曹硕,孙月平,等.基于联动扩展神经网络的水下自由活蟹高效检测器[J].农业机械学报,2020,51(19):163-174.

ZHAO D A,CAO S,SUN Y P,et al.Small-sized efficient detector for underwater freely live crabs based on compound scaling neural network[J].Transactions of the Chinese Society for Agricultural Machinery,2020,51(19):163-174.(in Chinese)

[31] 张俊龙,曾国荪,覃如符.基于深度学习的海底观测视频中鱼类的识别方法[J].计算机应用,2019,39(2):376-381.

ZHANG J L,ZENG G S,QIN R F.Fish recognition method for submarine observation video based on deep learning[J].Journal of Computer Applications,2019,39(2):376-381.(in Chinese)

[32] YE X C,LI Z,SUN B L,et al.Deep joint depth estimation and color correction from monocular underwater images based on unsupervised adaptation networks[J].IEEE Transactions on Circuits and Systems for Video Technology,2019,doi:10.1109/TCSVT.2019.2958950.

[33] HOU M J,LIU R S,FAN X,et al.Joint residual learning for underwater image enhancement[C]//Proceedings of 2018 25th IEEE International Conference on Image Processing.Athens,Greece:IEEE,2018:4043-4047.

[34] 李娟,朱学岩,葛凤丽,等.基于计算机视觉的水下海参识别方法研究[J].中国农机化学报,2020,41(7):171-177.

LI J,ZHU X Y,GE F L,et al.Research on underwater sea cucumber identification based on computer vision[J].Journal of Chinese Agricultural Mechanization,2020,41(7):171-177.(in Chinese)

[35] SAID A B,HADJIDJ R,MELKEMI K E,et al.Multispectral image denoising with optimized vector non-local mean filter[J].Digital Signal Processing,2016,58:115-126.

[36] DE ROBERTIS A,HIGGINBOTTOM I.A post-processing technique to estimate the signal-to-noise ratio and remove echosounder background noise[J].ICES Journal of Marine Science,2007,64(6):1282-1291,

[37] 孙建伟,于红,吴俊峰,等.一种使用多特征的鱼类图像检索方法[J].大连海洋大学学报,2016,31(4):449-455.

SUN J W,YU H,WU J F,et al.A fish image retrieval method using multiple features[J].Journal of Dalian Ocean University,2016,31(4):449-455.(in Chinese)

[38] ZHANG D,LILLYWHITE K D,LEE D J,et al.Automatic shrimp shape grading using evolution constructed features[J].Computers and Electronics in Agriculture,2014,100:116-122.

[39] 徐凤强,董鹏,王辉兵,等.基于水下机器人的海产品智能检测与自主抓取系统[J].北京航空航天大学学报,2019,45(12):2393-2402.

XU F Q,DONG P,WANG H B,et al.Intelligent detection and autonomous capture system of seafood based on underwater robot[J].Journal of Beijing University of Aeronautics and Astronautics,2019,45(12):2393-2402.(in Chinese)

[40] 杨眉,魏鸿磊,华顺刚.一种基于神经网络的扇贝图像识别方法[J].大连海洋大学学报,2014,29(1):70-74.

YANG M,WEI H L,HUA S G.A scallop image recognition method based on a neural network[J].Journal of Dalian Ocean University,2014,29(1):70-74.(in Chinese)

[41] 刘萍,杨鸿波,宋阳.改进YOLOv3网络的海洋生物识别算法[J].计算机应用研究,2020,37(sup 1):394-397.

LIU P,YANG H B,SONG Y.Improved-YOLOv3- based marine biology recognition algorithm[J].Application Research of Computers,2020,37(sup 1):394-397.(in Chinese)

[42] 张美玲,吴俊峰,于红,等.基于颜色四通道及空间金字塔的鱼类图像检索[J].计算机应用,2019,39(5):1466-1472.

ZHANG M L,WU J F,YU H,et al.Fish image retrieval algorithm based on color four channels and spatial pyramid[J].Journal of Computer Applications,2019,39(5):1466-1472.(in Chinese)

[43] SALMAN A,JALAL A,SHAFAIT F,et al.Fish species classification in unconstrained underwater environments based on deep learning[J].Limnology and Oceanography:Methods,2016,14(9):570-585.

[44] CHEN F D,XU J P,WEI Y,et al.Establishing an eyeball-weight relationship for Litopenaeus vannamei using machine vision technology[J].Aquacultural Engineering,2019,87:102014.

[45] LEE D J,XIONG G M,LANE R M,et al.An efficient shape analysis method for shrimp quality evaluation[C]//Proceedings of 2012 12th International Conference on Control Automation Robotics & Vision.Guangzhou:IEEE,2012:865-870.

[46] 王斌,徐建瑜,王春琳.基于计算机视觉的梭子蟹蜕壳检测及不同背景对蜕壳的影响[J].渔业现代化,2016,43(2):11-16.

WANG B,XU J Y,WANG C L.Computer-vision based molting detection of Portunus tritubercularus and effects of different backgrounds on molting[J].Fishery Modernization,2016,43(2):11-16.(in Chinese)

[47] 郭常有,曹广斌,韩世成,等.基于图像处理技术的扇贝尺寸及位置自动识别[J].大连海洋大学学报,2012,27(6):578-582.

GUO C Y,CAO G B,HAN S C,et al.Automatic measurement of size and location in scallop based on image processing[J].Journal of Dalian Ocean University,2012,27(6):578-582.(in Chinese)

[48] XU F Q,DING X Y,PENG J J,et al.Real-time detecting method of marine small object with underwater robot vision[C]//Proceedings of 2018 OCEANS - MTS/IEEE Kobe Techno-Oceans.Kobe,Japan:IEEE,2018:1-4.

[49] LIU R S,FAN X,ZHU M,et al.Real-world underwater enhancement:challenges,benchmarks,and solutions under natural light[J].IEEE Transactions on Circuits and Systems for Video Technology,2020,doi:10.1109/TCSVT.2019.2963772.

[50] ROVA A,MORI G,DILL L M.One fish,two fish,butterfish,trumpeter:recognizing fish in underwater video[R/OL].(2007-05-16)[2020-09-01].http://www.osti.gov/cgi-bin/eprints/redirectEprintsUrl?http%3A%2F%2Fwww.sfu.ca%2Fbiology%2Ffaculty%2Fdill%2Fpublications%2Frova_fis.pdf.

[51] THARWAT A,HEMEDAN A A,HASSANIEN A E,et al.A biometric-based model for fish species classification[J].Fisheries Research,2018,204:324-336.

[52] 张美玲,吴俊峰,于红,等.一种基于HSVG-SURF特征的鱼类图像检索算法[J].小型微型计算机系统,2018,39(9):2085-2089.

ZHANG M L,WU J F,YU H,et al.Fish image retrieval algorithm based on HSVG four channel SURF feature[J].Journal of Chinese Computer Systems,2018,39(9):2085-2089.(in Chinese)

[53] HARBITZ A.Estimation of shrimp (Pandalus borealis) carapace length by image analysis[J].ICES Journal of Marine Science,2007,64(5):939-944.

[54] HRIDAYAMI P,PUTRA I K G D,WIBAWA K S.Fish species recognition using VGG16 deep convolutional neural network[J].Journal of Computing Science and Engineering,2019,13(3):124-130.

[55] 王柯力,袁红春.基于迁移学习的水产动物图像识别方法[J].计算机应用,2018,38(5):1304-1308,1326.

WANG K L,YUAN H C.Aquatic animal imang classification method based on transfer learning[J].Journal of Computer Applications,2018,38(5):1304-1308,1326.(in Chinese)

[56] 陈英义,龚川洋,刘烨琦,等.基于FTVGG16卷积神经网络的鱼类识别方法[J].农业机械学报,2019,50(5):223-231.

CHEN Y Y,GONG C Y,LIU Y Q,et al.Fish identification method based on FTVGG16 convolutional neural network[J].Transactions of the Chinese Society for Agricultural Machinery,2019,50(5):223-231.(in Chinese)

[57] 李庆忠,李宜兵,牛炯.基于改进YOLO和迁移学习的水下鱼类目标实时检测[J].模式识别与人工智能,2019,32(3):193-203.

LI Q Z,LI Y B,NIU J.Real-time detection of underwater fish based on improved YOLO and transfer learning[J].Pattern Recognition and Artificial Intelligence,2019,32(3):193-203.(in Chinese)

[58] 贾宇霞,樊帅昌,易晓梅.基于显著性增强和迁移学习的鱼类识别研究[J].渔业现代化,2020,47(1):38-46.

JIA Y X,FAN S C,YI X M.Fish recognition based on significant enhancement and transfer learning[J].Fishery Modernization,2020,47(1):38-46.(in Chinese)

[59] ALLKEN V,HANDEGARD N O,ROSEN S,et al.Fish species identification using a convolutional neural network trained on synthetic data[J].ICES Journal of Marine Science,2019,76(1):342-349.

[60] SIDDIQUI S A,SALMAN A,MALIK M I,et al.Automatic fish species classification in underwater videos:exploiting pre-trained deep neural network models to compensate for limited labelled data[J].ICES Journal of Marine Science,2018,75(1):374-389.

[61] TAMOU A B,BENZINOU A,NASREDDINE K,et al.Underwater live fish recognition by deep learning[C]//Proceedings of the 8th International Conference on Image and Signal Processing.Cherbourg,France:Springer,2018:275-283.

[62] 李均鹏,祝开艳,杨澍.基于迁移学习的复杂场景海洋鱼类识别方法[J].计算机应用与软件,2019,36(9):168-174.

LI J P,ZHU K Y,YANG S.Ocean fish recognition incomplex scene based on transfer learning[J].Computer Applications and Software,2019,36(9):168-174.(in Chinese)

[63] ZHOU J,CLARK C M.Autonomous fish tracking by ROV using monocular camera[R/OL].(2006-07-07)[2020-09-01].http://www.hmc.edu/lair/publications/2006/zhou_crv_2006.pdf.

[64] 袁永明,施珮.基于图像处理的鱼群运动监测方法研究[J].南方水产科学,2018,14(5):109-114.

YUAN Y M,SHI P.Study on fish movement monitoring method based on image processing[J].South China Fisheries Science,2018,14(5):109-114.(in Chinese)

[65] CHUANG M C,HWANG J N,WILLIAMS K,et al.Tracking live fish from low-contrast and low-frame-rate stereo videos[J].IEEE Transactions on Circuits and Systems for Video Technology,2015,25(1):167-179.

[66] WANG G A,HWANG J N,WILLIAMS K,et al.Closed-loop tracking-by-detection for ROV-based multiple fish tracking[C]//Proceedings of 2016 ICPR 2nd Workshop on Computer Vision for Analysis of Underwater Imagery.Cancun,Mexico:IEEE,2016:7-12.

[67] CHUANG M C,HWANG J N,YE J H,et al.Underwater fish tracking for moving cameras based on deformable multiple kernels[J].IEEE Transactions on Systems,Man,and Cybernetics:Systems,2017,47(9):2467-2477.

[68] PANG B,LI Y Z,ZHANG Y F,et al.TubeTK:adopting tubes to track multi-object in a one-step training model[C]//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Seattle,WA,USA:IEEE,2020:6307-6317.

[69] BRAS G,LEAL-TAIX L.Learning a neural solver for multiple object tracking[C]//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Seattle,WA,USA:IEEE,2020:6246-6256,doi:10.1109/CVPR42600.2020.00628.

[70] WANG G T,LUO C,SUN X Y,et al.Tracking by instance detection:a meta-learning approach[C]//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Seattle,WA,USA:IEEE,2020:6287-6296,doi:10.1109/CVPR42600.2020.00632.

[71] GUO D Y,WANG J,CUI Y,et al.SiamCAR:siamese fully convolutional classification and regression for visual tracking[C]//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Seattle,WA,USA:IEEE,2020:6268-6276,doi:10.1109/CVPR42600.2020.00630.

[72] DAI K N,ZHANG Y H,WANG D,et al.High-performance long-term tracking with meta-updater[C]//Proceedings of 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Seattle,WA,USA:IEEE,2020:6297-6306,doi:10.1109/CVPR42600.2020.00633.

[73] SADOUL B,MENGUES P E,FRIGGENS N C,et al.A new method for measuring group behaviours of fish shoals from recorded videos taken in near aquaculture conditions[J].Aquaculture,2014,430:179-187.

[74] 陈彩文,杜永贵,周超,等.基于图像纹理特征的养殖鱼群摄食活动强度评估[J].农业工程学报,2017,33(5):232-237.

CHEN C W,DU Y G,ZHOU C,et al.Evaluation of feeding activity of shoal based on image texture[J].Transactions of the Chinese Society of Agricultural Engineering,2017,33(5):232-237.(in Chinese)

[75] 陈明,张重阳,冯国富,等.基于特征加权融合的鱼类摄食活动强度评估方法[J].农业机械学报,2020,51(2):245-253.

CHEN M,ZHANG C Y,FENG G F,et al.Intensity assessment method of fish feeding activities based on feature weighted fusion[J].Transactions of the Chinese Society of Agricultural Engineering,2020,51(2):245-253.(in Chinese)

[76] ZHAO J,BAO W J,ZHANG F D,et al.Modified motion influence map and recurrent neural network-based monitoring of the local unusual behaviors for fish school in intensive aquaculture[J].Aquaculture,2018,493:165-175.

[77] TSAO S L,TIAN W M,SHEN C Y,et al.Benthic fish behavior characterization with a mechanically scanned imaging sonar[J].Aquacultural Engineering,2019,84:1-11.

[78] INA Y,TAKAGI T,MIYASHITA S,et al.Analysis of sinking death using video images of the swimming performance of Pacific bluefin tuna (Thunnus orientalis) larvae[J].Aquacultural Engineering,2020,90:102099.

[79] 王振宇,张国胜,包林,等.利用水下摄影测量技术测量鱼类体长的可行性研究[J].大连海洋大学学报,2018,33(2):251-257.

WANG Z Y,ZHANG G S,BAO L,et al.Feasibility of measurement of fish body length using underwater photogrammetry[J].Journal of Dalian Ocean University,2018,33(2):251-257.(in Chinese)

[80] HUANG I W,HWANG J N,ROSE C S.Chute based automated fish length measurement and water drop detection[C]//Proceedings of 2016 IEEE International Conference on Acoustics,Speech and Signal Processing.Shanghai:IEEE,2016:1906-1910.

Research progress on object detection and tracking techniques utilization in aquaculture:a review

YU Hong

(College of Information Engineering, Key Laboratory of Environment Controlled Aquaculture(KLECA), Ministry of Education, Key Laboratory of Marine Information Technology of Liaoning Province, Dalian Ocean University, Dalian 116023, China)

Abstract In this paper, object detection and tracking techniques of aquatic animals for smart fisheries and precision cultivation and their application are reviewed comprehensively. Firstly, we summarize the underwater data collection techniques for aquatic animals including acoustics-sensor based data collection, the optical-video-camera based data collection and the data collection techniques based on both of the acoustics and optical. Then, we thoroughly describe the advances in object detection and tracking techniques for aquatic animals from various aspects, including the dataset collection and annotation, data preprocessing, object recognition of the aquatic animals, and object tracking of the aquatic animals. Finally, the application and research status of aquatic animal object detection and tracking technology in marine fishery industry is discussed, and the problems and challenges faced by aquatic animal object detection and tracking technology and applied research are put forward. The future research direction, and construction of accelerating the underwater object detection and tracking data set and open sharing service platform for aquatic animals are suggested, for realizing the key technological breakthroughs of accurate detection and real-time tracking of aquatic animals. The proposals to promote the development of intelligent monitoring equipment based on accurate detection and real-time tracking of aquatic animals are intended to provide reference for accelerating the promotion of precision farming of intelligent fisheries and the modernization of marine fisheries.

This is an open access article, free of all copyright, and may be freely reproduced, distributed, transmitted, modified, built upon, or otherwise used by anyone for any lawful purpose. The work is made available under the Creative Commons CC0 public domain dedication.

Key words aquatic animal; underwater object recognition; underwater object tracking; deep learning

收稿日期 2020-10-09

基金项目 辽宁省重点研发计划项目(2020JH2/10100043);辽宁省高等学校海洋产业技术研究院项目(2018-CY-04)

作者简介 于红(1968—), 女, 博士, 教授。E-mail:yuhong@dlou.edu.cn

DOI10.16535/j.cnki.dlhyxb.2020-263

文章编号:2095-1388(2020)06-0793-12

中图分类号TP 181;TP 391

文献标志码:A