养殖鱼类数据集生命周期及质量控制探讨

古小威1,2,张胜茂2*,杨胜龙2,吴祖立2

(1.上海海洋大学 信息学院,上海 201306;2.中国水产科学研究院东海水产研究所,农业农村部渔业遥感重点实验室,上海 200090)

摘要:目前,水产养殖向智能化加速转型,高质量数据集成为了推动渔业数智化发展的核心基石。本研究系统梳理了养殖鱼类数据集的构建流程、数据类型、关键技术及其质量控制方法。首先,对图像、视频、音频、三维点云与文本等多元数据类型在智能养殖中的应用特点与面临的挑战进行了归纳分析;其次,阐述了数据采集、标注、增强与多模态融合等关键环节的技术体系;再次,从采集质量、标注一致性、结构标准化等维度构建了全生命周期的数据质量控制与标准化机制;最后,总结了典型开源数据集的特征与局限,并基于自监督学习、机器与数字孪生等前沿技术,展望了养殖鱼类数据集的未来发展方向。本研究可为水产养殖的智能化研究与实践提供系统性的数据支撑与方法参考。

关键词养殖鱼类;数据集;生命周期;质量控制

养殖鱼类是全球水产品供给的主要来源,目前全球一半的食用鱼类来自养殖业[1]。随着信息技术与人工智能的飞速发展,水产养殖业正逐步从依赖经验、以机械化为特征的传统模式迈向自动化乃至智能化的新阶段。在此转型过程中,高质量数据集的构建成为数智渔业发展的核心基础与关键驱动力。养殖鱼类数据集是指经过系统采集、标注或结构化处理,能够反映养殖鱼类个体或群体状态及其所处环境的多源、多模态数据的集合,其在实际应用中支撑以下几类关键场景:通过图像与视频数据识别鱼类表观异常、行为异常,实现早期病害诊断与预警;基于视频分析鱼类摄食强度、群体聚集程度,结合环境数据动态调整投喂策略,提升饲料利用率;利用三维点云与图像数据测量鱼体长度、鱼体质量,结合历史数据预测生长趋势,优化出栏时间等。高质量数据集与人工智能的结合,可以进一步发挥数据和人工智能的倍增效应[2]

养殖鱼类数据集早期受限于手段,主要通过人工测量与单点传感器获取鱼类表型及基础环境参数,数据规模小、模态单一,仅能支撑基础分类与监测。目前,计算机视觉技术推动水下影像与视频数据成为养殖鱼类数据集核心[3],AI辅助标注[4]提升效率,物联网技术则能实现水质、声呐等环境数据的实时采集,多模态数据初步融合但面临时空对齐与标注效率瓶颈。近年来,养殖鱼类数据集的构建方法呈现出更加多元化的发展趋势,大数据处理技术[5]、机器学习[6]和知识图谱[7]等高新技术的引入和应用,显著提升了数据处理效率和知识挖掘的深度。然而,当前养殖鱼类数据集的建设仍面临严峻挑战,主要包括数据多样性不足[8]、动态复杂环境下的数据采集困难[9]和人工标注成本高昂且缺乏统一的标注标准等[10]

本研究中系统梳理了近年来养殖鱼类数据集构建方法的研究进展,总结了各类数据集的类型与特点,分析了构建数据集的核心技术,归纳了现有公开数据集的应用场景与局限性,并探讨了未来面临的挑战和发展方向。希望能为相关研究者和产业工作者提供鱼类数据集构建的系统性参考,为人工智能技术在水产养殖领域更广泛、更深入的应用提供思路与借鉴。

1 养殖鱼类数据集类型及特征

随着智能水产养殖的快速发展,对数据的需求日益多元化和精细化。为了支撑鱼类生长评估、行为分析、病害诊断和环境调控等核心智能化应用,需要构建覆盖不同信息维度的高质量数据集。根据数据采集方式、信息形态及应用目标,当前养殖鱼类数据集主要可归纳为5大类型:图像数据、视频数据、音频数据、三维点云数据和文本数据。每种数据类型因其独特的获取手段、信息特性和应用场景,在构建智能养殖知识体系中扮演着不可或缺的角色,共同构成了理解养殖对象及其环境的立体化数据基础,然而,各类数据在采集、处理和应用过程中也面临各自的技术挑战与局限性。

1.1 图像数据

图像数据(图1)是构建养殖鱼类数据集的核心数据类型,通过捕获鱼类表观特征的视觉信息,为精准化、智能化养殖管理提供关键依据。鱼类图像数据集在多个领域至关重要:记录鱼类体型、颜色、鳞片纹理等外观特征,为物种分类和新物种发现提供可视化依据;借助机器学习算法训练图像识别模型,实现鱼类物种自动化分类,提升渔业资源调查效率。Wu等[11]提供了大口黑鲈鱼苗图像的数据集,该数据集专为密集场景中的小目标检测而设计,使用LabelImg工具进行注释,并转换为COCO格式,可以应用于各种场景,包括育苗、鱼苗零售和生存评估;Francescangeli等[12]利用OBSEA平台产生的沿海鱼类时间序列图像数据集,通过对其中鱼类标签进行分析,有助于研究鱼类种群动态。

图1 鱼类图像数据[13-14]
Fig.1 Fish image data[13-14]

当前养殖鱼类图像数据的应用面临显著不足:浑浊的水下环境导致图像质量差;高密度养殖造成的严重遮挡使现有算法识别与计数误差大;图像处理需要依赖大量标注,成本高;此外,还包括对鱼类动态行为的捕捉和分析能力不足。未来发展方向在于融合多模态数据提升鲁棒性,协同优化轻量化算法与硬件以实现高效大尺度监测及减少标注依赖,并集成基于时空分析的实时决策系统联动养殖设备,推动智能化、无人化养殖升级。

1.2 视频数据

视频数据(图2)通过连续帧序列捕捉鱼类的行为动态,是研究摄食活动、群体行为模式[15]及应激反应的关键数据类型,为水产养殖智能化提供核心数据基础。

图2 Fish4Knowledge数据集的鱼类视频数据
Fig.2 Fish video data from the Fish4Knowledge dataset

视频数据在养殖鱼类领域的重要性体现在其对动态信息的捕捉能力与时间维度的研究价值。在摄食活动监测中,计算机视觉技术实时分析鱼群聚集程度、个体抢食动作活跃度及水面残饵量,可为智能投喂系统提供依据,实现按需投喂,减少饲料浪费,优化饲料转化率,并通过摄食积极性变化及时发现潜在健康问题[16]。群体行为分析可评估鱼类福利和应激水平。鱼类种类识别与分类技术在水下视频中日益重要,对混养池塘管理、鱼苗分选、特定物种研究及防止逃逸物种扩散至关重要,通过识别不同鱼种独特形态特征、纹理模式及行为差异,实现复杂水下环境中自动分类和个体计数,提升管理效率和精准度。表1为视频数据的具体应用。

表1 视频数据应用
Tab.1 Application of video data

应用领域application fields文献literature技术方案technical proposal主要挑战main challenge应用价值application value摄食活动监测feeding activitymonitoringGeorgopoulou等[17]使用连续、实时的监控系统以及YOLO和DEEPSORT算法监测不同摄食情况下的游泳反应,探索进食频率、摄食时间和摄食量水体浑浊导致图像模糊,光照变化干扰识别减少饲料浪费,提升投喂效率,揭示了鱼的摄食行为指数;对不同摄食场景的敏感性,阐明了响应不同喂食频率、时间和数量的不同行为模式群体行为分析group behavioranalysisClippele等[18]使用高帧率摄像设备和计算机视觉提取运动轨迹算法分析摄食频率、逃避行为、应激反应高密度鱼群黏连,个体行为分离困难分析了鱼类的丰度、行为和复杂的底层和上层间的相互作用Nygård等[19]使用立体摄像机设置录制,执行基于深度学习的对象检测以检测特定特征,进行特征匹配和随后的3D重建以计算鱼的3D位置,从中估计鱼的运动轨迹可能存在光照变化剧烈、鱼群密集等情况能够自动、准确地识别鲑的关键特征,更全面、准确地反映鲑的运动轨迹鱼类种类识别与分类identification and classification of fish speciesZhao等[20]通过复合骨干网络CBresnet与增强路径聚合网EPANet,学习水下场景源域信息以减少环境干扰,实现低质量视频中鱼类的检测与识别光线不均导致视频质量差,出现小目标特征模糊模型,易受背景噪声干扰导致检测精度下降在低质量水下视频中实现了75.2%~92.8%的鱼类检测召回率,有效应对浑浊、重叠、小目标等场景,较传统算法提升21.3%抗干扰能力洪波等[21]设立监测点,利用香农威纳指数、物种均匀度指数和物种丰富度指数方法分析2个水域鱼类组成及多样性监测点处于黄浦江主航道附近,往来船只较多,对鱼类的影响较大,所以其鱼类种类较少数据分析得出,鱼类的洄游活动及溶解氧、水温等环境因素对物种多样性的季节变化起到明显作用;水流等环境因素及航运等人为因素对鱼类多样性指标的空间分布也起到明显作用

鱼类养殖视频分析面临主要挑战:高密度养殖下鱼体持续运动与严重遮挡,使传统目标检测和行为跟踪算法在精确计数、个体识别及长时轨迹追踪上误差累积;同时,海量视频处理对算力要求高,1 h 4K视频处理需GPU(NVIDIA A100)运行8 h,能耗约15 kW,实时性难以保障。未来需开发高效时空模型提升动态场景解析能力,结合边缘计算与硬件提升加速实现低延时处理,并融合多源传感器数据增强行为与环境关联分析,最终实现基于视频智能的实时投喂决策、健康预警与自动化养殖管理。

1.3 音频数据

音频数据(图3)在水产养殖中作为一种辅助感知手段,在鱼类行为监测、环境噪声识别及水质监控等方面得到广泛应用。音频数据通过水下声学传感器采集,能够实时捕捉到水体中的声音信号,如鱼群的活动声音、饲料投喂时的水面波动声、设备运行时的噪声等。通过分析这些音频数据,可以帮助研究人员评估鱼群行为模式及其与环境因素的关系。

图3 鱼类音频数据[22]
Fig.3 Fish audio data[22]

通过先进的音频信号处理技术,结合机器学习算法,可以将这些音频数据转化为有价值的行为分析结果。Mccann等[23]使用双频识别声纳,从美国密歇根州北部休伦湖的支流奥克克河收集渔业声学观测数据,这些数据可以补充未来的研究,以表征有价值的鱼类丰度和行为;Gu等[24]通过整合音频、视频和溶解氧数据,提出了一种新型的多模态融合相互作用网络来提高饲喂强度分析的准确性和鲁棒性,在多模态鱼类摄食强度数据集上的分类准确率达到97.6%,比其他多模态融合方法的性能高出3%以上。

未来,随着深度学习等技术的发展,音频数据的处理和分析能力将进一步提升。结合声学传感器和其他传感数据,音频数据的多模态融合将为智能水产养殖系统提供更加精准的行为分析和环境监控能力。

1.4 三维点云数据

三维点云数据(图4)是指通过激光雷达、深度相机或结构光扫描等技术获取,描述物体表面空间三维坐标及其可能附带属性的海量点集合,能精确重建鱼类或其他物体的三维几何形状和空间位置信息,为养殖鱼类研究提供全新视角和更丰富量化维度。

图4 鱼类三维点云数据[25]
Fig.4 Fish 3D point cloud data[25]

点云数据的核心价值在于其空间几何信息的精确性和完整性[26]。Mert等[27]利用点云技术重建鱼体游泳三维模型,为行为分析提供了精确的空间数据支撑。胡少秋等[28]利用构建好的包含三维点云数据特征的鱼类数据集进行分类训练和验证,结果表明,Point Transformer网络在对鱼类三维模型分类中表现出色,整体分类准确率可达91.9%。此外,点云数据是构建鱼类、设备和养殖设施高精度三维数字模型的基础,可用于数字孪生、养殖、场景模拟、空间利用率优化和碰撞检测等。

点云数据在养殖场景应用方面仍面临显著挑战,如动态目标与运动模糊需高速采集设备或运动补偿算法,以及数据处理复杂度高和设备成本与部署难度大等。尽管如此,随着传感器技术进步、计算能力提升及点云处理算法发展,三维点云数据正成为构建高精度、全方位养殖鱼类数据集的重要组成部分,尤其在需要精确空间信息和三维模型的场景中不可替代[26]

1.5 文本数据

文本数据作为鱼类研究与管理中不可或缺的补充信息源,在物种精准识别、历史生态基线重建及理解长期变化趋势等方面发挥着关键作用。通过结构化存储和深入分析,文本信息能够有效弥补传统生物学数据的局限,提供深层次的历史视角和分类学基础。

通过先进的数据库技术和历史文本分析方法,研究人员能够从非结构化或半结构化的文本记录中提取出关键知识。李然等[29]在智能鱼类信息共享平台的数据库设计中,通过精心构建的16张数据表,系统整合了包括鱼名、生态习性、形态特征等多种信息,其中鱼名等核心文本信息是准确识别物种、实现高效分类检索的基础支撑。另一方面,研究人员建立了立陶宛历史鱼类监测数据集[30],通过对20世纪50—80年代保存的详实文本记录进行深度挖掘与分析,成功揭示了在快速变暖和富营养化等现代环境压力发生之前该区域生态系统的基线状态,为探索鱼类群落组成、丰度乃至鱼类大小结构的历史变迁提供了宝贵的原始依据。这些工作充分展现了文本数据在构建知识框架和追溯生态历史方面的独特价值。

未来,随着自然语言处理技术[31]的持续进步,特别是命名实体识别和关系抽取能力的增强,结合知识图谱[32]等工具,对历史文献、监测报告和数据库描述性文本的自动化、智能化解析与整合将更加高效。这类深度挖掘的文本信息与环境监测、遥感影像[33]等多源数据相融合,将为理解鱼类资源的长期动态、评估环境变化的生态影响及制定更具前瞻性的保护与管理策略提供更坚实、更全面的数据基础。

2 数据集质量与生命周期

在养殖鱼类数据集构建过程中,数据质量直接决定了人工智能模型的性能边界、系统部署的稳定性及其产业化落地能力。尤其是在多模态[34]、高密度、动态化的水产养殖场景中,数据易受采集误差、标注偏差、格式混乱和标签不一致等问题影响,构建一套科学、高效、可闭环的数据质量控制与标准化机制已成为行业共识。图5所示的流程图展示了一种“采集-清洗增强-标注-标准化-反馈优化”的闭环式数据管理路径。在该流程中,各环节通过技术手段、工具系统及专家参与协同联动,以实现鱼类数据集的多维度质量保障。

图5 数据质量控制与标准化流程
Fig.5 Data quality control and standardization flow chart

2.1 数据采集阶段:保障数据完整性与代表性

数据采集作为数据生命周期的起点,其准确性和全面性直接决定了后续处理和建模的上限。面对水下环境的不确定性与感知多样性,如何实现高质量、多维度的数据获取,是当前研究与工程的重点方向。

在复杂养殖环境中,图像和视频数据的可用率常因水质变化、设备偏差而波动。为实现结构稳定和高效采集,谭清元等[35]通过高通量测序技术,对东山湾典型鱼类摄食行为与图像处理流程进行了优化,提升了数据采集的稳定性和有效率;同时,王佳等[36]针对小样本视频行为识别提出了基于两阶段时空对齐[37]的鱼类视频采集方法,通过多传感器联合[38]获取鱼体图像与水质指标,提升了数据同步精度。在三维点云数据采集中,Mert等[27]采用 “高速激光雷达+深度相机” 多传感器联合采集的方法,最终实现了鱼体游泳姿态的高精度三维重建。

采集环节的重点在于“精准+多样+同步”,通过设备硬件和感知机制的提升,可大幅降低数据缺失率和冗余率,为后续环节打下坚实基础。

2.2 数据清洗与增强:解决噪声与样本不均

清洗与增强是连接采集与建模之间的桥梁环节,其任务不仅是“剔除干扰”,更重要的是“重塑样本分布”,提升数据集对实际场景的适应性与泛化能力。雷俊等[39]基于CycleGAN[40]构建了用于对虾养殖图像的图像增强模型,通过合成弱光、浑浊等极端场景图像,有效提升了模型在非理想环境下的鲁棒性;毕甜甜等[41]采用N-Gram和多模型融合的方法对水产养殖长文本进行建模,通过字词之间的相互语义关联关系及联合建模实现了对实体语义更加完善的识别;陈辉等[42]综述了水下图像降噪技术在鱼类图像处理中的应用,包括非局部均值滤波与Retinex光照校正[43]等方法,为鱼类图像预处理提供了系统方案。目前,清洗环节还广泛应用图像评分模型对模糊、重影、水纹覆盖等图像进行自动剔除,此外,采用数据增强技术提升样本多样性,可使模型更具鲁棒性和迁移能力[44]

总体来看,数据清洗与增强阶段的目标是“去杂增益”,在保证信息完整度的同时,丰富样本特征分布空间,为后续模型训练提供更强的泛化支撑(图6)。

图6 养殖鱼类数据清洗与增强流程
Fig.6 Schematic diagram of data cleaning and augmentation process for cultured fish

2.3 数据标注阶段:多层质检与模型辅助校验

标注质量是AI模型表现的天花板,尤其在养殖鱼类图像中,标注对象密集、形态复杂,传统标注方式已难以满足高精度要求,构建自动化与人工交互融合的多层质检体系成为主流方向。邱宁等[45]通过采用lableImg软件人工标注的方式对原始影像图片进行目标信息标注,建立了航道工程鱼类目标检测数据集,并进一步利用该数据集基于YOLOv5[46]目标检测算法进行了模型训练;刘洋等[47]在对水族馆鱼类目标检测网络优化研究中,通过收集并标注83种水族馆鱼类的10 042张图像数据集,在保证目标检测[48]和识别能力的同时,探究降低网络计算复杂度、提高推理速度的网络优化方法,可以更高效地对鱼类数据进行标注。

为了进一步保障标注质量,部分平台引入“标注一致性打分”机制,利用不同标注员对同一图像的重标差异度分析一致性,并通过投票机制确定最终标签。同时,通过半监督学习模型对未标注图像进行伪标注,能够大幅减少人工成本,提升样本利用率。归纳来看,标注阶段的控制重点在于“高精度+高一致性”,这样能充分利用自动化工具和专家反馈相结合的机制,有效减少主观误差并提升标签标准化水平。在选择数据标注工具时(表2),需要考虑标注对象、标注需求和不同的数据集格式[49]

表2 部分开源的数据标注工具[53]
Tab.2 Several open-source data annotation tools[53]

类型type名称name简介introduction运行平台operating platform标注形式annotation format导出数据格式export data formatLabelImg开源的轻量级图像标注工具,常用于目标检测任务,支持矩形框绘制Windows,Linux,Mac矩形Pascal VOC(XML)、YOLO(TXT)RectLabel专为Mac设计的图像标注软件,支持矩形、多边形、折线和点标注,适合检测与分割任务Mac多边形、矩形、多段线、线段、点YOLO、KITTI、COCO、CSV 格式图像标注image annotationVIA基于 Web 的简洁工具,无需安装即可运行,支持多种几何形状标注,适用于小规模快速项目Web矩形、圆、椭圆、多边形、点、线JSON、COCO格式COCO UI专门为COCO格式数据集设计的Web工具,适合大规模标注与团队协作Web矩形、多边形、点、线COCO(JSON)精灵标注助手国产多功能标注工具,界面友好,支持矩形、多边形与曲线标注,兼容多任务场景Windows,Linux,Mac矩形、多边形、曲线Pascal VOC(XML)、YOLO视频标注video annotationLabelMeMIT 开发的图形化标注工具,既支持图像也支持视频,适合检测与分割任务Windows,Linux,Mac多边形、矩形、圆形、多段线、线段、点Pascal VOC(XML)、COCO(JSON)VOTT微软开源的跨平台标注工具,支持图像与视频,适合与Azure ML、TF管道对接Windows,Linux,Mac多边形、矩形、点JSON、CSV、TFRecordVaticWeb端标注工具,主要用于视频目标跟踪,但也可用于文本序列化标注Linux文本结构化CSV、VOC文本标注text annotationBRAT面向自然语言处理的文本标注工具,支持关系、事件和命名实体标注Linux文本标记ANN、Standoff 格式DeepDive知识提取与弱监督框架,适合大规模文本语料标注与信息抽取LinuxNLP实体/关系标注TSV、JSON音频标注audio annotationPraat经典的语音学分析工具,支持音频分段、音素/语调标注Win,Unix,Linux,Mac音频分段/音素标记TextGrid、CSV多功能软件multifunctional softwareLabelBox商业化 Web 平台,支持图像、视频、文本与医学数据标注,内置质量审核与协作机制Web多边形、矩形、线、点、嵌套分类JSON、COCO、CSVVIA支持图像、音频、视频标注(基于 Web)Web矩形、圆、椭圆、多边形、点、线JSON、COCO

2.4 数据标准化:结构统一与语义一致性

在鱼类数据多源异构、跨设备采集的背景下,构建统一的数据格式与标签语义体系不仅关系到数据的重用效率,也是支撑跨模型迁移和多场景融合的基础工作。蔡卫明等[50]构建养殖鱼类品种识别模型时,对采集的鱼类图像进行了数据预处理,包括图像批处理统一尺度和格式,之后再进行数据增强处理,这一系列对图像数据的标准化处理使模型在训练过程中能更好地学习不同鱼种特征,最终模型准确率达到 96.56%;Chen等[7]利用知识图谱管理多模态数据语义信息,并通过融合图像、结构化标签及描述性文本实现高层语义理解,为跨模态分析提供统一数据接口[51]

实践中,不同地区和机构对鱼类命名、阶段划分、健康评估[52]指标常存在表述差异,标准化流程通过构建标签映射表与字段校验机制,实现了多源数据的统一存储与调用。海南陵水地区石斑鱼数据平台即采用三级标注术语体系,使数据格式可拓展、语义可解析、语境可迁移。总体而言,标准化不仅是数据一致性的保障,也是支撑后续AI模型泛化、迁移与复用的核心枢纽。

2.5 模型反馈机制:数据缺陷闭环回补

高质量数据体系的终点不应止于标注,而应回归应用效果。模型部署后的反馈机制,可以有效反哺采集与处理环节,建立动态优化的数据循环体系。袁红春等[54]基于YOLOv8的误差追踪与补采机制,自动分析识别低置信区域并发起补采指令,使整体模型mAP值由0.75提升至0.87;Yang等[55]在智能水产养殖系统中,建议结合行为分析与置信度可视化手段,对训练数据进行空间分布评估,并针对密集养殖场景中偏少或置信低的区域进行补采或补标注。这类策略能够有效增强数据集的代表性,并提升模型在实际环境中的泛化能力。

此外,一些AI平台引入“模型置信度可视化面板”,动态展示误判区域分布及检测偏移趋势,为数据采集人员提供精准定位指导。通过“数据-模型-反馈-补采”的闭环结构,有效形成了数据更新的自适应迭代机制。归纳来看,反馈机制的建设推动数据流动从“静态分发”向“动态协同”转变,使数据资产在持续更新中保持活性与高效。

3 开源鱼类数据集

3.1 典型开源数据集概况

近年来,随着深度学习在水产养殖领域的广泛应用,面向鱼类识别[56]、行为分析[57]和健康监测[58]等多任务需求的开源数据集持续涌现。这些数据集在规模、模态、任务设计和应用场景上各具特点,构成了当前鱼类人工智能研究的基础资源。表3汇总了目前具有代表性的9个数据集,涵盖视频、图像和结构文本等不同模态,覆盖了从野外生态环境到工程化养殖场[59]的多类应用场景,并在任务设置、数据组织与标签体系方面体现出显著的构建理念差异。

表3 常用开源鱼类数据集对比与创新特征总结
Tab.3 Comparison and summary of innovative features of popular open-source fish datasets

数据集名称dataset name样本规模sample size数据模态data modality核心任务core mission应用环境application environment核心创新与贡献core innovations and contributionsFish4Knowledge27万段视频视频行为识别、追踪海洋自然环境/非养殖首个大规模视频行为标注数据集,支持时序行为建模FishSeg3万张图像图像病斑检测、语义/实例分割白底实验室高精度像素级病斑标注,适用于病害模型训练DeepFish1.2万图像图像小目标检测、密度估计海底复杂场景/非养殖小体积鱼目标密集检测与密度回归,支持多尺度泛化评估FishPose2万图像RGB+深度图姿态估计、体长建模结构光实验箱融合RGB与深度信息,构建鱼体姿态结构化数据FishNet5.4万图像图像鱼群计数、遮挡检测工程化网箱养殖遮挡条件下的多目标计数任务设定,支持密集鱼群模型评估FishAI Challenge8万图像图像分类、健康评估、病害检测混合养殖场多专家复审标注+任务融合标签体系,支撑多目标多标签学习WildFish9.8万图像图像野外鱼类识别自然水域/非养殖多物种复杂背景识别任务设计,具备生态学研究通用性FishBase3万图+文本图像+结构化文本物种分类、特征查询全球鱼类数据库/非养殖图文融合数据构建,结合鱼类形态、生理与分布等丰富描述信息Fish Recognition Ground1.5万图像图像多类检测与识别多源实验场/非养殖构建统一轮廓标注规则与任务模板,适用于通用检测算法评估Fish Sounds1 185种鱼类、239条声音录音音频被动声学监测与行为识别全球鱼类生态/非养殖全球鱼类声音数据库,支持行为分析与监测Xingu River Habitat Point Clouds5个栖息地、高密度点云三维点云栖息地结构精确建模、复杂度评估巴西亚马逊淡水生态/非养殖UAV+SfM-MVS 实现高精度栖息地三维建模,支持生态结构分析

这些数据集为养殖智能化模型训练与评估提供了基础条件,初步构建起涵盖行为识别、语义理解与场景泛化的数据基础设施。可以看出,具备较高影响力的项目往往在数据结构设计[60]、标签粒度控制、模态组织与评测机制方面体现出明显的标准化特征,并形成适配任务的系统性构建流程。

3.2 数据集构建规律与挑战

基于对现有数据集构建方法与技术特点的分析,可归纳出当前鱼类数据集建设中呈现出的4项典型特征与设计范式:其一,任务驱动性强,数据集的结构设计往往反向对齐具体任务需求,针对不同模型建模目标制定采集策略与标注方案;FishNet 针对鱼群密度建模采用高遮挡采集策略,而 FishSeg 则为精确训练病斑分割模型[61]提供像素级语义掩码[62]。其二,模态结构逐步多样化,从最初单一的RGB图像向融合深度图像、结构文本甚至多时序流的数据形式演化,反映出模型对信息多维度表达的需求增长;FishPose 融合RGB与深度图像用于三维建模[63],FishBase将图像与文字属性融合,是模态拓展的代表。其三,标签体系逐渐精细化与结构化,从传统分类标签扩展到行为状态[64]、关键点[65]和实例边界[66]等复杂结构,反映了监督信息粒度增强的趋势;以 FishAI Challenge 为例,其标签系统涵盖健康状态、物种分类与行为属性三重标签,为多任务模型训练提供了统一入口。其四,平台化流程逐步成熟,如 FishSeg 和 FishPose 背后均配备结构化的采集-标注-审核系统,使数据质量控制与标签一致性得到有效保障。

尽管当前已形成部分建设范式,但鱼类开源数据集构建仍面临不少挑战。首先,数据异构性带来的泛化困难仍未解决。不同数据集间物种差异、拍摄环境、分辨率与标注体系存在显著不一致,严重限制了模型迁移与跨平台通用性。其次,多模态对齐与同步机制尚不成熟,如深度图与RGB图、图像与结构文本的精准对齐仍依赖特定设备与人工标定,缺乏通用化工具支持。再者,标签系统标准缺失也使得不同数据集之间的整合变得困难,目前尚未形成统一的鱼类标注层级体系,尤其在行为识别[67]、病害分类[68]等高语义层级任务上,标签语义歧义普遍存在。

未来数据集的构建趋势应从“资源整合”向“范式协同”转型。所谓“范式协同”,是指从过去简单汇集数据资源的“物理整合”,转向在数据采集、标注体系、评估标准乃至协作机制上达成共识的“化学融合”。它强调构建统一的方法论框架和交互规范,使得不同来源、不同任务的数据集能够像拼图一样无缝衔接,共同支撑更复杂、更通用的智能模型研发。 一方面推动建立多任务统一标签体系,构建多层次标注本体和接口标准,增强数据集的结构兼容性;另一方面发展数据集生成与补全机制,通过生成建模或少量人工校验构建高质量合成数据以拓展样本覆盖面。此外,闭环反馈式数据优化机制也应嵌入数据集生命周期中,使得数据采集[69]、模型训练与标注系统形成交互式演进流程,持续提升数据可用性与任务适配度。

4 存在问题与展望

4.1 存在问题

4.1.1 高密度遮挡环境下目标检测精度仍受限制 在养殖鱼类数据采集中,高密度遮挡是最普遍且最具挑战性的问题之一[70]。涂万等[71]基于YOLOv8构建了引入ECAM模块与SCAM模块的改进模型,并在真实鱼群密度较高的图像上进行试验。结果显示,改进模型mAP@50达到94.2%,相比基础YOLOv8[72]提升了7.6%,召回率也由86.0%增加至92.0%;但作者也指出,当遮挡率超过70%时,目标边界极易模糊,导致识别错误或目标重叠检测。如在部分图像中,同一鱼体被重复标记为两个个体的现象时有发生,严重影响了标注一致性和数据准确性。此外,遮挡问题不仅影响静态图像识别,也对连续帧视频中行为识别与轨迹追踪[73]造成连锁干扰。因此,即便采用结构改进模型,现阶段在高密度遮挡场景下的自动识别仍面临算法精度和鲁棒性欠佳的问题。

4.1.2 目标追踪中ID切换频繁,难以实现个体持续识别 在视频数据中实现鱼体目标的跨帧追踪,是个体识别与行为建模的核心环节。杜丰等[74]提出“动态权重层次卷积特征自适应目标追踪算法”,通过引入多尺度卷积结构与动态融合权重机制,增强了鱼体外形特征的建模能力。该算法在遮挡场景下的追踪准确率为84.7%,优于传统KCF(79.2%)和SiamFC(76.8%)等基线方法。同时该算法也指出ID切换频率依然较高,特别是在鱼体快速游动或被遮挡后重现时,算法常出现ID漂移、重关联失败等问题,导致轨迹中断。这类问题将直接导致个体行为识别错误,无法准确统计游速、聚集性或摄食行为[75],甚至在疾病检测中误判患病鱼体。

4.1.3 小目标检测能力有限,幼鱼与远距目标识别困难 小体型鱼类由于其体型小、边界模糊,且常活动于图像远景或边缘区域,检测模型对其识别存在显著性能瓶颈。Wang等[76]提出的HRA-YOLO模型,通过引入高分辨率注意力机制与多层级特征融合模块,在公开的UnderwaterFishData数据集上将mAP@0.5提升至91.3%。但研究也指出,当鱼体长度小于5 cm或图像中占比不足3%时,召回率下降至77.6%。此外,小目标由于缺乏纹理细节且颜色对比弱,常被模型忽略或与背景混淆。更重要的是,当前公开数据集中小目标样本比例偏低,导致训练过程中的梯度学习偏向中大型目标,进一步加剧了模型对小鱼识别能力不足的问题。总体来看,小目标检测的局限性严重制约了鱼类苗种[77]、稀有种群的精准识别与保护应用。

4.1.4 模型跨场景泛化能力差,部署稳定性不足 YOLO系列模型泛化能力在实际部署中仍面临较大挑战。Yi等[78]设计了YOLOv8nDDSW模型,并将其分别部署在UFishSet和RoboFish两个公开鱼类检测数据集上进行迁移测试,结果显示,跨数据集迁移后mAP@50下降幅度达18.5%。研究分析指出,该性能衰减主要源于特征分布偏移、光照变化和背景干扰增强等。此外,尽管模型在训练过程中引入了Deformable Convolution与注意力机制用于增强鲁棒性,但仍不足以抵御强域间差异影响。当前领域自适应方法多依赖目标域标注样本进行迁移学习,但在实际应用中,新部署区域往往缺乏足够人工标注数据,导致模型迁移困难。这意味着模型训练仍严重依赖高质量本地数据集,阻碍了“通用模型-快速部署”的养殖智能化建设目标。

4.2 未来展望

4.2.1 智能化标注与自动化数据管理 未来数据标注将从“人机协作”走向更为智能化的自适应体系。通过引入自监督学习、对比学习等技术,模型可以利用大量未标注数据自主提取潜在特征,大幅减少人工标注工作量。同时,结合三维点云、多模态融合和时空建模等技术,能够实现鱼体结构、行为模式及环境状态的自动化识别与标注,从而实现“边采集、边标注、边优化”的闭环管理模式。此外,未来的数据管理将更加注重结构化和标准化,逐步形成覆盖全生命周期的数据治理体系,使鱼类数据集从单一静态资源,演化为可动态更新和持续优化的知识网络。这一趋势将为后续大模型的训练和智能决策提供高质量的数据支撑。

4.2.2 基础大模型与视觉语言模型驱动的多模态综合决策 随着基础大模型和视觉语言模型等前沿技术的不断发展,鱼类养殖将迈向更高层次的智能化阶段。基础大模型通过跨模态预训练与大规模知识迁移,实现对图像、视频、音频、点云及文本等多源异构数据的统一表征和语义对齐,为多模态数据管理提供通用框架。视觉语言模型则能够将视觉感知与语言表达深度融合,使系统在“理解”多模态数据的同时,具备自然语言交互和复杂推理能力。这将推动养殖管理系统从单一任务型模型,升级为面向全局综合决策的智能平台,实现从多模态感知、知识生成到策略优化的全链条管理。未来,这一类大模型驱动的综合决策机制将成为水产养殖智能化的核心基础,使系统能够在复杂环境下保持高适应性和可扩展性,并支持跨任务、跨场景的协同优化。

4.2.3 多模态融合与数字孪生系统推动智能养殖决策跃迁 未来养殖系统将不再依赖单一感知或经验判断,而是基于数字孪生技术实现“虚实一体”的动态监测、预测与干预管理。通过整合视频监控、水质传感、声呐定位和生理指标等多模态数据,以及建立高精度动态鱼体与养殖环境的数字模型,系统可实现对摄食行为、健康状态、水质变化的实时建模与趋势预测。配合强化学习与控制算法,系统可实现投喂量智能调节、水质参数优化与应激状态自动干预,大幅提升养殖效率与稳定性。在深远海养殖、冷水鱼养殖等复杂环境中,数字孪生可辅助精准建模不同海域、品种、生长周期下的生产参数,支持区域级甚至国家级渔业政策模拟与评估。未来这一系统将成为推动水产养殖从经验管理向智能管控跃升的关键引擎。

5 结论

养殖鱼类数据集的构建是推动水产养殖从经验驱动向数据驱动转型的核心基石,其发展水平直接决定了智能渔业的技术上限与产业落地深度。本研究系统梳理了图像、视频、环境传感器及多模态数据的采集特性与应用场景,剖析了数据标注效率、多模态时空对齐及跨场景泛化能力等关键环节,并展望了联邦学习、零样本检测及 LSTM-DDPG 混合模型等前沿技术的突破潜力。当前,数据集构建已从单一模态采集迈向多源异构数据融合,从人工标注为主转向 “AI 辅助+人机协同” 的智能化范式。然而,高密度养殖场景下的遮挡问题、跨企业数据共享壁垒及模型泛化性能不足,仍制约着技术的规模化应用。未来,需通过跨学科技术融合、标准化体系建设及产业生态协同,构建更具鲁棒性的数据集体系。随着深度学习、边缘计算与区块链技术的深入应用,养殖鱼类数据集将不仅服务于病害诊断、生长评估等基础任务,更将成为驱动种质资源创新、养殖模式优化及生态可持续发展的核心引擎,为全球渔业智能化转型与粮食安全保障提供关键支撑。

参考文献:

[1] OTTINGER M,CLAUSS K,KUENZER C.Aquaculture:Relevance,distribution,impacts and spatial assessments-a review[J].Ocean &Coastal Management,2016,119:244-266.

[2] BERCARU V,POPESCU N.Exploring sign language dataset augmentation with generative artificial intelligence videos:a case study using adobe firefly-generated american sign language data[J].Information,2025,16(9):799.

[3] 李鹏龙,张胜茂,沈烈,等.具有双层路由注意力机制的YOLOv8血鹦鹉目标检测与追踪方法[J].大连海洋大学学报,2024,39(2):318-326.LI P L,ZHANG S M,SHEN L,et al.YOLOv8 blood parrot object detection and tracking method with dual-layer routing attention mechanism[J].Journal of Dalian Ocean University,2024,39(2):318-326.(in Chinese)

[4] LI P Y,PARRILLA N A,SALATHE M,et al.Semi-automatic image annotation using 3D LiDAR projections and depth camera data[J].Annals of Nuclear Energy,2025,213:111080.

[5] AITSAM M,JIMENEZ RODRIGUEZ A,DI NUOVO A.Efficient data processing pipeline for event-based vision datasets:techniques and insights[J].Engineering Research Express,2024,6(4):045238.

[6] AMIRGALIYEV B,MUSSABEK M,RAKHIMZHANOVA T,et al.A review of machine learning and deep learning methods for person detection,tracking and identification,and face recognition with applications[J].Sensors,2025,25(5):1410.

[7] CHEN Z,ZHANG Y C,FANG Y,et al.Knowledge graphs for multi-modal learning:survey and perspective[J].Information Fusion,2025,121:103124.

[8] 朱仁敬.基于机器学习的海洋水产养殖病害的分析与预测[D].青岛:青岛科技大学,2021.ZHU R J.Analysis and prediction of marine aquaculture diseases based on machine learning[D].Qingdao:Qingdao University of Science &Technology,2021.(in Chinese)

[9] 徐文杰,方辉,杨胜龙,等.深度学习在鱼类识别、计数、追踪方面的应用研究进展[J].大连海洋大学学报,2024,39(5):874-887.XU W J,FANG H,YANG S L,et al.Research progress on application of deep learning in fish recognition,counting,and tracking:a review[J].Journal of Dalian Ocean University,2024,39(5):874-887.(in Chinese)

[10] 韩欣冉,李子牛,张胜茂.自动投饵技术在水产养殖中的应用进展[J].渔业信息与战略,2025,40(2):98-109.HAN X R,LI Z N,ZHANG S M.Application progress of automatic feeding technology in aquaculture[J].Fishery Information &Strategy,2025,40(2):98-109.(in Chinese)

[11] WU Y Q,XU H L,LIAO B W,et al.A fish fry dataset for stocking density control and health assessment based on computer vision[J].Data in Brief,2024,57:111075.

[12] FRANCESCANGELI M,MARINI S,MARTNEZ E,et al.Image dataset for benchmarking automated fish detection and classification algorithms[J].Scientific Data,2023,10:5.

[13] WANG G X,YU J X,LIU S T,et al.Automatic fish weight estimation and 3D surface reconstruction with a lightweight instance segmentation model[J].Expert Systems with Applications,2025,288:128275.

[14] 张胜茂,李佳康,唐峰华,等.基于深度学习的鱼类养殖监测研究进展[J].农业工程学报,2024,40(5):1-13.ZHANG S M,LI J K,TANG F H,et al.Research progress on fish farming monitoring based on deep learning technology[J].Transactions of the Chinese Society of Agricultural Engineering,2024,40(5):1-13.(in Chinese)

[15] 曹冰,罗桠,曾令清.生态情境及其测定次序对镜鲤幼鱼群体行为的影响[J].中国水产科学,2022,29(12):1759-1767.CAO B,LUO Y,ZENG L Q.Influence of ecological contexts and determination sequence on the behavior of juvenile mirror carp(Cyprinus carpio var.specularis)[J].Journal of Fishery Sciences of China,2022,29(12):1759-1767.(in Chinese)

[16] 李鹏龙,张胜茂,沈烈,等.基于深度学习的鱼类跟踪技术研究进展[J].渔业现代化,2024,51(2):1-13.LI P L,ZHANG S M,SHEN L,et al.Research progress in fish tracking technology based on deep learning[J].Fishery Modernization,2024,51(2):1-13.(in Chinese)

[17] GEORGOPOULOU D G,VOUIDASKIS C,PAPANDROULAKIS N.Swimming behavior as a potential metric to detect satiation levels of European seabass in marine cages[J].Frontiers in Marine Science,2024,11:1350385.

[18] CLIPPELE L H,NOZRES C,XU J S,et al.Fish use of deep-sea sponge habitats evidenced by long-term high-resolution monitoring[J].Scientific Reports,2025,15(1):17656.

[19] NYGÅRD T A,JAHREN J H,SCHELLEWALD C,et al.Motion trajectory estimation of salmon using stereo vision[J].IFAC-Papers OnLine,2022,55(31):363-368.

[20] ZHAO Z X,LIU Y,SUN X D,et al.Composited FishNet:fish detection and species recognition from low-quality underwater videos[J].IEEE Transactions on Image Processing,2021,30:4719-4734.

[21] 洪波,王淼,张玉平,等.黄浦江上游渔业水域鱼类组成及多样性[J].安徽农业科学,2013,41(15):6737-6739,6741.HONG B,WANG M,ZHANG Y P,et al.Component and diversity of fishes in the fishery water of upper reaches of the Huangpu River[J].Journal of Anhui Agricultural Sciences,2013,41(15):6737-6739,6741.(in Chinese)

[22] DU Z Z,CUI M,XU X B,et al.Harnessing multimodal data fusion to advance accurate identification of fish feeding intensity[J].Biosystems Engineering,2024,246:135-149.

[23] MCCANN E,LI L L,PANGLE K,et al.An underwater observation dataset for fish classification and fishery assessment[J].Scientific Data,2018,5:180190.

[24] GU X Y,ZHAO S L,DUAN Y Q,et al.MMFINet:a multimodal fusion network for accurate fish feeding intensity assessment in recirculating aquaculture systems[J].Computers and Electronics in Agriculture,2025,232:110138.

[25] VEINIDIS C,ARNAOUTOGLOU F,SYVRIDIS D.3D reconstruction of fishes using coded structured light[J].Journal of Imaging,2023,9(9):189.

[26] LIAO Y H,ZHOU C W,LIU W Z,et al.3DPhenoFish:Application for two- and three-dimensional fish morphological phenotype extraction from point cloud analysis[J].Zoological Research,2021,42(4):492-501.

[27] MERT K,CHEN F,MAURIZIO P.Towards three-dimensional point cloud reconstruction of fish swimming[J].Bionspiration,Biomimetics,And Bioreplication X,2020,11374DOI:10.1117/12.2558095.

[28] 胡少秋,段瑞,张东旭,等.基于Point Transformer方法的鱼类三维点云模型分类[J].水生生物学报,2025,49(2):148-157.HU S Q,DUAN R,ZHANG D X,et al.Classification of 3d point cloud models of fish based on point transformer approach[J].Acta Hydrobiologica Sinica,2025,49(2):148-157.(in Chinese)

[29] 李然,杨玉婷,张志强,等.智能鱼类信息共享平台的构建[J].大连海洋大学学报,2022,37(3):497-504.LI R,YANG Y T,ZHANG Z Q,et al.Construction of intelligent fish information sharing platform[J].Journal of Dalian Ocean University,2022,37(3):497-504.(in Chinese)

[30] G,et al.Historical fish survey datasets from productive aquatic ecosystems in Lithuania[J].Data in Brief,2022,41:107990.

[31] FERNANDES DIMLO U M,RUPESH V,RAJU Y.The dynamics of natural language processing and text mining under emerging artificial intelligence techniques[J].International Journal of System Assurance Engineering and Management,2024,15(9):4512-4526.

[32] ANDREU M L J,GARCA C A,BOTA A J.Data-driven interpretation of dimensions in an embedding language model based on a reference knowledge graph[J].Knowledge-Based Systems,2025,330(PA):114507.

[33] LI L Z,HAN L,YE Y X,et al.Deep learning in remote sensing image matching:a survey[J].ISPRS Journal of Photogrammetry and Remote Sensing,2025,225:88-112.

[34] HANGLOO S,ARORA B.Multimodal fusion techniques:review,data representation,information fusion,and application areas[J].Neurocomputing,2025,649:130827.

[35] 谭清元,张方圆,赵峰,等.高通量测序分析东山湾代表性鱼类对污损生物的摄食差异[J].中国水产科学,2025,32(1):83-92.TAN Q Y,ZHANG F Y,ZHAO F,et al.Analysis of feeding differences on fouling organisms of representative fish species in Dongshan Bay,Fujian by high-throughput sequencing[J].Journal of Fishery Sciences of China,2025,32(1):83-92.(in Chinese)

[36] 王佳,夏英,丰江帆.基于两阶段时空对齐的小样本视频行为识别[J].计算机科学,2025,52(08):251-258.WANG J,XIA Y,FENG J F.Few-shot video action recognition based on two-stage spatio-temporal alignment[J].Computer Science,2025,52(08):251-258.(in Chinese)

[37] FEI H,WU S Q,ZHANG M S,et al.Enhancing video-language representations with structural spatio-temporal alignment[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2024,46(12):7701-7719.

[38] KUMAR M,GOYAL N,QAISI R M A,et al.Joint trust-based detection and signature-based authentication technique for secure localization in underwater wireless sensor network[J].Multimedia Tools and Applications,2025,84(31):37845-37864.

[39] 雷俊,苏园园,尹连政,等.基于eDNA技术与传统渔具调查方法的万泉河鱼类多样性的比较研究[J].渔业科学进展,2025,46(2):147-161.LEI J,SU Y Y,YIN L Z,et al.Comparative study of fish diversity in Wanquan River based on environmental technology and traditional fishing gear survey methods[J].Progress in Fishery Sciences,2025,46(2):147-161.(in Chinese)

[40] KONG L Y,LI Z Y,HE X Y,et al.Humanlike-GAN:a two-stage asymmetric CycleGAN for underwater image enhancement[J].Signal,Image and Video Processing,2025,19(5):379.

[41] 毕甜甜,张思佳,孙旭菲,等.融合N-Gram的水产养殖长文本实体关系联合抽取[J].哈尔滨理工大学学报,2025,30(2):91-103.BI T T,ZHANG S J,SUN X F,et al.A joint extraction method of entity relations in aquaculture long text using N-gram fusion[J].Journal of Harbin University of Science and Technology,2025,30(2):91-103.(in Chinese)

[42] 陈辉,王硕,许家昌,等.基于多尺度特征融合生成对抗网络的水下图像增强[J].计算机工程与应用,2023,59(21):231-241.CHEN H,WANG S,XU J C,et al.Underwater image enhancement based on generate adversarial network with multiscale feature fusion[J].Computer Engineering and Applications,2023,59(21):231-241.(in Chinese)

[43] SUN L,TANG C,XU M,et al.Non-uniform illumination correction based on multi-scale Retinex in digital image correlation[J].Applied Optics,2021,60(19):5599-5609.

[44] 李佳康,张胜茂,吴祖立,等.养殖水体中校色卡识别与色彩变化分析[J].渔业信息与战略,2024,39(1):49-60.LI J K,ZHANG S M,WU Z L,et al.Identification and analysis of color changes in aquaculture waters using color checker[J].Fishery Information &Strategy,2024,39(1):49-60.(in Chinese)

[45] 邱宁,彭士涛,MATHIAS K,等.基于YOLOv5目标检测算法的航道工程鱼类智能识别技术研究[J].水道港口,2024,45(5):806-815.QIU N,PENG S T,MATHIAS K,et al.Study on intelligent identification based on object detection algorithm of YOLOv5 for fish in waterway engineering[J].Journal of Waterway and Harbor,2024,45(5):806-815.(in Chinese)

[46] 郭磊,王邱龙,薛伟,等.基于改进YOLOv5的小目标检测算法[J].电子科技大学学报,2022,51(2):251-258.GUO L,WANG Q L,XUE W,et al.A small object detection algorithm based on improved YOLOv5[J].Journal of University of Electronic Science and Technology of China,2022,51(2):251-258.(in Chinese)

[47] 刘洋,张胜茂,王书献,等.水族馆鱼类目标检测网络优化研究[J].渔业现代化,2022,49(3):89-98.LIU Y,ZHANG S M,WANG S X,et al.Research on optimization of aquarium fish target detection network[J].Fishery Modernization,2022,49(3):89-98.(in Chinese)

[48] TAVARIS D,SCANDINO L,LUCA FORESTI G,et al.A cost-effective autonomous underwater system for small size object detection[J].Integrated Computer-Aided Engineering,2025,32(3):258-271.

[49] ZHOU H Y,GAO B B,WU J X.Adaptive feeding:achieving fast and accurate detections by adaptively combining object detectors[C]//2017 IEEE International Conference on Computer Vision (ICCV).October 22-29,2017,Venice,Italy.IEEE,2017:3525-3533.

[50] 蔡卫明,庞海通,张一涛,等.基于卷积神经网络的养殖鱼类品种识别模型[J].水产学报,2022,46(8):1369-1376.CAI W M,PANG H T,ZHANG Y T,et al.Recognition model of farmed fish species based on convolutional neural network[J].Journal of Fisheries of China,2022,46(8):1369-1376.(in Chinese)

[51] YAO M Z,WANG H B,LI Y D,et al.Detail-focused and polarization-guided multi-modality fusion for underwater image clarity enhancing[J].Engineering Applications of Artificial Intelligence,2025,159:111677.

[52] ZHANG Y J,CHEN L X,FENG H H,et al.Wearable bioimpedance-based deep learning techniques for live fish health assessment under waterless and low-temperature conditions[J].Sensors,2023,23(19):8210.

[53] 蔡莉,王淑婷,刘俊晖,等.数据标注研究综述[J].软件学报,2020,31(2):302-320.CAI L,WANG S T,LIU J H,et al.Survey of data annotation[J].Journal of Software,2020,31(2):302-320.(in Chinese)

[54] 袁红春,陶磊.基于改进的Yolov8商业渔船电子监控数据中鱼类的检测与识别[J].大连海洋大学学报,2023,38(3):533-542.YUAN H C,TAO L.Detection and identification of fish in electronic monitoring data of commercial fishing boats based on improved Yolov8[J].Journal of Dalian Ocean University,2023,38(3):533-542.(in Chinese)

[55] YANG X T,ZHANG S,LIU J T,et al.Deep learning for smart fish farming:applications,opportunities and challenges[J].Reviews in Aquaculture,2021,13(1):66-90.

[56] 郭建军,陈杰鑫,林丽君,等.基于计算机视觉的鱼类行为识别研究进展[J].大连海洋大学学报,2025,40(2):351-362.GUO J J,CHEN J X,LIN L J,et al.Application of computer vision to recognize fish behavior[J].Journal of Dalian Ocean University,2025,40(2):351-362.(in Chinese)

[57] 宋韵涛,曾令锋,谭细畅,等.基于PIT技术的老口航运枢纽鱼道通行效率及鱼类行为分析[J].农业工程学报,2024,40(8):216-222.SONG Y T,ZENG L F,TAN X C,et al.Passage efficiency and fish behavior of Laokou navigation junction fishway using passive integrated transponder(PIT) telemetry[J].Transactions of the Chinese Society of Agricultural Engineering,2024,40(8):216-222.(in Chinese)

[58] GRILO M L,SOUSA-SANTOS C,ROBALO J I,et al.The importance of baseline health surveillance efforts in freshwater fish conservation using the threatened Iberian leuciscids as an example[J].Journal of Wildlife Diseases,2024,60(3):561-571.

[59] PITT K A,HABERLIN D,STANTIC B,et al.Mitigating and managing the impacts of gelatinous zooplankton on finfish aquaculture[J].Aquaculture,2024,581:740403.

[60] 陈建文,方舟,李庆伟,等.渔业专题电子海图的数据结构设计[J].上海海洋大学学报,2022,31(6):1542-1548.CHEN J W,FANG Z,LI Q W,et al.Design of data organization structure for fishery thematic electronic chart[J].Journal of Shanghai Ocean University,2022,31(6):1542-1548.(in Chinese)

[61] 郭奕,黄佳芯,邓博奇,等.改进Mask R-CNN的真实环境下鱼体语义分割[J].农业工程学报,2022,38(23):162-169.GUO Y,HUANG J X,DENG B Q,et al.Semantic segmentation of the fish bodies in real environment using improved Mask-RCNN model[J].Transactions of the Chinese Society of Agricultural Engineering,2022,38(23):162-169.(in Chinese)

[62] 冯博,于海征,边红.基于掩码增强自训练的域适应语义分割[J].计算机应用,2025,45(7):2132-2137.FENG B,YU H Z,BIAN H.Domain adaptive semantic segmentation based on masking enhanced self-training[J].Journal of Computer Applications,2025,45(7):2132-2137.(in Chinese)

[63] PECK M,TAPILATU R F,KURNIATI E,et al.Rapid coral reef assessment using 3D modelling and acoustics:acoustic indices correlate to fish abundance,diversity and environmental indicators in West Papua,Indonesia[J].PeerJ,2021,9:e10761.

[64] MAWER R,ELINGS J,BRUNEEL S P,et al.Combining habitat selection,behavioural states,and individual variation to predict fish spatial usage near a barrier[J].Ecological Informatics,2025,85:102967.

[65] LI G,LIAN A J,YAO Z D,et al.Fish keypoint detection for offshore aquaculture:a robust deep learning approach with PCA-based shape constraint[J].Frontiers in Marine Science,2025,12:1619457.

[66] 刘桂霞,吴彦博,李文辉,等.基于深度学习的实例分割边界框回归方法研究[J].哈尔滨工程大学学报,2024,45(3):474-479,614.LIU G X,WU Y B,LI W H,et al.A bounding box regression method of instance segmentation based on deep learning[J].Journal of Harbin Engineering University,2024,45(3):474-479,614.(in Chinese)

[67] LI R H,XIAO K B,LIN S H,et al.Enhancing aquatic ecosystem monitoring through fish jumping behavior analysis and YOLOV5:Applications in freshwater fish identification[J].Journal of Environmental Management,2025,391:126413.

[68] RAHAMAN M M,SHARMA B,TALUKDER S,et al.Viral threats to Australian fish and prawns:economic impacts and biosecurity solutions-a systematic review[J].Viruses,2025,17(5):692.

[69] WANG Y,ZHANG J,HAN G,et al.A secure data collection method based on deep reinforcement learning and lightweight authentication[J].World Electric Vehicle Journal,2025,16(5):281.

[70] 徐龙琴,郑钦月,高学凯,等.基于轻量级CDW-YOLO v7的鱼类排便行为自动检测方法[J].农业机械学报,2025,56(6):554-564.XU L Q,ZHENG Q Y,GAO X K,et al.Automatic detection of fish defecation behavior based on lightweight CDW-YOLO v7[J].Transactions of the Chinese Society for Agricultural Machinery,2025,56(6):554-564.(in Chinese)

[71] 涂万,于红,张鹏,等.基于通道非降维与空间协调注意力的改进YOLOv8养殖鱼群检测[J].大连海洋大学学报,2023,38(4):717-725.TU W,YU H,ZHANG P,et al.Farmed fish detection by improved YOLOv8 based on channel non-degradation with spatially coordinated attention[J].Journal of Dalian Ocean University,2023,38(4):717-725.(in Chinese)

[72] 沈蔚,董世泓,刘梦骐,等.基于YOLOv8X和DIDSON的水域鱼类资源监测分析[J/OL].上海海洋大学学报,1-17[2025-10-13].https://doi.org/10.12024/jsou.20241104711.SHEN W,DONG S H,LIU M Q,et al.Monitoring and Analysis of Fish Resources in Waters Based on YOLOv8X ang DIDSON[J].Journal of Shanghai Ocean University,1-17[2025-10-13].https://doi.org/10.12024/jsou.20241104711.(in Chinese)

[73] HOU Y Q,ZOU X,TANG W M,et al.Precise capture of fish movement trajectories in complex environments via ultrasonic signal tag tracking[J].Fisheries Research,2019,219:105307.

[74] 杜丰,王万良,李思远,等.动态权重层次卷积特征自适应目标追踪算法[J].小型微型计算机系统,2021,42(4):835-841.DU F,WANG W L,LI S Y,et al.Adaptive target tracking algorithm with dynamic weighted hierarchical convolutional neural network feature[J].Journal of Chinese Computer Systems,2021,42(4):835-841.(in Chinese)

[75] YANG Y C,JIA L Q,LONG W,et al.A review of research on fish feeding behavior based on computer vision[J].Journal of Big Data and Computing,2025,3(1):50-58.

[76] WANG H R,ZHANG J T,CHENG H.HRA-YOLO:an effective detection model for underwater fish[J].Electronics,2024,13(17):3547.

[77] 邹世平.鱼类苗种、亲本及种质标准的检测指标分析[J].中国水产,2001(9):53-73.ZOU S P.Analysis of detection indexes of fish fry,parents and germplasm standards[J].China Fisheries,2001(9):53-73.(in Chinese)

[78] YI J W,HAN W,LAI F F.YOLOv8n-DDSW:an efficient fish target detection network for dense underwater scenes[J].PeerJ Computer Science,2025,11:e2798.

Qualitycontrol and data lifecycle management for farmed fish datasets

GU Xiaowei1,2,ZHANG Shengmao2*,YANG Shenglong2,WU Zuli2

(1.College of Information,Shanghai Ocean University,Shanghai 201306,China;2.Key Laboratory of Fisheries Remote Sensing Ministry of Agriculture and Rural Affairs,East China Sea Fisheries Research Institute,Chinese Academy of Fishery Sciences,Shanghai 200090,China)

AbstractAquaculture industry is transformed towards artificial intelligence and high-qualtiy datasets are cornerstone to promote the development of digital intelligence fisheries.We systematically reviewed the construction pipeline, data types, key technologies, and quality control methodologies for farmed fish datasets.First, we summarized and analyzed the application characteristics and associated challenges of diverse data types, including images, videos, audio, 3D point clouds, and text, within intelligent aquaculture.Second, the technical frameworks for key processes, such as data acquisition, annotation, augmentation, and multi-modal fusion, were elaborated.Third, we constructed a full life cycle data quality control and standardization mechanism that addressed dimensions such as acquisition quality, annotation consistency, and structural standardization.Finally, the characteristics and limitations of typical open source datasets were summarized. Building upon cutting-edge technologies such as self-supervised learning, federated machine learning, and digital twins, we concluded by proposing future research directions for farmed fish datasets. The research result provides systematic data support and methodological references for both the research and practice of intelligent aquaculture.

Key wordsfarmed fish; dataset; lifecycle; quality control

中图分类号S 965

文献标志码:A

收稿日期2025-09-20

基金项目中国水产科学研究院东海水产研究所中央级公益性科研院所基本科研业务费专项资金(2024TD04)

作者简介古小威(2000—),男,硕士研究生。E-mail:1194505615@qq.com

通信作者张胜茂(1976—),男,博士,研究员。E-mail:ryshengmao@126.com

DOI:10.16535/j.cnki.dlhyxb.2025-200

文章编号:2095-1388(2025)05-0873-14