Please wait a minute...

大连海洋大学学报  2023, Vol. 38 Issue (2): 348-356    DOI: 10.16535/j.cnki.dlhyxb.2022-307
  |
基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet
胥婧雯,于红*,张鹏,谷立帅,李海清,郑国伟,程思奇,殷雷明
1.大连海洋大学 信息工程学院,辽宁省海洋信息技术重点实验室,辽宁 大连 116023;2.设施渔业教育部重点实验室(大连海洋大学),辽宁 大连 116023;3.大连海洋大学 水产与生命学院,辽宁 大连 116023
A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet
XU Jingwen,YU Hong*,ZHANG Peng,GU Lishuai,LI Haiqing,ZHENG Guowei,CHENG Siqi,YIN Leiming
1.Key Laboratory of Marine Information Technology of Liaoning Province,College of Information Engineering,Dalian Ocean University,Dalian 116023,China;2.Key Laboratory of Environment Controlled Aquaculture (Dalian Ocean University),Ministry of Education,Dalian 116023,China;3.College of Fisheries and Life Science,Dalian Ocean University,Dalian 116023,China
下载:  HTML  PDF (9225KB) 
输出:  BibTeX | EndNote (RIS)      
摘要 为解决在光线昏暗、声音与视觉噪声干扰等复杂条件下,单模态鱼类行为识别准确率和召回率低的问题,提出了基于声音和视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet,该方法采用ResNet50模型提取视觉模态特征,通过MFCC+RestNet50模型提取声音模态特征,并在此基础上设计一种U型融合架构,使不同维度的鱼类视觉和声音特征充分交互,在特征提取的各阶段实现特征融合,最后引入SENet构成关注通道信息特征融合网络,并通过对比试验,采用多模态鱼类行为的合成加噪试验数据验证算法的有效性。结果表明:U-FusionNet-ResNet50+SENet对鱼类行为识别准确率达到93.71%,F1值达到93.43%,召回率达到92.56%,与效果较好的已有模型Intermediate-feature-level deep model相比,召回率、F1值和准确率分别提升了2.35%、3.45%和3.48%。研究表明,所提出的U-FusionNet-ResNet50+SENet识别方法,可有效解决单模态鱼类行为识别准确率低的问题,提升了鱼类行为识别的整体效果,可以有效识别复杂条件下鱼类的游泳、摄食等行为,为真实生产条件下的鱼类行为识别研究提供了新思路和新方法。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胥婧雯
于红
张鹏
谷立帅
李海清
郑国伟
程思奇
殷雷明
关键词:  行为识别  深度学习  多模态融合  U-FusionNet  ResNet50  SENet    
Abstract: In order to solve the problem of low accuracy and recall rate of single-mode fish behavior recognition under complex conditions such as dim light, sound and visual noise interference, a multi-level integration of sound and visual features of fish behavior recognition model U-FusionNet-ResNet50+SENet was proposed by ResNet50 model to extract visual modal features.Sound modal characteristics were extracted by MFCC+RestNet50 model.On this basis, a U-shaped fusion architecture was designed to fully interact the visual and sound features of fish behaviors with different dimensions, and to realize feature fusion in each stage of feature extraction. Finally, SENet was introduced to form a feature fusion network of attention channel information, and the effectiveness of the algorithm was verified by the synthetic test data of multi-modal fish behaviors through comparative experiments. The results showed that the accuracy rate of fish behavior recognition by U-FusionNet-ResNet50+SENet reached 93.71%, F1 score 93.43% and recall rate 92.56%.Compared with the existing Intermediate-feature-level deep model with better effect, there was increase in recall rate by 2.35%, F1 value by, 3.45% and accuracy by 3.48%, indicating that the U-FusionNet-ResNet50+SENet recognition method proposed in this paper can effectively solve the problem of low accuracy of single-mode fish behavior recognition, and improve the overall effect of fish behavior recognition.
Key words:  behavior recognition    deep learning    multimodal fusion    U-FusionNet    ResNet50    SENet
               出版日期:  2023-05-10      发布日期:  2023-05-10      期的出版日期:  2023-05-10
中图分类号:  S 932.2  
  TP 391  
基金资助: 辽宁省教育厅重点科研项目(LJKZ0729 );国家自然科学基金(31972846)
引用本文:    
胥婧雯, 于红, 张鹏, 谷立帅, 李海清, 郑国伟, 程思奇, 殷雷明. 基于声音与视觉特征多级融合的鱼类行为识别模型U-FusionNet-ResNet50+SENet[J]. 大连海洋大学学报, 2023, 38(2): 348-356.
XU Jingwen, YU Hong, ZHANG Peng, GU Lishuai, LI Haiqing, ZHENG Guowei, CHENG Siqi, YIN Leiming. A fish behavior recognition model based on multi-level fusion of sound and vision U-fusionNet-ResNet50+SENet. Journal of Dalian Ocean University, 2023, 38(2): 348-356.
链接本文:  
https://xuebao.dlou.edu.cn/CN/10.16535/j.cnki.dlhyxb.2022-307  或          https://xuebao.dlou.edu.cn/CN/Y2023/V38/I2/348
[1] 孙哲涛, 于红, 宋奇书, 李光宇, 邵立铭, 杨惠宁, 张思佳, 孙华. 基于规则匹配与深度学习AbTransformer的渔业标准表格信息抽取方法[J]. 大连海洋大学学报, 2023, 38(1): 140-148.
[2] 张晓鹏, 许志远, 曲胜, 邱文轩, 翟泽宇. 基于改进YOLOv5深度学习的海上船舶识别算法[J]. 大连海洋大学学报, 2022, 37(5): 866-872.
[3] 张胜茂, 孙永文, 樊伟, 唐峰华, 崔雪森, 伍玉梅. 面向海洋渔业捕捞生产的深度学习方法应用研究进展[J]. 大连海洋大学学报, 2022, 37(4): 683-337.
[4] 赵梦, 于红, 李海清, 胥婧雯, 程思奇, 谷立帅, 张鹏, 韦思学, 郑国伟. 融合SKNet与YOLOv5深度学习的养殖鱼群检测[J]. 大连海洋大学学报, 2022, 37(2): 312-319.
[5] 何津民, 张丽珍. 基于自注意力机制和CNN-LSTM深度学习的对虾投饵量预测模型[J]. 大连海洋大学学报, 2022, 37(2): 304-311.
[6] 文莉莉, 孙苗, 邬满. 基于注意力机制和Faster R-CNN深度学习的海洋目标识别模型[J]. 大连海洋大学学报, 2021, 36(5): 859-865.
[7] 杨鹤, 于红, 刘巨升, 杨惠宁, 孙哲涛, 程名, 任媛, 张思佳. 基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别[J]. 大连海洋大学学报, 2021, 36(4): 661-669.
[8] 袁红春, 刘慧, 张硕, 陈冠奇. 基于深度学习和典型相关分析的渔情预测方法[J]. 大连海洋大学学报, 2021, 36(4): 670-678.
[9] 贺琳, 张雨, 巴韩飞. 基于注意力机制和深度学习模型的外来海洋生物命名实体识别[J]. 大连海洋大学学报, 2021, 36(3): 503-509.
[10] 王羽徵, 程远, 毕海, 于秋玉, 刘丹. 基于深度学习VGG网络模型的海洋单细胞藻类识别算法[J]. 大连海洋大学学报, 2021, 36(2): 334-339.
[11] 俞伟聪, 郭显久, 刘钰发, 刘婷, 李雅薇. 基于轻量化深度学习Mobilenet-SSD网络模型的海珍品检测方法[J]. 大连海洋大学学报, 2021, 36(2): 340-346.
[12] 于红. 水产动物目标探测与追踪技术及应用研究进展[J]. 大连海洋大学学报, 2020, 35(6): 793-804.
[13] 袁红春, 张硕. 基于Faster R-CNN和图像增强的水下鱼类目标检测方法[J]. 大连海洋大学学报, 2020, 35(4): 612-619.
No Suggested Reading articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed