专家约稿

大模型在水产养殖病害防治中的创新应用与展望

张思佳1,2,3,于红1,2,3*

(1.大连海洋大学 信息工程学院,辽宁省海洋信息技术重点实验室,辽宁 大连 116023;2.设施渔业教育部重点实验室(大连海洋大学),辽宁 大连 116023;3.大连市智慧渔业重点实验室,辽宁 大连 116023)

摘要:大模型是具有大量参数和复杂结构的机器学习基础模型,目前正在逐渐成为科技发展的重要方向之一。本文阐述了大模型应用的核心技术,并探讨了其运行所需的基本条件及大模型在辅助水产养殖病害防治中的具体应用,包括大模型辅助水产养殖病害防治与管理、协同水产养殖环境监测与疾病防治、水产药物研发、水产动物疾病抗性培育组学技术中的应用,并从数据获取与处理、模型适应性与泛化能力、计算资源与训练成本、隐私与安全、模型解释性与用户接受度、多任务学习与优先级管理、跨区域数据共享与合作、知识图谱增强大模型集成与利用等方面提出了大模型的未来发展趋势,以期为大模型在水产养殖病害防治领域的进一步应用提供有力支持,推动水产养殖业向更高效、可持续的方向发展。

关键词大模型;水产养殖;病害防治;智慧化;深度学习

水产养殖业在全球食品供应链中扮演着关键角色,是满足食品需求和营养安全、提供可持续海洋和淡水生物资源的主要来源。然而,随着水产养殖规模的不断扩大和作业密集化,水产动物疾病暴发已成为一个日益严峻的问题[1]。这不仅会导致较高的经济损失,还可能威胁到整个养殖生态系统的健康和稳定。因此,有效的病害防治措施对于确保水产养殖业的可持续发展具有重要的意义。

传统水产养殖病害防治方法面临病原多样性和环境变化的挑战,智慧化手段逐渐成为解决此类问题的重要方向。早期的智慧化手段以专家诊断系统为主[2],但受限于知识库广度和更新频率。随着大数据和人工智能技术的发展,知识图谱成为解决之道,其能挖掘实体间的深层联系,提供强大数据支撑,打破数据隔阂,助力海洋数据应用[3-7]。这种智慧化方案不仅能提供传统解答,还能通过学习和更新知识库提高诊断预测的准确性,为水产养殖业的可持续发展提供强大技术支持,使病害管理更加科学、高效。

随着水产养殖规模的扩大和数据量的激增,传统的智慧化分析方法在处理能力上逐渐受限。以ChatGPT为代表的人工智能大模型引发了社会热议,各行业均已感受到人工智能发展引发的变化[8]。大模型的应用为水产养殖病害防治领域带来了革命性的改变。如丁博等[9]通过广义线性模型分析了大青鲨 (Prionace glauca)的钩捕死亡率与潜在因素,为资源可持续利用提供了科学依据。李秀超等[10]则构建了针对印度洋金枪鱼渔业的多物种生态系统模型,并进行了结构性改进,为渔业管理提供了重要参考。Rasmy等[11]设计的预训练模型加速了人工智能在健康领域的应用,而Yang等[12]将大模型预训练语言模型应用于单细胞测序技术,有望在肿瘤微环境研究上取得突破。

大模型在应对复杂问题、提供前瞻性解决方案等方面的显著优势[13],使其成为水产养殖病害防治技术发展的重要方向,也是推动水产养殖业可持续发展的关键策略。面对日益复杂的水产养殖病害挑战,应用大模型不仅是必要的,更是实现病害防治科学化、高效化的重要武器。本文综述了大模型应用的核心技术,并探讨了其在水产养殖病害防治中的具体应用,以期推动水产养殖业向更高效、可持续的方向发展。

1 大模型的发展及其核心技术

大模型通常是指具有大量参数和复杂结构的机器学习基础模型,其范围涵盖了多个领域。狭义上,大模型主要指大语言模型(large language models,LLMs),如GPT-3和GPT-4等[14-15],其具有数十亿至数千亿个参数,可用于自然语言处理任务,如文本生成、摘要和翻译等。而广义上,大模型还包括机器视觉大模型(用于图像识别、分割和生成等任务)、科学计算大模型(用于解决复杂的科学计算问题)及多模态大模型(可以处理多种不同类型的数据,如文本、图像、音频等)。这些大模型在各自领域都取得了显著的成就,推动了人工智能技术的发展和应用。

1.1 大模型发展历程

大模型发展主要经历了3个阶段,分别是萌芽期、探索沉淀期和迅猛发展期[16-17](图1)。各类大模型都具备大量参数和复杂的结构,但其服务于不同的技术需求和解决方案。

图1 AI大模型发展主要阶段及其代表模型

Fig.1 Main developmental stages and representatives of AI large models

大模型的不同发展阶段标志着大模型在语言理解和生成能力上的持续提升,推动了自然语言处理技术的发展,并为未来人工智能在语言处理领域的应用提供了新的可能性。

1.2 大模型主要类型及其特点

按照输入数据的类型不同,大模型可分为大语言模型、机器视觉大模型、科学计算大模型和多模态大模型(表1)。

表1 大模型分类

Tab.1 Classification of large models

类别category适用场景applicable scenarios描述description技术架构technical architecture应用领域application domain代表模型representative model大语言模型large language model处理自然语言任务通过大模型预训练学习语言的深层次结构和语义Transformer自然语言处理、对话系统和文本生成等OpenAI、ERNIE Bot(文心一言)和BERT机器视觉大模型large machine vision model处理视觉领域任务使用卷积神经网络或Vision Transformer处理图像数据卷积神经网络、ViT图像分类、目标检测和图像生成等ResNet、ViT、VGG、Huawei Pangu CV(华为盘古)和Intern科学计算大模型large scientific computing model用于科学研究和计算任务结合多种数据类型和模型结构适应复杂科学问题各种架构结合物理模拟、化学预测和生物信息学等AlphaFold多模态大模型large multi-modal model同时处理和理解多种类型的数据,执行跨媒体任务通过整合不同模态的信息进行图像标注、视频内容理解等多模态融合架构图像标注、视频内容理解和多模态学习等CLIP、DALL-E和Din-goDB

按照应用领域的不同,大模型主要包括通用大模型和行业垂直大模型两个层级。其中,通用大模型是指可以在多个领域和任务上通用的大模型,相当于AI完成了“通识教育”(表2、表3);行业垂直大模型是指针对特定行业领域、特定任务或场景的大模型,其相当于 AI 成为“行业专家”,表4列举了当前较为常见的行业大模型。

表2 常见通用大模型(国外开发者)

Tab.2 Common general-purpose large models (foreign developers)

模型名称model name开发者developer基座模型/架构base model/architecture开源open source参数量number of parameter核心功能core functionGPT-4.0[18]OpenAITransformer否1.8万亿文本生成、自然语言理解、翻译、情感分析和问答GPT-3.5[19]OpenAITransformer否1 750亿文本生成、翻译和问答GPT-2.0[20]OpenAITransformer是15亿语言理解和文本生成Gemini[21]GoogleTransformer是1.8万亿语言生成、翻译、图像识别和问答Claude[22]AnthropicGPT-3否62亿会话式助手、多模态功能LLaMa[23]MetaTransformer是70~650亿无条件长文本生成,如对话生成和故事生成等Bert[24]GoogleTransformer是1.1亿/3.4亿强调上下文理解、自然语言理解,如事实推断、语法分析和文本分类CLIP[25]OpenAICNN/RNN/Transformer是4亿通过自然语言和图像联合学习,理解图像内容和描述ViT[26]GoogleTransformer是8.5~10亿Transformer架构应用于视觉任务

表3 常见通用大模型(国内开发者)

Tab.3 Common general-purpose large models (domestic developers)

模型名称model name开发者developer基座模型/架构base model/architecture开源open source参数量number of parameter核心功能core function盘古模型[27]Pangu 华为Mindspore否1 000亿自然语言处理、计算机视觉、多模态和科学计算悟道[28]Wudao腾讯悟道·天鹰Aquila语言大模型是1.75万亿问题解决、内容生成和预测文心一言[29]ERNIE Bot百度飞桨深度学习平台和文心知识增强大模型是2 600亿语言生成、信息获取、知识协助和创作支持通义千问[30] Qwen阿里巴巴Qwen-7B是70亿~700亿人机自然语言对话、文案创作和疑问解答星火认知大模型[31]Spark Desk科大讯飞Transformer是130亿文本生成、分类、摘要、翻译、语音识别、情感分析和知识图谱ChatGLM 6B[32]清华大学、智谱AIGLM是60亿文本生成式对话模型,可以用于问答和闲聊等多种场景紫东太初[33]Zidong Taichu中科院自动化所MindSpore是千亿级全球首个图文音(视觉-文本-语音)三模态预训练模型混元大模型[34]Tencent Hunyuan腾讯GLM是超千亿自然语言理解、任务执行和问题解决

表4 行业大模型

Tab.4 Domain-specific large models

注:其他未注明来源信息均摘自互联网相关报道。

Note:Other unspecified source information is extracted from relevant internet reports.

模型名称model name基座模型/架构base model/architecture模型名称model name基座模型/架构base model/architecture腾讯金融大模型[35]Tencent Financial Large Language Model混元大模型IndustryGPTSMore LrMo本草[36] BenTsaoLLaMa-7B轩辕70B XuanYuan-70BBloomChatLaw-33B[37]Anima-33BCOSMO-GPTGPTDISC-FinLLM[38]Baichuan-13B-Chat佳都知行交通大模型 Jiadu Zhixing Transportation AI ModelTransformerLangCel[39]Geneformer后稷 AgriMABaichuan单细胞基因数据分析大模型[12] scBERT TransformerEcomGPT[41]BLOOMZMedGPT[40]Transformer天机·军事大模型 Tianji Military AI ModelTransformer、LSTM、DRL等范蠡大模型1.0 Fanli Model 1.0TaskFormer神经网络架构羲和海洋预报大模型 XiheSwin-Transformer

1.3 大模型应用的核心技术

随着人工智能技术的不断进步,大模型已成为科技界的研究热点。在自然语言处理、计算机视觉等领域,大模型展现了巨大的潜力。大模型的应用与其核心技术密切相关。

1.3.1 基础大模型选型 基础大模型选型在构建高效人工智能系统中至关重要。在选择基础大模型时,需评估其架构特性、预训练深度及历史表现。如针对自然语言处理任务,可优先考虑像GPT或BERT这样的预训练语言模型;而对于图像识别任务,则可能选择ResNet或VGG模型[42]。选型过程还需考虑模型的可扩展性、兼容性及部署成本。精确选型可确保AI系统在特定应用中实现高效学习与推理、优化整体性能和资源利用率、加速开发周期,并在竞争激烈的技术市场中保持领先地位。

1.3.2 高质量数据管理 高质量数据管理是大模型性能优化的核心环节,包括数据采集、数据标注和数据回流[43]。这3个阶段的高质量数据管理有助于提高大模型的性能和适应能力,在各种应用场景中均能达到最佳效果。

1.3.3 提示工程 提示工程在大模型应用中尤其在自然语言处理领域发挥核心作用。其主要通过设计有效的提示,激活并引导模型(如GPT系列的预训练语言模型)生成特定输出或执行任务[44]。这种方法主要依赖零样本、少样本学习及链式推理,优化模型在特定任务上的表现,同时发掘模型内部的知识,避免从头开始训练。提示工程提高了大模型在内容生成、情感分析和问题解答等场景的灵活性和效率,使其能快速适应新任务和挑战。

1.3.4 微调 微调在将通用预训练模型调整为适应特定任务和数据集时扮演关键角色[45]。通过微调(如GPT系列的语言模型),可显著提高大模型的性能和精确度,涉及调整权重以适应新数据和期望输出。微调通常需较少数据和计算资源,比从头训练更快达到优化状态。在情感分析、文本分类或问答系统等任务中,微调提升了模型的适应性和响应能力。这种方法可节约时间、资源,并加速模型从研究到实际部署的转化,使大模型在多样化应用场景中表现更出色。

1.3.5 人类反馈的强化学习 人类反馈的强化学习在大模型优化和适应性提升中发挥着关键作用[46]。该技术通过集成人类评价反馈,指导和调整预训练模型(如GPT系列),以更精确完成任务或生成更符合预期的输出。人类反馈的强化学习显著增强了大模型在对话系统、游戏智能、客服自动化等领域的表现和可靠性,可更好地满足用户需求,提升用户体验,扩展大模型的实用性和应用范围。

1.3.6 大模型可解释性 大模型通常是黑盒模型,无法有效追踪和解释其训练与推理过程。这在实际应用中,特别是在高可靠性领域,势必会引发安全问题与巨大风险。目前,大模型的涌现机制尚未明确。由于大模型自身面临解释性不足、知识实时性差和生成结果存在虚假信息等诸多挑战,亟需探索和开发适用于大模型的解释技术,以提高模型的透明度和可解释性。这不仅是理解大模型的基础,也是推动其实际应用和下一代大模型发展的关键。

1.3.7 模型安全和隐私保护 大模型需要大量的数据进行训练,这些数据可能包括敏感信息,如果模型的训练过程或内部结构被外部访问,将可能导致严重的数据泄露问题。由于目前缺乏数据收集及使用规范,大模型隐私泄露也是医疗人工智能发展存在的普遍问题。

1.4 大模型运行所需基本条件

大模型的有效运行和性能表现依赖几个基本条件,这些条件对于确保大模型能够处理复杂的任务和大模型数据至关重要。

1.4.1 充足的数据资源 大模型的训练和优化需要依赖于大量的数据。这不仅包括数据的数量,还包括数据的质量和多样性。充足的数据资源可以确保大模型能够学习到足够的特征和模式,从而提高其泛化能力和应对各种场景的能力。

1.4.2 强大的计算资源 由于大模型规模急剧扩大,智能算力已成为大模型发展的稀缺资源和关键瓶颈[47]。训练和运行大模型通常需要高性能的计算资源,如高配置的GPU、TPU或其他专门的硬件加速器。这些资源能够提供必要的计算力,以处理大量的数据和复杂的模型结构,缩短训练时间并提高运行效率。

1.4.3 专业的技术团队 一个由数据科学家、机器学习工程师和领域专家组成的技术团队是运行大模型的关键。这个团队不仅负责模型的设计和开发,还需进行模型的维护、优化和更新,以确保大模型在实际应用中的表现符合预期。

1.4.4 高效的算法和技术 使用最新和最有效的算法和技术是实现大模型高效运行的重要条件。这包括但不限于算法优化、模型简化和自动化调参等技术,这些技术有助于提升模型的性能,降低对资源的需求,并提高模型的可扩展性和可维护性。

除此之外,运行大模型还应考虑硬件加速与分布式训练[48]、模型压缩与部署优化[49],以及模型监控与维护[50]等因素。

2 大模型在辅助水产养殖病害防治与管理中的应用

随着水产养殖规模的扩大,水产动物疾病的暴发已成为影响产业可持续发展的重要因素,然而,传统防治方法面对病原多样性和环境变化的挑战时显得力不从心,迫切需要新的技术解决方案。

尽管目前围绕大模型在水产养殖病害防治领域应用的详尽探讨尚显不足,但借鉴大模型在人类医学领域的成功应用案例[51-52],或许能为解决水产养殖病害防治问题开辟新的研究方向与思路。这些跨行业的成功案例不仅为研究者提供了技术层面的启示,还可能启发研究者在水产养殖病害管理中采用更为精准、高效的方法。应用大模型辅助水产养殖病害防治的场景如图2所示。

图2 大模型在辅助水产养殖病害防治中的应用场景

Fig.2 Application scenarios of large model-assisted disease prevention and control in aquaculture

2.1 病害预测与早期预警

据统计,全国水产养殖病害种类高达200余种,常见病害达数十种,病害已成为制约水产养殖业发展的重要因素之一。有效防治水产养殖病害对于保障水产动物健康、提高养殖效益至关重要。然而,病害的早期发现与防控一直是亟需解决的问题。传统的诊断方法受限于人的经验和感官能力,难以准确识别病害的早期迹象。因此,预警预报已成为水产养殖病害管理领域的焦点和核心策略,“预防先行,重于治疗”的理念在水产动物病害防控中占据主导地位[53]。而大模型技术的出现,为这一问题的解决提供了新的思路。

2.1.1 疾病风险预测 在水产养殖病害防治领域,早期症状的不显著性或与其他疾病的相似性经常导致水产动物错过最佳治疗时机。因此,对每种疾病早期迹象的深入了解变得至关重要。针对这一问题,大模型可从多种数据类型中提供对养殖环境和生物健康状况的深入分析[54]。大模型能够深入分析养殖日志、研究报告、治疗记录和历史病例等文本数据,深入挖掘文本数据,识别出与疾病相关的关键信息和模式,以及预测潜在的疾病暴发。如在处理养殖日志数据时,大语言模型可以自动识别关键词和短语,如特定的症状描述或环境变化,这些往往也是疾病预兆。通过分析这些描述,大模型能够预测疾病类型和发展趋势,从而提前采取预防措施或调整养殖策略。

2.1.2 病害早期迹象视觉监测 传统的视觉监测方法无法实时捕捉养殖生物的异常行为和外观变化,导致病害发现不及时。视觉大模型可以实时分析来自水下摄像头的视频流,以监测和识别养殖生物的异常行为和外观变化,如鱼体颜色变化、伤口和异常游动模式[55]。此外,视觉大模型还可用于定量分析图像中的微小变化(如对比度和纹理变化),这些细微差异可能预示了病害的早期发展。如视觉大模型可以持续监控鱼群的健康状态,当模型检测到鱼群的异常行为(如游动缓慢或频繁跳跃),则会指示缺氧或其他健康问题。快速识别这些行为可以即时触发预警,允许及时干预,以减少疾病造成的损失。

2.1.3 跨模态数据融合分析 单一数据源往往无法提供全面的养殖环境和生物健康状况信息,导致诊断结果不准确。多模态模型结合了语言、视觉及其他感测数据(如声音或水质传感器数据),提供了一个综合的分析平台[56]。这使得大模型不仅能理解单一数据源的信息,还能通过跨模态数据分析更全面地了解养殖环境和动物的状态,如结合语言数据和水质传感器数据,同时可以分析图像、文本记录和水质数据,提供更全面的诊断。如果水质监测显示突然有参数变化,且视频分析发现鱼群行为异常,而且养殖日志中报告了相似的历史事件,模型可以综合这些信息,准确预测可能的疾病或环境压力事件。此外,大模型可以推荐基于以往成功案例的处理措施,为管理者提供决策支持。

2.1.4 防控策略优化与应对 传统的养殖管理策略往往基于经验或有限数据,难以实现最优化的养殖效益[57]。基于大模型的分析结果,养殖者可以优化养殖环境、调整饲料配方和增强生物免疫力等,以降低疾病发生的风险。部分水产动物疾病难以预防和控制,如病毒性疾病的防治比较困难,一旦发生疫情往往会造成较大损失,加大了诊断工作的难度。大模型可以利用数据分析和预测技术,帮助养殖者预测动物的疾病风险和传播途径,制定有效的预防控制策略,减少疾病的发生和损失。

2.1.5 应急响应机制建立 病害暴发时,传统的应急响应机制往往无法及时有效地应对,导致经济损失严重。大模型具有处理海量数据的能力,可以全面分析水产动物健康数据、环境数据及历史病害数据。通过识别关键因素和模式,这些模型可以为病害的预警预报提供科学依据,如大模型可以分析不同因素对病害发生的影响程度,帮助养殖者制定更有效的预防措施。当大模型检测到数据异常时,可以立即触发预警系统,启动应急响应机制,减少疾病造成的损失。

2.1.6 预警预报体系优化 传统的预警预报体系往往缺乏准确性和时效性,难以为养殖者提供及时有效的决策支持。科学计算大模型具有处理海量数据的能力,这使其能够分析大量的水产动物健康数据、环境数据及历史病害数据。通过对这些数据的深入学习和分析,模型能够识别出与病害发生相关的关键因素和模式,全面掌握警兆指标的情况,如可以利用大模型的深度学习和数据处理能力,对预警系统的数学模型进行优化,从而完善水产养殖病害预警预报体系,使预警预报技术更具有准确性、灵敏性和时效性。

综上,大模型在病害预测与早期预警中展现出超强的能力,通过深度分析养殖、环境和历史数据,其可准确识别病害风险,并提供及时预警。该技术提高了病害管理的效率和准确性,为水产养殖业的可持续发展提供了有力支持。

2.2 病害诊断与分类

目前,致病微生物对水产动物的危害日益严重,而传统的诊断方法工作量大、耗时长,已不能满足水产养殖生产对水产动物疾病诊断的要求[58]。因此,建立水产动物疾病的快速诊断方法非常必要。此外,大模型在医学领域的成功,助推了其在水产动物疾病诊断中的可行性和应用前景。

2.2.1 辅助病原体识别 水产动物疾病的病原体种类繁多,包括细菌、病毒和寄生虫等。大模型可以通过分析海量的疾病相关文献和数据,提取不同病原体的特征和影响因素,辅助兽医或疾病诊断专家快速准确地识别病原体,提高诊断效率。

2.2.2 提高诊断准确性 水产动物疾病的诊断需要综合考虑动物的体表、解剖结构和显微镜下的样本,以及环境变化、投饵施肥等多种因素。大模型可以结合图像识别、自然语言处理等技术,对病害图像和症状描述进行智能分析,辅助兽医或疾病诊断专家进行病害诊断和决策,以提高诊断的准确性。

2.2.3 判断症状相似性 水产动物患病后呈现的症状往往相似,容易造成诊断的混淆。大模型可以构建水产动物疾病的知识图谱和问答系统。用户可以通过输入问题或症状描述来获取可能的疾病原因、预防方法和治疗方案,帮助兽医或养殖者更好地区分和诊断不同疾病。

2.2.4 优化给药策略 在养殖过程中,水产动物疾病的治疗常常受到给药方式的限制。大模型可以利用相关算法优化给药策略,如确定最佳的药物种类、剂量和给药方式。此外,大模型还可预测药物在水体中的扩散和代谢过程,从而优化用药方案,提高治疗效果。

2.2.5 增强病因推理 病因推理在医学、公共卫生和疾病防控等多个领域中都扮演着重要角色。特别是在水产养殖中,疾病发生往往会对养殖业造成巨大的经济损失。通过病因推理,可以深入了解疾病的成因和传播途径,为疾病的预防和控制提供科学依据。大模型可以通过分析海量的病害数据和临床症状描述进行病因推理,帮助养殖者了解病害的成因和发展过程。这有助于养殖者更好地制定预防措施和治疗方案,降低病害的发生率和损失。

综上,大模型在水产生物病害诊断领域具有广泛的应用前景。大模型通过在辅助病原体识别、提高诊断准确性、判断症状相似性、优化给药策略及病因推理等方面的应用,能够显著提高水产动物疾病的诊断效率和准确性,为水产养殖业的可持续发展提供有力支持。未来,随着技术的不断发展和应用的深入,大模型将在水产动物疾病快速诊断领域发挥更加重要的作用。

2.3 病害风险评估与管理

水产养殖病害风险评估的研究有助于预防病害、降低损失、优化管理和提升效益,并助力政府制定防控策略,促进科研创新。这不仅保障了水产养殖业的健康发展,也保护了水域生态和食品安全。大模型的应用能够成为推动疾病风险评估和管理向更高精度和自动化水平发展的关键因素,未来可利用大模型处理复杂数据的能力,以及从已知数据中挖掘出深层次模式和规律的优势,为病害风险预测和评估提供科学准确的依据。

2.3.1 缓解诊断材料获取困难的问题 通常情况下,病害发生时活体鱼类难以从水中捞出,捞出的多是不新鲜或已腐败的鱼类,影响诊断的准确性。病害诊断需要用活体或刚死亡的养殖动物进行检查,但实际操作中往往难以获取此类样本。采用大模型和人工智能技术,可通过分析历史疾病数据、环境因素和动物群体数据等,进行病害风险评估和预测。这有助于在缺乏活体样本的情况下,提前识别潜在的疾病模式和趋势,从而采取预防措施。

2.3.2 拓展防治措施范畴 传染性疾病暴发迅速,给养殖生产造成很大损失,但预防措施往往未全面考虑一切能引起鱼病发生和传播的因素。预防工作既要注意消灭病因,切断传染与侵袭途径,又要提高鱼体的抗病力,采取综合性预防措施,但实际操作中往往难以全面实现。大模型可以帮助制定更全面的预防措施,通过分析大量的数据,包括环境因素、动物行为和病原体特征等,大模型可以识别出可能引起疾病暴发和传播的因素,并提出相应的综合性预防措施。

2.3.3 解决评估数据不足难题 病害风险评估需要大量的数据支持,包括历史疾病记录、环境因素和动物群体数据等。然而,在某些情况下这些数据可能不完整或不准确,从而影响评估的准确性和可靠性。利用大模型和人工智能技术,可以通过数据挖掘和机器学习方法,从有限的数据中提取更多的信息,并进行病害风险评估。这有助于克服数据不足带来的评估准确性和可靠性问题。

2.3.4 应对复杂生态系统挑战 水产动物生态系统通常非常复杂,包括多种动物种类和环境因素。因此,评估病害风险时需考虑这些复杂因素的相互作用,这可能增加了评估的复杂性和难度。利用人工智能技术建立复杂的生态系统模型,可以模拟不同因素对疾病传播的影响,从而提高病害风险评估的准确性[59]。这些模型可以考虑动物种类、环境因素和人为因素等多个方面的相互作用。

2.3.5 应对疫情预测的不确定性 预测水产动物疾病暴发的时间、地点和规模具有一定的不确定性,这可能会给风险评估和管理带来挑战。不确定性可能来自于环境因素、病原体的变异性及人为因素等方面。大模型可以利用大规模数据进行预测建模,通过机器学习算法提高预测的准确性,并通过不断学习和优化模型来应对不确定性。

2.3.6 克服技术水平和资源限制 目前,一些地区由于缺乏先进的诊断技术和专业人员,可能限制了对病害风险的准确评估和有效管理。因此,技术水平和资源分配不均可能成为一个挑战。在技术水平和资源有限的地区,可以利用大模型和人工智能技术开发简化和易用的诊断工具及管理系统,以提高病害风险评估和管理的效率和可行性。

综上,各类大模型在水产养殖病害风险评估与管理中都具备独特的应用价值。应用时要根据具体任务和数据特性,选择合适的模型类型,并结合行业专家的知识和经验,以实现其在实际应用中的最大化效能。综合利用大模型和人工智能技术,可以有效应对水产养殖业中的各种挑战,提高疾病风险评估和管理的水平及效果。

3 大模型在水产养殖环境监测与疾病防治中的协同应用

在水产养殖业中,综合运用多模态大模型、语言模型、视觉大模型及科学计算大模型,为养殖环境的监测和优化提供了前所未有的可能性,这不仅能够显著提升生产效率,还大幅降低了疾病风险。

3.1 环境因素与疾病风险关系分析

水产养殖环境复杂多变,受到水质、水温和养殖密度等因素的影响,这些环境因素可能会影响疾病的发生和传播,增加了诊断的复杂性[60-61]。大模型可以分析水质、水温等环境因素与疾病发生的关系,预测疾病的发生和传播趋势,为养殖者提供环境管理和疾病预防的建议。

3.2 水质参数连续监测与预测

传统的水质监测方法通常需要人工采样、实验室测试,而无法实现实时监测,导致对水质变化的反应不及时[62]。基于大模型的数据分析能力,可以建立实时监测系统,利用大规模数据预测和监测水质参数。这些模型可以利用历史数据和实时传感器数据,通过深度学习等方法,实现对水质参数的准确预测和实时监测,及时发现水质异常。

3.3 智能环境调控与预警系统

传统监测设备在养殖场覆盖广泛,但其布置通常受到采样点位的限制,可能无法全面覆盖养殖区域[63]。大模型可以利用语言模型处理和解析大量研究文献和养殖日志,提供基于证据的养殖环境调控建议,对监测数据进行智能分析,揭示趋势变化,发现水质异常并提前发出预警。这样的智能环境调控与预警系统可以帮助养殖者及时采取措施,避免水质问题对养殖环境造成不良影响。结合机器学习技术,如支持向量机或决策树,系统可以综合多种环境因素,优化光照、温度等关键参数,确保最适宜的养殖环境。

3.4 养殖效率优化与策略设计

传统水质监测设备获取的数据量较大,如何对数据进行有效分析和利用可能是一个挑战。应用科学计算大模型与遗传算法、模拟退火等高级优化算法相结合,可设计出数据驱动的最优养殖模式。这包括精确的饲料投喂策略、养殖密度调整,并在保证生产最大化的同时维护水质稳定和动物健康。

3.5 全自动监控系统集成与自我学习

传统水质监测设备通常只能监测部分水质参数,如溶解氧、氨氮等,无法全面反映养殖环境的综合状况[64-65]。采用视觉大模型配合深度强化学习,可以开发出能自我学习的监控系统,自动检测和调节养殖池中的多个参数。这种系统可即时响应环境变化,持续保障养殖环境处于理想状态。

3.6 水质监测成本降低与传统设备依赖

传统水质监测设备的购买、维护和运行成本较高,对于一些小型养殖场来说可能承担不起。大模型技术为小型养殖场解决水质监测成本高昂的问题提供了新路径。借助先进的算法和数据分析能力,大模型可以实时处理和分析大量水质数据[66],以更低的成本提供精准的水质监测结果。这不仅减少了小型养殖场对传统设备的依赖,同时也优化了资源使用,降低了购买、维护和运行的总体费用,为小型养殖场实现经济高效的水质管理提供了可能。

4 大模型在水产药物研发中的应用

目前,药物防控仍然是水产病害防控中最常用的手段之一。对于不同的病原类型应选择合适的药物进行预防和治疗,对症下药才能及时有效地遏制病害的发生和蔓延。随着各种化学合成药物(如抗生素等)的使用日益受到世界范围内多个国家的限制,天然、安全和高效防治剂的研发迫在眉睫[67-68]。大模型作为一种新兴的技术手段,其在数据处理、模式识别等方面展现出显著的优势,为水产动物疾病防治提供了新的思路。

4.1 目标识别与药物筛选

在水产养殖领域,由于抗病毒药物短缺和疫苗种类有限,防控水产动物病毒病一直面临严峻挑战。因此,核心研究目标是筛选绿色、广谱的抗病毒药物,并构建高效的防控技术体系,以确保水产动物的健康和养殖业的可持续发展。大模型可以快速提取科学文献和临床试验报告中的关键信息,加速药物发现和开发流程。通过深度学习和自然语言处理技术,大模型还可以识别与水产动物疾病相关的关键基因、蛋白质或其他生物标志物,这些信息对于药物靶点的确定和药物筛选至关重要。

4.2 药物作用机理预测

水产药物机理不仅有助于深入理解药物在水产动物体内的作用方式,还能指导更精准的药物开发和应用,从而提高治疗效果,减少副作用,更有效地防控水产动物疾病,保障水产养殖业的健康发展。因此,可以尝试利用大模型在分子水平上模拟药物与病原体之间的相互作用,预测药物的作用机理和潜在效果。这有助于更准确地评估药物的疗效和安全性,为药物研发提供有力支持。

4.3 药物毒性评估

药物毒性评估是确保药物安全使用的关键,它能揭示药物潜在风险,指导药物剂量和治疗方案,保障水产动物健康及环境安全,是药物研发与水产养殖业健康发展的重要保障[69]。科学计算大模型能够详细分析药物与病原体间的相互作用,预测药物的活性和潜在副作用,为药物设计提供科学依据。大模型可用于预测药物对水产动物的潜在毒性,通过模拟药物在生物体内的代谢过程,评估药物对水产动物的安全性,并优化药物剂量和给药方式。

4.4 药效预测与监控

新药药效的预测和监控有助于提前评估新药的疗效和安全性,为养殖户提供科学的用药指导,减少药物滥用和误用,从而保障水产动物的健康生长,提高养殖效益,同时也减少了对水环境的潜在污染。与其他生物医学领域相同,相比于网络药理学、传统生物学等技术,大模型可以用于预测水产动物对药物的反应和治疗效果。通过实时监测疾病的发展情况和治疗效果,及时调整治疗方案,确保治疗的及时性和有效性。

综上,整合多源数据、模拟药物作用机理和预测药物毒性等手段,使大模型为水产动物疾病防治提供了新的视角和工具。未来,随着技术的不断发展和应用的逐步深入,大模型将在水产动物疾病防治领域发挥更加重要的作用。

5 大模型在水产动物疾病抗性培育组学技术中的应用

种子被誉为农业的“芯片”,精确鉴定基因性状功能、发现优良等位基因和创制相关育种材料是生物育种的关键[70]。水产动物的疾病抗性培育是海洋生命科学领域的重要研究内容之一。传统的育种方法虽然取得了一定成效,但在面对日益复杂的疾病挑战时,其局限性逐渐凸显。基因研究的基本任务是编辑和利用目的基因,随着组学技术的不断发展,人们能够从多个层面揭示水产动物的生理状态和疾病抗性机制,为大模型在水产动物疾病抗性培育中的应用提供了可能。

5.1 基因组学编辑

大模型如深度学习和模式识别技术(CNN、RNN等)能够处理和分析大量的DNA序列数据,帮助研究人员识别与疾病抗性相关的基因和遗传标记。大模型还能预测基因编辑后的效果,为优化育种策略提供有力支持。

5.2 表观基因组学分析

利用机器学习算法,大模型能够识别和分类不同的表观遗传修饰,并理解它们如何影响基因表达。同时,图神经网络(GNN)等模型还能模拟和分析表观遗传标记之间的相互作用网络,为揭示疾病抗性机制提供新的视角。

5.3 转录组学分析

深度学习模型能够处理和分析RNA或mRNA表达数据,揭示水产动物在环境变化或疾病状态下的基因表达模式。通过构建基因共表达网络,研究人员可以进一步理解基因间的相互作用关系,为疾病抗性培育提供新的策略。

5.4 蛋白质组学与代谢组学分析

在水产动物的研究中,代谢物数据承载着丰富的生物学信息,由于当前缺乏针对水产动物的专用代谢数据库,使得对庞大而复杂的代谢物数据信息的处理变得尤为繁琐。大模型如多模态融合网络能够结合质谱数据和其他生物信息学数据,预测蛋白质的结构和功能[71]。同时,科学计算大模型和化学信息学方法(如分子对接模拟)能够分析小分子代谢物的数据,识别与疾病抗性相关的关键代谢物和代谢途径。这些信息对于理解水产动物的疾病抗性机制具有重要意义。

5.5 病毒检测与富集策略优化

在病毒检测方面,大模型能够从复杂的背景中识别出病毒颗粒或核酸序列的模式,辅助开发新的病毒富集和检测方法[72]。这不仅能提高病毒检测的效率和准确性,还能为抗病育种提供及时、准确的病毒监测手段。

综上,大模型在水产动物疾病抗性培育中的应用具有较强的可行性。育种本身就是大数据,其是通过大量数据之间的交叉验证,寻找最优的过程。组学技术的发展为获取大量、高质量的生物信息提供了可能,为大模型的应用提供了数据基础。大模型具有强大的数据处理和分析能力,能够从多个层面揭示水产动物的生理状态和疾病抗性机制。大模型的应用能够辅助研究人员发现新的抗病基因、优化育种策略和提高疾病抗性培育的效率。

6 大模型在水产养殖病害防治领域的挑战与展望

大模型技术以其强大的数据处理和学习能力,为水产养殖病害防治提供了新的视角和工具。然而,在实际应用中,大模型技术的实施和发展面临着一系列挑战。

6.1 数据获取与处理

高质量数据是行业大模型的关键。采集和构建水产病害防治领域高质量数据对大模型在水产养殖病害防治中的应用起到决定性作用。然而,不同水体、种类的水产养殖动物对数据类型和数据量要求不同,且数据收集过程中易受环境干扰。因此,需从数据源管理、数据清洗、数据标准化处理和数据质量检测等多方面入手,确保每一份数据都具有完整性和准确性。此外,还可以结合ChatGPT等自然语言处理技术,开发智能数据清洗和标准化工具,通过自然语言指令或对话形式指导工具进行高效的数据处理,以提高数据质量和处理效率。

6.2 模型适应性与泛化能力

由于大模型强大的表征能力和高效的性能,使得其在执行诸多复杂任务时取得了较好的效果,但这并不意味着大模型适用于所有场景。在实际应用中,哪些业务场景适合使用大模型,每个业务场景应该选择何种大模型,基座模型是否开源等问题均需要根据实际需求进行有针对性的探讨。从基础研究角度看,基座模型和下一代大模型技术的自主可控是目前中国大模型研究的两大核心任务。由于水产养殖环境复杂多变,大模型还需具有良好的泛化能力,才能在不同环境和不同类型疾病中有效工作。

6.3 计算资源和训练成本

成本和效益的权衡是决定大模型广泛应用的关键因素。伴随着大模型参数和数据的提升,其对算力的要求也不断提高,这对水产养殖企业尤其是中小企业而言,可能是一个不小的负担。另外,对大模型进行微调训练也会产生巨大的开销。可以通过研究如何利用云计算和分布式计算平台,降低模型训练和部署的成本。通过研究大模型压缩和剪枝技术,优化模型结构和参数,提高模型的效率,减少计算资源需求。

6.4 隐私与安全

随着人工智能大模型技术的不断应用,其在安全领域的潜力逐渐显现。收集和使用涉及生物和环境信息的大数据,需要考虑数据隐私和安全问题。随着大模型技术的发展,如何保证数据安全,防止数据泄露和滥用,是实际应用中需要重点关注的问题。在数据收集和使用过程中,可以采取数据加密、隐私保护和数据安全管理措施,确保数据的安全性和隐私性,同时建立严格的数据访问和使用权限管理机制,加强法律法规的监管和规范,确保数据安全。

6.5 模型解释性与用户接受度

尽管大模型可能在水产病害诊断和防治中表现出色,但其“黑箱”特性使得非专业人士难以理解其决策过程。因此,提高大模型的解释性对于增加养殖者和消费者的信任至关重要。可以利用模型解释技术,如可视化、因果推理等方法,开发可视化工具,提高模型的解释性和可理解性。此外,可通过加强用户教育和培训,增强他们对新技术的接受度和依赖性,以提高他们对大模型的信任。

6.6 多任务学习和优先级管理

在现实应用中,大模型可能需要同时处理多个任务,如疾病监测、环境评估和行为分析。如何有效管理这些任务并确定它们的优先级,以及如何训练模型以优化多任务学习,是实现高效应用的关键挑战。可以设计合适的多任务学习框架,优化模型性能;通过任务优先级和资源分配策略,确保关键任务得到优先处理,实现多任务间的有效管理和协同学习,提高模型的整体性能。

6.7 跨区域数据共享与合作

由于疾病暴发可能具有地域性,而有效的防治策略需要各地数据的整合分析。因此,建立一个高效的跨区域数据共享机制,并促进不同机构间的合作,是实现全面防控的重要因素。通过建立跨区域数据共享和合作机制,可促进各地数据的整合和共享,同时加强跨机构间的合作,制定统一的数据共享标准和协议,以实现疾病防控的全面性和协同性。

6.8 知识图谱增强大模型的集成与利用

知识图谱作为结构化知识表示的有效方式,能够提供丰富的先验知识和关系,对大模型的性能提升至关重要。然而,构建与各类数据源相连通的知识图谱,并将其与大模型有效集成是一大挑战。这涉及到图谱的准确性、及时性,以及如何将图谱信息融入到模型的学习过程中。可以利用知识图谱中的结构化知识和关系,研究如何将知识图谱信息有效融入到大模型的学习过程中,优化模型的学习和推理过程,提高模型的性能和效果。

目前,随着技术瓶颈的逐步突破和自主创新能力的持续增强,大模型在水产养殖病害防治领域的应用研究将引领新一轮的行业技术变革和产业升级。以ChatGPT等人工智能模型在其他领域的应用发展来看,其在水产养殖病害防治领域必将具有强大的应用潜力。未来,大模型将更加注重实时性和动态性,并能实时监测和预测病害的发生趋势,为病害防治提供更为精准和有效的指导。同时,大模型将与其他先进技术如物联网、人工智能等深度融合,形成更为完善的水产病害防治体系。此外,随着跨学科研究的不断深入,大模型在水产病害防治领域的应用将不断拓展到新的领域或方面,为水产养殖业的可持续发展提供更加全面的支持。

参考文献:

[1] ADAMS A,THOMPSON K D.Development of diagnostics for aquaculture:challenges and opportunities[J].Aquaculture Research,2011,42:93-102.

[2] 张红燕,袁永明,贺艳辉,等.水产养殖专家系统的设计与实现[J].中国农学通报,2011,27(1):436-440.ZHANG H Y,YUAN Y M,HE Y H,et al.Design and implementation of expert system for aquaculture[J].Chinese Agricultural Science Bulletin,2011,27(1):436-440.(in Chinese)

[3] 熊中敏,马海宇,李帅,等.知识图谱在海洋领域的应用及前景分析综述[J].计算机工程与应用,2022,58(3):15-33.XIONG Z M,MA H Y,LI S,et al.Summary of application and prospect analysis of knowledge graphs in marine field[J].Computer Engineering and Applications,2022,58(3):15-33.(in Chinese)

[4] 刘巨升,杨惠宁,孙哲涛,等.面向知识图谱构建的水产动物疾病诊治命名实体识别[J].农业工程学报,2022,38(7):210-217.LIU J S,YANG H N,SUN Z T,et al.Named-entity recognition for the diagnosis and treatment of aquatic animal diseases using knowledge graph construction[J].Transactions of the Chinese Society of Agricultural Engineering,2022,38(7):210-217.(in Chinese)

[5] 沙明洋,张思佳,傅庆财,等.基于动态权重的多模型集成水产动物疾病防治事件抽取方法[J].华中农业大学学报,2023,42(3):80-87.SHA M Y,ZHANG S J,FU Q C,et al.Multi-model integrated event extraction for aquatic animal disease prevention and control based on dynamic weight[J].Journal of Huazhong Agricultural University,2023,42(3):80-87.(in Chinese)

[6] FU Q C,ZHANG S J,ZHANG Z L,et al.FOE-NER:fish disease event extraction algorithm based on pseudo trigger words and event element data enhancement[J/OL].Aquaculture International,2024.https://link.springer.com/article/10.1007/s10499-023-01367-2.

[7] CONG Z H,ZHANG S J,WU J.Aspect-based sentiment analysis for fish diseases using a feature interaction model based on adversarial strategy[J].Aquaculture International,2024.https://link.springer.com/article/10.1007/s10499-024-01528-x.

[8] 孙柏林.大模型评述[J].计算机仿真,2024,41(1):1-7,24.SUN B L.Review of large models[J].Computer Simulation,2024,41(1):1-7,24.(in Chinese)

[9] 丁博,耿喆,朱江峰.基于GLM模型的印度洋延绳钓渔业大青鲨钩捕死亡率分析[J].上海海洋大学学报,2022,31(3):700-709.DING B,GENG Z,ZHU J F.Evaluating at-haulback mortality of blue shark (Prionace glauca) in the Indian Ocean longline fishery based on GLM model[J].Journal of Shanghai Ocean University,2022,31(3):700-709.(in Chinese)

[10] 李秀超,林琴琴,陈作志,等.基于LeMaRns模型评估印度洋金枪鱼渔业对大洋生态系统的影响[J].上海海洋大学学报,2023,32(1):203-216.LI X C,LIN Q Q,CHEN Z Z,et al.Impact of Indian Ocean tuna fisheries on pelagic ecosystem based on LeMaRns model[J].Journal of Shanghai Ocean University,2023,32(1):203-216.(in Chinese)

[11] RASMY L,XIANG Y,XIE Z Q,et al.Med-BERT:pretrained contextualized embeddings on large-scale structured electronic health records for disease prediction[J].NPJ Digital Medicine,2021,4(1):86.

[12] YANG F,WANG W C,WANG F,et al.scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq data[J].Nature Machine Intelligence,2022,4:852-866.

[13] 喻国明,金丽萍,卞中明.小有小的用处:大模型传播生态下的小模型:概念定义、技术构造与价值角色[J].新闻记者,2024(1):3-17,58.YU G M,JIN L P,BIAN Z M.Small has small use:small model under the ecology of large model communication-concept definition,technical structure and value role[J].Shanghai Journalism Review,2024(1):3-17,58.(in Chinese)

[14] 车万翔,窦志成,冯岩松,等.大模型时代的自然语言处理:挑战、机遇与发展[J].中国科学:信息科学,2023,53(9):1645-1687.CHE W X,DOU Z C,FENG Y S,et al.Towards a comprehensive understanding of the impact of large language models on natural language processing:challenges,opportunities and future directions[J].Scientia Sinica (Informationis),2023,53(9):1645-1687.(in Chinese)

[15] 许志伟,李海龙,李博,等.AIGC大模型测评综述:使能技术,安全隐患和应对[J/OL].计算机科学与探索,2024:1-34.(2024-05-27).https://kns.cnki.net/kcms/detail/11.5602.tp.20240523.1947.002.html.XU Z W,LI H L,LI B,et al.A survey of AIGC model evaluation:enabling technologies,vulnerabilities and mitigation[J/OL].Journal of Frontiers of Computer Science and Technology,2024:1-34.(2024-05-27).https://kns.cnki.net/kcms/detail/11.5602.tp.20240523.1947.002.html.(in Chinese)

[16] 张乾君.AI大模型发展综述[J].通信技术,2023,56(3):255-262.ZHANG Q J.Survey on the development of AI large model[J].Communications Technology,2023,56(3):255-262.(in Chinese)

[17] 蔡睿,葛军,孙哲,等.AI预训练大模型发展综述[J/OL].小型微型计算机系统,2024:1-12.(2024-05-11).https://kns.cnki.net/kcms/detail/21.1106.tp.20240510.1900.010.html.CAI R,GE J,SUN Z,et al.Overview of the development of AI pre-trained large models[J/OL].Journal of Chinese Computer Systems,2024:1-12.(2024-05-11).https://kns.cnki.net/kcms/detail/21.1106.tp.20240510.1900.010.html.(in Chinese)

[18] BUBECK S,CHANDRASEKARAN V,ELDAN R,et al.Sparks of artificial general intelligence:early experiments with GPT-4[EB/OL].2023:2303.12712.http://arxiv.org/abs/2303.12712v5.

[19] YE J J,CHEN X T,XU N,et al.A comprehensive capability analysis of GPT-3 and GPT-3.5 series models[EB/OL].2023:2303.10420.http://arxiv.org/abs/2303.10420v2.

[20] RADFORD A,WU J,CHILD R,et al.Language models are unsupervised multitask learnerss[J].OpenAI Blog,2019,1(8):9.

[21] TEAM G,ANIL R,BORGEAUD S,et al.Gemini:a family of highly capable multimodal models[EB/OL].2023:2312.11805.http://arxiv.org/abs/2312.11805v3.

[22] ANTHROPIC A I.The claude 3 model family:opus,sonnet,haiku[J/OL].Claude-3 Model Card,2024.https://api.semanticscholar.org/CorpusID:268232499.

[23] TOUVRON H,LAVRIL T,IZACARD G,et al.LLaMA:open and efficient foundation language models[EB/OL].2023:2302.13971.http://arxiv.org/abs/2302.13971v1.

[24] DEVLIN J,CHANG M W,LEE K,et al.BERT:pre-training of deep bidirectional transformers for language understanding[EB/OL].2018:1810.04805.http://arxiv.org/abs/1810.04805v2.

[25] RADFORD A,KIM J W,HALLACY C,et al.Learning transferable visual models from natural language supervision[EB/OL].2021:2103.00020.http://arxiv.org/abs/2103.00020v1.

[26] DOSOVITSKIY A,BEYER L,KOLESNIKOV A,et al.An image is worth 16×16 words:transformers for image recognition at scale[EB/OL].2020:2010.11929.https://arxiv.org/abs/2010.11929.

[27] BI K,XIE L,ZHANG H,et al.Accurate medium-range global weather forecasting with 3D neural networks[J].Nature,2023,619:533-538.

[28] WANG Y,HU M,TA N,et al.Large language models and their application in government affairs[J].Journal of Tsinghua University (Science and Technology),2024,64(4):649-658.

[29] SUN Y,WANG S H,FENG S K,et al.Ernie 3.0:large-scale knowledge enhanced pre-training for language understanding and generation[EB/OL].2021:2107.02137.http://arxiv.org/abs/2107.02137v1.

[30] BAI J Z,BAI S,CHU Y F,et al.Qwen technical report[EB/OL].2023:2309.16609.http://arxiv.org/abs/2309.16609v1.

[31] 董添.科大讯飞星火认知大模型V3.5发布[N].中国证券报,2024-01-31(A06).DOI:10.28162/n.cnki.nczjb.2024.000503.DONG T.IFLYTEK spark cognitive large model V3.5 launched[N].China Securities Journal,2024-01-31(A06).DOI:10.28162/n.cnki.nczjb.2024.000503.(in Chinese)

[32] DU Z X,QIAN Y J,LIU X,et al.GLM:general language model pretraining with autoregressive blank infilling[EB/OL].2021:2103.10360.http://arxiv.org/abs/2103.10360v2.

[33] 王耀祖,李擎,戴张杰,等.大语言模型研究现状与趋势[J/OL].工程科学学报,2024:1-14.(2024-05-13).https://doi.org/10.13374/j.issn2095-9389.2023.10.09.003.WANG Y Z,LI Q,DAI Z J,er al.Current status and trends in large language modeling research[J/OL].Chinese Journal of Engineering,2024:1-14.(2024-05-13).https://doi.org/10.13374/j.issn2095-9389.2023.10.09.003.(in Chinese)

[34] 袁静娴.腾讯混元大模型正式亮相[N].深圳商报,2023-09-08(A03).DOI:10.28774/n.cnki.nszsb.YUAN J X.Tencent HunYuan big model officially unveiled[N].Shenzhen Business Daily,2023-09-08(A03).DOI:10.28774/n.cnki.nszsb.(in Chinese)

[35] 潘婷.腾讯云副总裁胡利明:大模型在金融领域,正分场景落地[N].每日经济新闻,2023-09-12(005).DOI:10.28571/n.cnki.nmrjj.2023.003281.PAN T.Hu Liming,vice president of Tencent Cloud:the big model in the financial field is landing in different scenes[N].National Business Daily,2023-09-12(005).DOI:10.28571/n.cnki.nmrjj.2023.003281.(in Chinese)

[36] WANG H C,LIU C,XI N W,et al.HuaTuo:tuning LLaMA model with Chinese medical knowledge[EB/OL].2023:2304.06975.http://arxiv.org/abs/2304.06975v1.

[37] CUI J,LI Z,YAN Y,et al.Chatlaw:open-source legal large language model with integrated external knowledge bases[J].2023:2306.16092.https://ar5iv.labs.arxiv.org/html/2306.16092.

[38] CHEN W,WANG Q S,LONG Z F,et al.DISC-FinLLM:a Chinese financial large language model based on multiple experts fine-tuning[EB/OL].2023:2310.15205.http://arxiv.org/abs/2310.15205v2.

[39] ZHAO S Y,ZHANG J H,WU Y S,et al.LangCell:language-cell pre-training for cell identity understanding[EB/OL].2024:2405.06708.http://arxiv.org/abs/2405.06708v4.

[40] KRALJEVIC Z,SHEK A,BEAN D,et al.MedGPT:medical concept prediction from clinical narratives[EB/OL].2021:2107.03134.http://arxiv.org/abs/2107.03134v1.

[41] LI Y N,MA S R,WANG X B,et al.EcomGPT:instruction-tuning large language models with chain-of-task tasks for E-commerce[J].Proceedings of the AAAI Conference on Artificial Intelligence,2024,38(17):18582-18590.

[42] HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA:IEEE,2016:770-778.

[43] WANG Z G,ZHONG W J,WANG Y F,et al.Data management for large language models:a survey[EB/OL].2023:2312.01700.http://arxiv.org/abs/2312.01700v2.

[44] WHITE J,FU Q,HAYS S,et al.A prompt pattern catalog to enhance prompt engineering with chatgpt[EB/OL].2023:2302.11382.https://arxiv.org/abs/2302.11382.

[45] 官璐,何康,斗维红.微调大模型:个性化人机信息交互模式分析[J].新闻界,2023(11):44-51,76.GUAN L,HE K,DOU W H.Fine-tuning large language models:the analysis of personalized human computer information interaction patterns[J].Journalism and Mass Communication,2023(11):44-51,76.(in Chinese)

[46] LILLICRAP T P,HUNT J J,PRITZEL A,et al.Continuous control with deep reinforcement learning[EB/OL].2015:1509.02971.http://arxiv.org/abs/1509.02971v6.

[47] 郑纬民,翟季冬,翟明书.智能算力核心基础系统软件的现状与展望[J/OL].中兴通讯技术,2024:1-22.(2024-04-09).http://kns.cnki.net/kcms/detail/34.1228.TN.20240408.1037.005.html.ZHENG W M,ZHAI J D,ZHAI M S.Status and prospect of intelligent computing core basic system software[J/OL].ZTE Technology Journal,2024:1-22.(2024-04-09).https://kns.cnki.net/kcms/detail/34.1228.TN.20240408.1037.005.html.(in Chinese)

[48] 基于网内计算的加速AI大模型分布式训练方法及装置:CN202311119840.5[P].CN117371516A.Distributed training method and device for accelerated AI large model based on in-network computing:CN202311119840.5[P].CN117371516A.(in Chinese)

[49] ASHKBOOS S,CROCI M L,DO NASCIMENTO M G,et al.SliceGPT:compress large language models by deleting rows and columns[C]//Proceedings of the International Conference on Learning Representations (ICLR) 2024.Vienna Austria:Messe Wien Exhibition and Congress Center,2024.https://arxiv.org/pdf/2401.15024.pdf.

[50] 刘学博,张民,龚声蓉.大模型智能与安全研究综述[J].常熟理工学院学报,2024,38(2):1-6,11.LIU X B,ZHANG M,GONG S R.A comprehensive review of large language models and security intelligence analysis[J].Journal of Changshu Institute of Technology,2024,38(2):1-6,11.(in Chinese)

[51] 陈润生.医疗大数据结合大语言模型的应用展望[J].四川大学学报(医学版),2023,54(5):855-856.CHEN R S.Prospects for the application of healthcare big data combined with large language models[J].Journal of Sichuan University (Medical Sciences Edition),2023,54(5):855-856.(in Chinese)

[52] 孙兴,蔡肖红,李明,等.视觉大模型SAM在医学图像分割中的应用综述[J/OL].计算机工程与应用,2024:1-19.(2024-05-20).http://kns.cnki.net/kcms/detail/11.2127.TP.20240517.2034.004.html.SUN X,CAI X H,LI M,et al.Review of application of visual foundation model SAM in medical image segmentation[J/OL].Computer Engineering and Applications,2024:1-19.(2024-05-20).https://kns.cnki.net/kcms/detail/11.2127.TP.20240517.2034.004.html.(in Chinese)

[53] 宋林生.海水养殖贝类病害预警预报技术及其应用[J].大连海洋大学学报,2020,35(1):1-9.SONG L S.An early warning system for diseases during mollusc mariculture:exploration and utilization[J].Journal of Dalian Ocean University,2020,35(1):1-9.(in Chinese)

[54] HAN P,LU Q,FAN L,et al.A review on the use of microalgae for sustainable aquaculture[J].Applied Sciences,2019,9(11):2377.

[55] 何佳,黄志涛,宋协法,等.基于计算机视觉技术的水产养殖中鱼类行为识别与量化研究进展[J].渔业现代化,2019,46(3):7-14.HE J,HUANG Z T,SONG X F,et al.Research progress on recognition and quantification of fish behavior in aquaculture based on computer vision technology[J].Fishery Modernization,2019,46(3):7-14.(in Chinese)

[56] 张丰硕,李豫,李向前,等.一种消减多模态偏见的鲁棒视觉问答方法[J].北京大学学报(自然科学版),2024,60(1):23-33.ZHANG F S,LI Y,LI X Q,et al.Reducing multi-model biases for robust visual question answering[J].Acta Scientiarum Naturalium Universitatis Pekinensis(Nature Science Edition),2024,60(1):23-33.(in Chinese)

[57] 王智强.人工智能大模型在智慧农业领域的应用[J].农业工程技术,2024,44(8):17-18.WANG Z Q.The application of artificial intelligence big models in the field of smart agriculture[J].Agricultural Engineering Technology,2024,44(8):17-18.(in Chinese)

[58] 徐民俊,徐泽蕙,李长忠.虹鳟常见重要病害及“四级八标”系统化诊断方法[J].水生生物学报,2024,48(4):707-712.XU M J,XU Z H,LI C Z.Common economical diseases of rainbow trout and the systematic diagnosis method named “four levels and eight indicators”[J].Acta Hydrobiologica Sinica,2024,48(4):707-712.(in Chinese)

[59] 李道亮,刘畅.人工智能在水产养殖中研究应用分析与未来展望[J].智慧农业(中英文),2020,2(3):1-20.LI D L,LIU C.Recent advances and future outlook for artificial intelligence in aquaculture[J].Smart Agriculture,2020,2(3):1-20.(in Chinese)

[60] PÉREZ-SNCHEZ T,MORA-SNCHEZ B,BALCZAR J L.Biological approaches for disease control in aquaculture:advantages,limitations and challenges[J].Trends in Microbiology,2018,26(11):896-903.

[61] VIDZA M S,BUDKA M,CHAI W K,et al.Expanding the katz index for link prediction:a case study on a live fish movement network[EB/OL].2024:2404.12871.https://arxiv.org/abs/2404.12871.

[62] 孙龙清,王泊宁,王嘉煜,等.基于G-RepVGG和鱼类运动行为的水质监测方法[J].农业机械学报,2022,53(sup 2):210-218.SUN L Q,WANG B N,WANG J Y,et al.Water quality monitoring method based on G-RepVGG and fish movement behavior[J].Transactions of the Chinese Society for Agricultural Machinery,2022,53(sup 2):210-218.(in Chinese)

[63] 海涛,陈娟,韦文,等.物联网技术在养殖塘水质监控系统中的应用[J].河南科技大学学报(自然科学版),2021,42(2):53-58.HAI T,CHEN J,WEI W,et al.Application of internet of things technology to water quality monitoring system of aquaculture pond[J].Journal of Henan University of Science and Technology (Natural Science Edition),2021,42(2):53-58.(in Chinese)

[64] 洪永强,谢永和,刘鲁强,等.基于ESSA-LSTM的养殖工船水质溶解氧预测方法研究[J].南方水产科学,2024,20(1):62-73.HONG Y Q,XIE Y H,LIU L Q,et al.Research on water quality dissolved oxygen prediction method based on ESSA-LSTM for aquaculture ships[J].South China Fisheries Science,2024,20(1):62-73.(in Chinese)

[65] 许德昊,王魏,胡显辉,等.基于特征构造的MDconv-GRU刺参养殖水质pH值预测[J/OL].控制工程,2024:1-10.(2024-06-06).https://doi.org/10.14107/j.cnki.kzgc.20230171.XU D H,WANG W,HU X H,et al.Prediction of pH value of water quality in culture of Stichopus japonicus by MDconv-GRU based on characteristic structure[J/OL].Control Engineering,2024:1-10.(2024-06-06).https://doi.org/10.14107/j.cnki.kzgc.20230171.(in Chinese)

[66] 刘明剑,刘丽丽,朱宏升,张思佳.海水养殖水质监测与分析系统设计与实现[J].水产学杂志,2023,36(4):99-108.LIU M J,LIU L L,ZHU H S,et al.Design and implementation of a water quality monitoring and analysis system for mariculture environment[J].Chinese Journal of Fisheries,2023,36(4):99-108.(in Chinese)

[67] 胡洋,张旭,王欢,等.药用植物资源在水产动物疾病控制中的研究进展[J].中国生物工程杂志,2022,42(11):43-58.HU Y,ZHANG X,WANG H,et al.Research progress of medicinal plant resources in aquatic animal diseases control[J].China Biotechnology,2022,42(11):43-58.(in Chinese)

[68] 吕可,赵前程,刘婧懿,等.噬菌体在水生动物病害防治中的应用问题和解决策略[J].水产科学,2020,39(6):964-971.LÜ K,ZHAO Q C,LIU J Y,et al.Application of bacteriophage in aquaculture:focusing on problems and solutions[J].Fisheries Science,2020,39(6):964-971.(in Chinese)

[69] 陈如荔,张瑾,周娜娜,等.抗生素与消毒剂对青海弧菌Q67的联合毒性评估[J].环境科学与技术,2022,45(10):1-10.CHEN R L,ZHANG J,ZHOU N N,et al.Evaluation on the combined toxicity interaction between antibiotics and disinfectant towards Vibrio qinghaiensis sp.-Q67[J].Environmental Science &Technology,2022,45(10):1-10.(in Chinese)

[70] 程郁,叶兴庆,宁夏,等.中国实现种业科技自立自强面临的主要“卡点”与政策思路[J].中国农村经济,2022(8):35-51.CHENG Y,YE X Q,NING X,et al.The main “stumbling blocks”and policy suggestions for China’s seed industry to achieve self-reliance and self-improvement in science and technology[J].Chinese Rural Economy,2022(8):35-51.(in Chinese)

[71] STEYAERT S,PIZURICA M,NAGARAJ D,et al.Multimodal data fusion for cancer biomarker discovery with deep learning[J].Nature Machine Intelligence,2023,5:351-362.

[72] 魏科,周平.基于改进YOLOv5s的三七病害识别[J/OL].云南民族大学学报(自然科学版),2024:1-7.(2024-04-08).http://kns.cnki.net/kcms/detail/53.1192.N.20240407.1121.002.html.WEI K,ZHOU P.Panax notoginseng disease identification based on improved YOLOv5s[J/OL].Journal of Yunnan Minzu University (Natural Sciences Edition),2024:1-7.(2024-04-08).https://kns.cnki.net/kcms/detail/53.1192.N.20240407.1121.002.html.(in Chinese)

Innovative applications and prospects of large models in disease prevention and control for aquaculture:a review

ZHANG Sijia1,2,3,YU Hong1,2,3*

(1.Liaoning Provincial Key Laboratory of Marine Information Technology,College of Information Engineering,Dalian Ocean University,Dalian 116023,China;2.Key Laboratory of Environment Controlled Aquaculture (Dalian Ocean University),Ministry of Education,Dalian 116023,China;3.Dalian Key Laboratory of Smart Fisheries,Dalian 116023,China)

AbstractLarge models, characterized by their extensive parameters and complex structures, are foundational to machine learning and are increasingly becoming a significant direction for future technological development.This paper elucidates the core technologies employed in large models and discusses the basic conditions necessary for their operation.It also explores the utilization of large models in assisting with disease prevention and control in aquaculture, including disease prevention and management, collaborative monitoring of aquaculture environments, aquatic drug research and development, and the application of genomics techniques in breeding disease resistance in aquatic species.Future prospects encompass data acquisition, processing, model adaptability, generalization, computational needs, training costs, privacy &security, model interpretability, multi-task learning, priority management, cross-regional data sharing, and knowledge graph-enhanced large model integration.The aim is to provide robust support for further applications of large models in the field of disease prevention and control in aquaculture, thereby promoting the development of the aquaculture industry towards greater efficiency and sustainability.

Key wordslarge model; aquaculture; disease prevention and control; intelligence; deep learning

中图分类号S 943

文献标志码:A

DOI:10.16535/j.cnki.dlhyxb.2024-120

文章编号:2095-1388(2024)03-0369-14

收稿日期2024-05-29

基金项目辽宁省重点研发计划项目(2023JH26/10200015);辽宁省教育厅高等学校基本科研项目面上项目(LJKMZ20221095)

作者简介张思佳(1982—),女,博士,副教授。E-mail:zhangsijia@dlou.edu.cn

通信作者于红(1968—),女,博士,教授。E-mail:yuhong@dlou.edu.cn