自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1613)
  • 资源 (11)
  • 收藏
  • 关注

原创 干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式获取论文:关注并回复“水稻”计算机视觉研究院专栏Column of Computer Vision Institute小农户在全球粮食供应中发挥着重要作用。随着智能手机越来越普及,它们使小农能够以非常低的低成本收集图像。PART/1摘要在本研究中,研究者提出了一种有效的深度卷积神经...

2024-01-07 10:30:55 1078

原创 YoloV8与ChatGPT互通,这功能是真的强大!

点击蓝字 关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式参考地址:https://github.com/ultralytics/ultralytics计算机视觉研究院专栏Column of Computer Vision Institute现在的ChatGPT都是输入文字、图片或者语音,那如果将检测网络或者更上层一点的东西,把视觉与ChatG...

2023-07-12 08:26:47 513

原创 算法优化:基于改进的YOLO检测和双边分割网络实时识别

这种紧凑且集成化的设备设置,使得所提出的煤岩识别模型能够直接应用于实际煤岩监测场景,提供智能图像分析支持,助力矿山生产。中可将精度损失降至最低。在四个实际煤岩工作面的实验结果证实了所提模型的有效性,展现出在煤岩图像识别中更好的准确性与效率平衡,为煤矿智能化进一步发展提供支持。优化所取得的成果,如平均帧率大幅提高以及标准差降低,进一步增强了该模型在实际采煤工作面的适用性,并为煤矿智能化的进一步发展提供了支持。次操作,支持开发的煤岩图像语义分割模型直接在设备上运行,实现对采集图像的实时处理和分析。

2025-06-05 17:02:55 278

原创 基于改进的YOLO检测和双边分割网络的煤岩界面实时识别

但需要注意的是,随着图像噪声水平的上升,识别率会显著下降。张指出,不同类型的煤和岩石具有不同的纹理特征,因此在识别煤岩图像时考虑了它们的灰度和纹理特征。然而,只有当煤和岩石的颜色存在明显的灰度差异时,煤岩界面识别方法的准确率才会显著提高。第一步,通过筛选现场采集的图像来建立数据集。煤岩图像增强技术的评估标准对于衡量此类方法的有效性至关重要,这些标准用于量化增强煤岩图像视觉特征的质量和效果。在本研究中,通过整合三项性能指标(包括熵值、总边缘强度和图像边缘数量)的客观评估标准,对增强后的图像质量进行量化。

2025-06-03 17:31:29 569

原创 YOLO-YSTs:一种基于改进YOLOv10n的实时农田害虫检测方法

通过即插即用的方式,将不同的操作集成到一个统一的框架中,为模型提供了更大的灵活性。为了让模型在训练过程中能更好地学习害虫特征,训练集和验证集都包含了来自所收集数据集和公开数据集的图像,而测试集则单独保留,用于评估模型在不同数据集上的泛化能力和性能。):这一层会重新排列特征图的元素,将空间信息转换到深度维度,在保留通道维度上所有信息的同时增加特征图的深度,从而避免了传统下采样方法中常见的信息丢失问题。模型的改进,有效提高了黄色粘虫板上害虫的检测精度,并且该模型在边缘移动平台上部署时表现出良好的检测性能。

2025-06-02 12:48:03 850

原创 YOLO-ESFM:一种用于海面目标检测的多尺度YOLO算法

与红外和雷达图像相比,用于海上目标和船舶识别的可见光图像拥有丰富色彩和纹理信息,获取成本较低且分辨率高,更适用于海上目标检测(李等人,2024)。未来,我们计划进一步优化算法,同时扩充和完善数据集,覆盖更广泛的海事场景、船只类别、海面目标尺度,以及更多样化的海洋目标类别。基于ESFM模块,构建了一种新的骨干和头部网络,即YOLO-ESFM网络。ESFM受Res2Net(高等人,2021)和ELAN(王等人,2022)结构设计理念的启发,我们提出了一种新型高效的尺度融合模块(ESFM),如下图所示。

2025-06-02 12:48:03 401

原创 YOLO-HPSD:一种基于YOLOv10的高精度船舶目标检测模型

为了优化特征融合过程,将迭代注意力特征融合(iAFF)与主干网络中的C2F模块相结合,从而开发出了一种新型的C2F_iAFF模块,该模块利用了多尺度通道注意力机制。在本研究中,通过用C2f_iAFF模块替换C2f模块,改进后的模型进一步强化了多尺度特征的融合能力,在保留原有结构优势的同时提升了检测性能。随着YCLO系列模型的不断发展,YOLOv10算法在前几代的基础上,继承了其出色的检测精度和低计算复杂度,同时对核心模块进行了全面优化,如网络骨干结构、特征提取方法和损失函数。BiFPN模块的结构图如下图。

2025-06-01 17:30:25 557

原创 CSGD-YOLO:一种基于YOLOv8n的玉米种子发芽状态检测模型

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式计算机视觉研究院专栏Column of Computer Vision Institute种子质量检测对保障粮食安全与稳定至关重要。为准确检测玉米种子在纸床发芽试验中的发芽状态,本研究提出一种基于YOLOv8n的玉米种子发芽状态检测模型(CSGD-YOLO)。PART/1 概述 首先,为缓解传统模型存在的复杂性问题,设计了轻量化空间金字塔池化快速结构(L-SPPF)以增强特征表达能力;同

2025-05-30 10:30:46 860

原创 SCDYOLO:一种高效道路裂缝检测的目标检测新方法

由于本研究中使用的数据集的图像背景比例高,噪声显著,加上需要识别狭窄和细长的道路裂缝,因此在算法模型中加入了通道融合可变形卷积注意机制(然后选择小于或等于聚焦宽度的卷积核,并调整它们的分布以进行信息融合,并不要求聚焦长度小于当前特征图的大小。SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人机航拍的船舶图像检测。数据集,并进行了广泛的数据增强,以确保模型在不同道路损坏场景和地理区域的泛化性和鲁棒性。关注机制,提高了特征提取的准确性,促进了特征间的协同融合。

2025-05-29 10:03:44 884

转载 2025多模态好发论文的方向!

本文提供了一个关于多模态推理方法的系统性综述,将这些方法分为两个层次:以语言为中心的多模态推理和协作式多模态推理,分析了这些方法的技术演变,讨论了其固有挑战,并介绍了评估多模态推理性能的关键基准任务和评估指标。该论文提出了一种名为MTV的方法,旨在解决多模态领域中大型多模态模型(LMMs)在多示例上下文学习中的限制问题,通过在LMM的注意力头中压缩多示例上下文为紧凑的隐式表示,从而克服了这一限制。:多模态大模型、多模态预训练、多模态生成、多模态感知、多模态推理、多模态数据高效学习、多模态可解释。

2025-05-28 10:03:57 47

转载 2025深圳无人机展亮点爆棚!芒果智能科技脱颖而出

在某城市试点,单架无人机日均巡查50平方公里,问题发现效率提升 8倍,AI生成工单使处置周期从7天缩至48小时。2025年深圳国际无人机展现场,人头攒动,中外友人纷至沓来,展馆内热闹非凡。该引擎基于轻量化深度学习,支持150+类目标实时识别,端侧运行技术让弱网环境也能毫秒级响应,引得国内外专业人士频频点头称赞。某工地应用后,隐患发现率提升60%,工程管理效率提高30%。试点路段事故处理时间缩短25%,通行效率大幅改善。芒果智能科技以技术驱动创新,未来将继续深耕 AI 视觉,为更多行业带来智能解决方案。

2025-05-27 20:30:21 15

原创 EMR-YOLO:高效海上救援目标识别算法研究

卷积核的感受野被扩大,以捕捉更广泛的上下文信息。同时,为了提升模型的识别性能,颈部部分采用了PANet架构,增强了网络融合不同尺度目标特征的能力,并用于传播特征信息和合并不同层级的特征。展示了训练集的基本信息,分为四个部分:左上角为类别数量,左下角为目标中心点在图像中的位置,右上角为目标框的大小,右下角为目标相对于原始图像的宽高比。模块通过将空间位置信息嵌入到通道信息中,来改进特征表示,使网络能够充分考虑特征图通道与空间位置之间的关系,在融合过程中自适应地调整每个特征的重要性,并忽略无关背景信息的干扰。

2025-05-22 22:01:12 1016

原创 YOLO-SLD:基于注意力机制改进的YOLO车牌检测算法

例如,可以专注于车牌内的文本识别,或者整合其他文本识别网络,以充分利用车牌图像中的相关信息,从而增强车牌识别(的特征提取能力和计算效率之后,能够更好地优化所提取的车牌特征,并且能够在照明条件复杂的情况下自适应地突出车牌的目标特征,抑制不相关的背景特征,同时不会增加模型的复杂度。在车牌检测的早期阶段,主要面临的挑战包括:多样化的车牌布局和语言导致的遮挡问题、不同的尺寸和纵横比、以及在各种光照和天气条件下输入图像的噪声或不清晰问题,如下图。数据集上测试了不同注意力机制的检测模型性能,验证了所提方法的有效性。

2025-05-21 17:31:08 606

转载 目标检测135个前沿算法模型汇总(附源码)!

改论文提出了一种名为MAF-YOLO的新型目标检测框架,旨在通过改进YOLO系列中常用的PAFPN结构来提升多尺度特征融合的效率和适应性,并行化大核卷积和多个小核卷积来扩大感知范围,同时保留小目标信息;该论文提出了一种名为 Mamba-YOLO-World 的新型开放词汇目标检测模型,旨在解决现有 YOLO-World 模型在特征融合机制上的局限性,通过并行引导选择性扫描和串行引导选择性扫描算法,实现了线性复杂度和全局引导感受野的多模态特征融合。是计算机视觉核心方向之一,也是发论文的热门领域。

2025-05-20 19:28:29 30

原创 RFAG-YOLO:一种感受野注意力引导的YOLO网络,用于无人机图像中的小目标检测

第三,航空图像中复杂多样的背景,再加上光照条件和天气影响的变化,会产生大量干扰,这会显著影响检测精度。其次,在高分辨率特征图中,大目标的主导特征响应可能会抑制小目标的较弱响应,特别是由于大目标对相邻区域的空间影响。然而,由于分辨率低、复杂背景干扰以及显著的尺度变化等因素,在无人机图像中检测小目标仍然是一项艰巨的挑战,这些因素共同降低了特征提取的质量,并限制了检测性能。生成的权重随后用于自适应调制相应的特征图,实现尺度感知的特征优化,从而提高模型在不同尺度下准确检测目标的能力。模块的数量减少到两个。

2025-05-19 18:02:14 1090

原创 YOLO-PEL:基于YOLO算法的高效轻量级车辆检测方法

因此,融合多种特征,并结合机器学习或深度学习等更先进的建模技术,能够进一步提高检测的准确性和鲁棒性。这种融合产生了富含语义内容的特征,有助于检测图像中的细微细节,从而提升模型的检测能力。未来的工作将侧重于构建更大规模、更多样化的场景数据集,并结合红外成像等技术,进一步增强模型在复杂环境中的鲁棒性和适应性。因此,需要进行改进,以提高车辆目标的检测速度,同时实现与检测精度的平衡。(选择性特征融合)模块以高层特征作为权重,对嵌入在低层特征中的关键语义信息进行筛选,并进行有策略的特征融合。

2025-05-16 18:36:49 1414

原创 SPDC-YOLO:一种基于改进的YOLOv8的用于无人机航拍图像的高效小目标检测网络

然而,无人机拍摄的图像通常具有多尺度特征、复杂的背景、不均匀的光照以及较低的目标分辨率,这使得无人机图像中的目标检测极具挑战性。然而,无人机拍摄的图像通常具有多尺度特征、复杂的背景、不均匀的光照以及较低的目标分辨率,这使得无人机图像中的目标检测极具挑战性。然而,无人机图像通常是从高空拍摄的,往往具有复杂的背景、显著的光照变化,并且包含小目标,这使得小目标检测。综上所述,随着无人机技术和深度学习的发展,目标检测,尤其是小目标检测,已成为无人机系统中不可或缺的组成部分,并在各个领域的智能应用中展现出巨大潜力。

2025-05-15 20:02:39 1110

转载 ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

在这一新提出的超长视频理解基准上,ViLAMP 在处理包含 10K 帧(约 3 小时)的视频时仍能保持 58.15% 的准确率(原始 QA 数据集准确率 78.9%),超越 VideoChat-Flash 基线模型 12.82%,展现出较强的长视频建模能力。帧内注意力分析:在每一帧的内部,模型的注意力也展现出相似的稀疏性质 ——50% 的 patch(帧划分的最小单位)就承载了 80% 的模型注意力,但这些受关注的 patch 与关键帧中的对应 patch 具有远超随机基线水平的相似度。

2025-05-14 12:30:33 130

转载 首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

近日,腾讯混元与上海 AI Lab、复旦大学、上海创智学院联合提出全新研究工作 UnifiedReward-Think,构建出首个具备长链式推理能力的统一多模态奖励模型,首次让奖励模型在各视觉任务上真正 “学会思考”,实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。实验表明,这一阶段就能激发模型在多个视觉任务中的推理能力。GRPO 阶段:提升幅度最大,模型聚焦于错误推理样本,通过多路径推理探索,逐步收敛至更精确的推理过程,体现出该阶段对 “推理纠错” 的关键作用。

2025-05-14 12:30:33 27

原创 YOLO-MECD:基于YOLOv11的柑橘检测算法(附源代码)

这些观察到的分布特征可归因于多个相互关联的因素,包括但不限于既定的柑橘种植方法、内在生长模式以及数据采集过程中的视角限制,所有这些因素都增加了模型检测参数的复杂性。为了克服这些限制,本研究采用了。值得注意的是,我们的研究表明,减少主干架构中的卷积操作可显著增强对小目标物体的检测能力,并大幅减少模型参数,这比添加小目标检测头更为有效。注意力机制注意力机制是一个至关重要的架构组件,它有助于对特征进行选择性的重点关注,使模型能够优先处理图像中显著的特征,同时弱化不相关的背景信息,从而提升检测性能指标和泛化能力。

2025-05-11 18:02:37 964 4

转载 CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍

大模型的训练往往采用多机多卡的分布式训练,大模型的分布式训练挑战巨大,即使硬件足够,不熟悉分布式训练的人大概率(实验中验证有 64%-87% 的概率)会因为超参数设置(模型怎么切分和排布、数据怎么切分和排布等)不合理而无法成功运行训练过程。很多已有的分布式训练算法的效能较低,甚至可能导致机器和 GPU 卡越多、训练速度越慢的结果。而现有的自动并行方法存在的问题是它们要么只考虑层内或层间两类并行策略中的一类并行策略,要么把两类并行策略做分阶段优化而不是联合优化,求解得到的并行策略的训练效率存在提升空间。

2025-04-30 18:04:14 30

转载 LCGSC-YOLO:一种基于LCNet和GSConv模块且处于YOLO框架下的轻量级叶片病害检测方法

移动设备的普及,加上轻量级模型的高效性,使得病害检测更加容易实现且经济实惠,为农业生产提供了便捷的解决方案。密集场景中包含大量病害,更接近真实农场中的叶片病害情况,为评估检测算法的性能提供了更严格的测试环境。通过在这些不同场景中进行实验,可以全面评估所提出的叶片病害检测方法在实际应用中的适用性,并为农业生产提供更可靠的技术支持。然而,本研究也认识到,褐色区域也可能是由环境因素或人为干预等其他原因造成的,这种简化的假设可能会限制标注的全面性以及模型的泛化能力。此外,输入特征图的通道数量会扩充至原来的两倍。

2025-04-29 18:30:57 48

原创 EGISD-YOLO:用于红外舰船目标检测的边缘引导网络

在目标分割研究方面,文献以边缘信息为引导来锐化目标,边缘信息大多是从上下文语义中整合而来,以获取定位信息,辅助合成的高低层特征信息的融合,从而实现分割。在港口场景中,由于拍摄距离较近,停靠的舰船目标数量较多,且每个目标在整个图像中所占像素较多,这些不同的场景和目标大小给海上舰船目标的检测带来了一定的困难,如下图。展示了这三个类别的精度对比,结果表明,大多数方法在处理这类目标时精度明显较低,这意味着在预测中出现漏检和误检的可能性更大,而我们的方法仍然表现出较高的检测正确率,这从侧面展示了该算法出色的鲁棒性。

2025-04-27 09:59:40 974

原创 LW-DETR:用于实时检测的可替代YOLO的Transformer模型(提供源代码)

的实现方式(参考文献)中,特征图是按行组织的(行优先组织方式),为了在窗口注意力机制中从行优先组织方式转换为窗口优先组织方式,需要进行代价高昂的排列操作来转换特征图。我们认为,我们的方法有可能从其他设计中获益,比如高效的多尺度特征融合、标记稀疏化、知识蒸馏,以及其他的训练技术,例如在。编码器进行改进,从而形成更丰富的特征图,并引入以窗口为主的特征图组织方式,提高交错注意力计算的效率。的做法,采用交错窗口注意力和全局注意力机制,此外还使用了以窗口为主序的特征图组织方式,以降低内存重排的成本。

2025-04-25 18:31:22 1114

转载 ICLR 2025放榜!蚂蚁集团高调布局,顶会论文成人才争夺新战场

因为一篇高质量的论文不仅能体现你的科研实力和创新能力,更能全面展示你的逻辑思维、问题解决和学术表达等综合素养。如果你想更有效率的学到科研的秘诀,那就看看。2)注重论文写作的效率和文章质量,结合他们的科研经验,告诉你最有效的写作方式。4)提供完整的科研思路、创新性的idea,实时交流与规划,缓解你的科研焦虑。当然,我知道很多人发不出论文,不是不想提升自己的科研水准,而是没人指导。可以说,这是目前为止你能获得的最有价值的课程,因为还包含了实操解答!在越顶尖的期刊发表,你的研究成果就能获得越广泛的关注。

2025-04-22 09:31:09 285

原创 SOD-YOLO:一种针对高压输电线路上小目标的高精度检测方法

这些部件属于小目标范畴,在图像中所占面积小,分辨率低,定位要求高,边缘信息稀少,并且存在严重的误检和漏检情况。它引入了一种梯度增益分配的策略性方法,旨在减轻表现最佳的锚框之间的竞争,同时尽量减少低质量样本对梯度的负面影响。通过融合浅层和深层特征,并在浅层特征图之后添加一个检测头,增强了对小目标的敏感度,显著提高了模型的检测精度。模型在精度和检测速度方面的优越性,我们在相同的数据集上将其与其他模型进行了比较,结果见上表。中检测到的目标的边界框更加完整,能够包含整个目标,并且目标的置信度也有了大幅提高。

2025-04-21 09:03:02 1077

原创 MPE-YOLO:增强型航空影像小目标检测方法(附源代码)

随后,这些小图块在通道维度上进行拼接,形成一个新的特征图,通道数量增加但空间分辨率降低,这样在保持较大感受野的同时,显著减轻了计算负担。为了进行更深入的特征提取,我们采用了经典的瓶颈结构,这不仅提炼了特征的层次表示,还显著增强了模型对小目标的敏感度和认知能力,进一步提高了特征的计算效率。这类算法能够精确地定位和识别各种复杂的地面物体,尤其是在处理小目标或密集排列的目标时,受到了广泛的关注和应用。在该模块的末端引入了一个经过优化的压缩层,以进一步提炼特征的本质,并适应后续处理层的需求。

2025-04-20 18:01:30 1268 1

转载 霸榜ICLR25!大模型高效推理成顶会新风向!88种创新思路,速码!

MCoT通过将多步推理过程建模为马尔可夫链,将每个推理步骤视为从一个状态到另一个状态的转换,从而实现高效的推理,展示了在复杂问题解决和自我纠正方面的能力,为未来在更广泛的复杂推理任务中的应用提供了新的方向。Self-REF通过引入置信度标记,使模型能够根据预测的正确性生成相应的置信度标记,从而提取出置信度分数,在路由任务中能够根据置信度将查询有效地路由到更强大的LLMs。该论文提出了一种名为CoCoMix的新型语言模型预训练框架,旨在通过结合离散的下一个词元预测和连续的概念来提高模型的样本效率和推理能力。

2025-04-16 10:31:10 43

原创 YOLO-MS:重新思考实时目标检测中的多尺度表征学习(提供源代码)

此外,以前的实时目标检测器大多在不同的编码器阶段采用相同的卷积(即内核大小相同的卷积),但我们认为这并不是提取多尺度语义信息的最佳选择。我们选择的目标分支是基于分支的感受野和阶段,例如,在第二阶段,左边的分支是目标分支,对应小物体。不过,大内核卷积的有效感受野较大,会对更广泛的区域进行编码,从而增加了将小物体外部的干扰信息包含进来的可能性。尽管我们所使用的构建模块在多尺度能力方面有了很大的提升,但它们并没有充分探索不同内核大小的卷积的作用,尤其是对于大内核卷积,大内核卷积在基于卷积神经网络(

2025-04-15 17:30:42 935

原创 ViT-YOLO:基于Transformer的用于目标检测的YOLO算法

另一方面,无人机拍摄图像中的物体尺寸差异很大,而卷积神经网络单层的特征图表示能力有限,因此有效地表示和处理多尺度特征至关重要。对于具有大规模和复杂场景的无人机拍摄图像,为了提高语义辨别能力并减轻类别混淆,从较大的邻域中收集和关联场景信息有助于学习物体之间的关系。引入了可学习的权重来学习不同输入特征的重要性,而不是简单地求和或拼接,因为简单的求和或拼接可能会导致特征不匹配和性能下降。的内存和计算量,我们认为,遵循上述因素的最简单设置是在主干网络中分辨率最低的特征图上融入自注意力机制,即。

2025-04-14 18:31:19 905

转载 LS-YOLO:一种用于通过遥感图像检测多尺度山体滑坡的新型模型

首先,在现有的公开山体滑坡数据集中,山体滑坡样本有限,类内差异小,背景简单,这使得有效地训练模型具有挑战性。其次,以往利用计算机视觉方法检测山体滑坡的研究没有充分整合山体滑坡的特征,例如山体滑坡规模范围广和形状多样等,导致山体滑坡检测的准确率较低,难以满足实际需求。尤其是中国云南、贵州和四川的山区,经常发生大量的山体滑坡事件。同时,为了进行更准确的分析,我们使用蓝色框和黄色框来表示漏检的山体滑坡和误检的山体滑坡。这些分支由平均池化或空间可分离卷积组成,增加了网络的深度,提高了模型对山体滑坡的检测精度。

2025-04-09 18:01:56 102

转载 让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA

实验显示,在 APPS 和 CodeContests 等权威编程基准上,MoTCoder 的 pass@1 准确率直接刷新记录,甚至超越 SOTA 6%,让大模型在 “疯狂打码” 时更接近「人类智慧」。大模型写代码早就是基操了,但让它写算法竞赛题或企业级系统代码,就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁板一块” 毫无章法,要么是 “一锅乱炖” 难以维护。实验数据显示,相比普通微调模型和基线模型,MoTCoder 生成的代码具有更低的复杂度、更精简的代码量和更合理的注释比例。

2025-04-03 15:30:37 52

原创 MambaYOLO:基于状态空间模型的目标检测简易基线方法

这样的布局不仅全面覆盖了输入图像的所有区域,而且通过系统的方向变换为后续的特征提取提供了丰富的多维信息基础,从而提高了对图像特征进行多维捕捉的效率和全面性。该实验表明,在处理复杂图像任务时,引入卷积对模型性能的提升与门控聚合机制密切相关,前提是这些卷积是在残差连接的背景下应用的。然而,这种提升是有代价的,自注意力机制的二次复杂度增加了模型的计算负担。能够在各种复杂条件下实现精确检测,在检测高度重叠、严重遮挡且背景复杂的物体时表现出很强的能力,并且在检测高度重叠和严重遮挡的物体方面同样展现出了强大的能力。

2025-04-03 15:30:37 957

转载 正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了

后来因为轮子不转,我们又通过对话提示 AI,鹈鹕的脚应该和轮子联动,脚应该放在踏板上。结果,脚确实放在踏板上了,轮子也转了,而且可以调速度。看到这,大家可能已经发现了一个有趣的事情,DeepSite 应用程序和 DeepSeek 模型都是完全开源的,开源界联手简直无敌了。值得一提的是,该应用使用了最新版本的 DeepSeek-V3-0324,直接开箱即用,让你一次性创建应用程序和游戏。就这么一句简单的指令,游戏就生成好了,代码、游戏全部展示在一个界面中,整个时间也就是你喝口水的功夫。

2025-04-01 10:10:28 212

转载 又中了一篇A会!2025AI顶会‘灌水’全靠这个信息差!

A:由大牛导师一对一辅导,不录用退款,报名前需要由导师审核,填写咨询单后,会有大牛导师和你Meeting,不同的分区价格不同,咨询师会根据你的情况给你做详细的介绍,以及如何帮助你达到你的目标。开始正式辅导时 ,会把助教老师和辅导老师拉倒群里,辅导期间为了更好的沟通,我们不限制群里答疑次数,有问题随时可以群里跟老师交流,并且助教老师全程跟踪进度,避免进度延误。只要能把大佬的思路和方法执行到位,就相当于,在用大佬的经验做自己的科研和文章。早半年发出论文,你收获的不仅是顺利毕业的通行证,更是学术履历的黄金跳板。

2025-03-27 10:30:50 85

原创 DCGC-YOLO:用于火灾检测的高效双通道瓶颈结构YOLO检测算法

的卷积层都采用了分组卷积。总的来说,目标检测中的注意力机制通过有选择地关注图像中与目标检测最相关的部分,而不是不加区分地处理整个图像,有助于提高模型的准确性和效率。在目标检测中使用的注意力机制有不同的类型,但最常见的一种是空间注意力机制,它关注图像的特定区域。该结构增大了网络的感受野,增强了特征提取能力,并且采用了一种通道净化机制,将分组卷积分离出的各个通道进行融合,促进了通道维度上的信息交换,实现了更好的信息编码。)的锚框生成算法,在自定义的火灾数据集上调整锚框大小,增强了模型的鲁棒性,提高了检测精度。

2025-03-24 18:10:25 1062

转载 YOLO-BLBE:一种新方法识别不同成熟度蓝莓果实的新型模型

例如,如图c所示,蓝莓果实A和B的识别置信度分别为0.98和0.99,高于图a中蓝莓果实A的识别置信度0.95和蓝莓果实B的识别置信度0.96。如图d所示,蓝莓果实C、D和E的识别置信度分别为0.93、0.89和0.89,高于图b中蓝莓果实C的识别置信度0.89、蓝莓果实D的识别置信度0.81和蓝莓果实E的识别置信度0.83。图中所示的蓝莓果实A到E属于不同的成熟度和遮挡程度,对比结果表明,通过使用自然图像和合成图像进行训练,YOLO-BLBE模型在识别不同成熟度和遮挡程度的蓝莓果实时,性能能够得到提升。

2025-03-23 10:04:07 59

原创 POT-YOLO:基于YOLO V8边缘分割网络的实时道路坑洼检测技术

POT-YOLOv8在早期YOLO版本成功的基础上进行了改进,融入了新的特性和升级,进一步提升了性能和通用性,从而实现了卓越的性能和完美的效率。为了克服SPPF模块的局限性并提升特征提取能力,引入了边缘检测器-空间金字塔池化快速模块(E-SPPF),该模块能够根据每个区域的重要性,以自适应的方式动态调整特征图中的权重。在这些不同的数据集里,包含了各种尺寸和形状的坑洼,还有不同的成像条件,比如噪声、背景特征、光照以及阴影情况,此外还涵盖了路面状况,例如褪色、线性裂缝以及其他路面缺陷。

2025-03-22 22:42:23 973

转载 聚焦推理模型、AI Infra、AI智能体与具身大模型!DeepSeek时代首场生成式AI大会4月举行

最后,将介绍我们的项目影响力以及对行业的启示。在自动驾驶领域,终极任务是planning,这也是一项涉及场景理解、分析、和决策的复杂任务,我们首次尝试将DeepSeek R1的强化学习和推理策略迁移应用于驾驶领域,并做出一系列针对驾驶规划的策略优化,显著提升大模型自动驾驶决策规划的效果,并展现出涌现的多模态规划能力。在开源的基础架构中,高性能全闪分布式文件是训练和推理的数据底座,支撑了AI训练的高吞吐,同时也提供了基于文件存储的上下文KVCache缓存解决方案,以存代算,大幅降低了推理成本,

2025-03-21 20:30:26 204

转载 为何说 “在国内做科研,最忌讳踏实”?

主要是多看领域内顶刊文章,模仿别人文献的框架和写作思路,找几篇文献一段一段的模仿写作各个部分!选题分析-->实验设计及验证-->创新点设计-->成稿润色-->选刊投稿-->录用发表!通过管家式的服务,让学员只专注于论文本身,最大程度上提升论文的专注度和确定性。也就这次的指导,你现在的困境,就被导师的一个思路解决,少走几个月弯路!确保你能掌握他们的经验与方法,并用在自己的项目中,直至成功发表。,为晋升加薪,评奖评优,就业竞争等加分的职场人士,科研人。导师自身的实力只是一部分,但更重要的是导师的教学能力。

2025-03-19 16:58:59 45

中文语音识别模型数据集

中文语音识别模型数据集

2023-02-27

faster-rnn目标检测

一步到位的目标检测教程,很容易上手,而且容易学会目标检测。

2018-01-10

简单明了的贝叶斯网络介绍

简单明了的贝叶斯网络介绍,如果你是想认真学习,有贝叶斯基础的,都可以阅读。书中从简单的概率论到各种实际应用,都是不错的讲解,有兴趣的可以下载阅读。

2019-02-26

深度学习数据集标注

主要用于图像中目标检测,快速标注出目标的具体位置吗,方便使用者训练测试,减轻了人工标注的精力!

2016-11-12

深度学习工具(Caffe)

最新版本的Caffe,也是何凯明老师最近更新,希望对这领域的你有帮助,谢谢!

2016-10-26

深度学习——keras

深度学习初学代码,基于Python语言在Mnist数据库实验的代码。

2016-02-17

vatic安装文件

视频标注工具,特别好用的工具,你值得拥有,如果你是做视频类的领域,可以试试该工具。

2018-12-25

Face++技术

非常先进的人脸检测技术,在各种流行的数据集中都有最好的结果。

2018-01-09

深度学习代码

专门提供给初学者使用的代码,代码都有注解,方便使用者快速使用并学习怎么操作,如有错误请指正,谢谢!

2016-10-25

Caffe可视化

为了更好的学习深度学习,抓们做一个可视化程序,方便看清楚吗,,每一层到底学习了什么,方便后期的学习与调参!

2016-11-12

深度学习合集

紧密相关的书籍,对您肯定有帮助。神经网络,深度学习,概率论,统计,机器学习该有的都有,适合初学者入门学习。如果想了解更多,请关注微信公众号:计算机视觉战队,里面有更多的资料和干货,谢谢!

2017-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除
OSZAR »