《基于动态模态分解的长江口海表温度时空分布特征重构研究》 被“学习强国”总平台推荐,阅读量近2万
热点推荐|《浙江省水域系统时空变化特征及驱动力分析》
热点推荐|《基于复合神经网络的多元水质指标预测模型》
模拟流体和弹性管道之间的交互是物理仿真领域的重要研究方向。基于位置动力学方法进行了模拟,得到了高可控性和实时性结果。采用混合模型,其中,粒子模型用于流体建模,灵活模拟流动的流体;三角形网格模型用于管道建模,建立管道的弹性约束。全面考虑流体在管道内的碰撞情况,确保无穿透,实现流体与管道的紧密交互仿真。引入弹性管道约束,赋予管道一定的弹性特性,并利用GPU进行并行计算提升仿真速度。实验结果表明,所提算法适用于基于粒子的流体与基于三角形网格的管道的仿真,为弹性管道的流体仿真提供了有效的解决方案。
近年来,基于调色板的图像重着色技术在图形设计、照片编辑和广告制作等领域广受关注并得到应用,还出现了一系列优化调色板提取和图像重着色效果的方法。但由于现有技术的编辑局部性,用户在调整局部区域时常常导致图像整体色调发生不可预知的变化。为此,提出了一种新颖的基于移动最小二乘的图像重着色算法,显著提升了颜色编辑的局部性和精准度。首先,采用改进的K-means聚类算法提取输入图像的调色板。然后,将图像及其调色板映射至RGB颜色空间,并将其视作三维点云和控制点。最后,将基于调色板的图像重着色任务转化为经典的点云变形问题。通过编辑调色板颜色精确控制图像的颜色变化,并借助移动最小二乘算法优秀的局部性实现局部控制。算法允许用户通过简单编辑,实时生成自然的、满足用户编辑意图的重着色结果。实验和用户调研结果表明,相较于已有算法,本文算法能得到更加自然、更符合用户预期的图像重着色效果。
对满足测地三边形约束的3条首尾相连的五次Bézier曲线,提出了插值以该三边形曲线为曲面边界测地线的Bernstein-Bézier参数曲面(简称B-B曲面)优化设计算法。首先由边界测地线插值条件确定曲面边界线及邻接边界线的2排控制顶点;然后给出极小化曲面Bending能量泛函和Dirichlet能量泛函优化确定曲面内部剩余的控制顶点;通过分步优化方法确定曲面控制顶点实现算法。所构造的B-B曲面全次数为8,具有能量极小最优特性。实验结果表明,算法是可行和有效的。
晕动症是制约虚拟现实技术发展的重要因素之一。目前,针对虚拟现实晕动症的研究方法大多相对单一,且很少考虑虚实运动状态一致性对晕动症的影响。为探索虚拟现实体验过程中虚实运动一致与不一致情况下不同晕动症缓解方案的效果,在虚拟现实场景中设计了视觉范围限制、边缘模糊和视觉简化3种晕动症缓解方案。通过收集30名被试的主观评价数据和客观生理数据,评估了不同缓解方案在不同运动状态下的缓解效果。结果表明,在虚实运动一致和不一致情况下,不同缓解方案对虚拟现实晕动症缓解效果存在显著差异,这为缓解虚拟现实技术中的晕动问题提供了解决思路。
进行表面缺陷检测是确保产品性能、质量、美观度以及生产效率的重要手段。尽管人工智能在视觉检测领域取得了飞速发展,但基于生物视觉认知指导机器视觉学习的方法,仍是研究难点。提出了一种基于人类视觉认知机制的表面缺陷检测网络(HVCM-Net)。在宏观层面,模拟视网膜上中央凹和中央凹外区域的工作原理,提出了中央视觉分支和外周视觉分支并行的骨干网络,分别负责学习缺陷图像的高空间频率局部细节信息和低空间频率全局语义信息。在微观层面,动态权重融合模块(DWFM)以自适应的方式融合两个分支的输出特征图,可学习和过滤更全面、准确和互补的缺陷特征。另外,融合分支引入特征保存下采样(FPD)模块,采用特征拼接技术,有效缓解了传统采样可能产生的微弱缺陷信息丢失问题。HVCM-Net在缺陷数据集GB-DET、NEU-DET和DAGM2007上取得了优于其他方法的检测性能,验证了其有效性。
随着深度学习技术的不断成熟,基于深度学习的多目标跟踪研究取得了巨大进展。在良好光照条件下,现有基于深度学习的多目标跟踪算法能实现实时、稳定跟踪。然而,在极限光照与遮挡严重的舞台演出环境中,对舞台演员的稳定跟踪仍然面临巨大挑战。舞台演出存在演员表观相似、光照变化剧烈、遮挡频繁等问题,直接使用现有跟踪算法因演员身份切换频繁,导致基于演员跟踪的下游工作,如演员动作识别、虚实投影等无法有效开展。为此,提出了一种基于近红外油墨的舞台演员跟踪算法。由于舞台光源能量谱集中在可见光波段,红外光环境较干净,因此,在红外波段设计了一种抗遮挡、隐形的(可见光下不可见)油墨标记,以增强演员表观辨识度,即将红外油墨以二值环形码方式添加在演员服饰上,将环形码对应的类别标签作为关联演员ID,实现对舞台演员的稳定跟踪。在仿真与真实的标记数据集上的实验结果表明,基于红外油墨的二值环形码在60%的遮挡率下仍能达到90%以上的识别准确率,具有很好的抗遮挡性能。演员跟踪实验结果表明,基于交集比指标的帧内数据关联算法能提升ID跟踪轨迹的稳定性,将其应用于现有跟踪模型,ID的召回率和准确率均得到了较大提升。在不影响舞台演出与观演体验的前提下,解决了舞台暗光、演员表观相似导致的跟踪不稳定问题,且算法成本低、可行性高,在舞台演艺行业具有广泛的应用前景。
目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术的方法。首先,在2022年国际医学图像计算和计算机辅助干预会议(MICCAI 2022)的三维牙齿公开数据集上微调模型。然后,将三维牙齿模型投影至多个二维视图,利用SAM网络进行图像分割。再将每个像素的标签映射回原始的三维三角形面片,完成三维牙齿分割。在该数据集中,测试了900个较理想的三维上下牙数据,取得了与主流技术相当的结果。对于缺牙、牙齿错位以及上下颚不完整的复杂情况,本文方法表现出显著优于现有技术的效果,展示了更强的泛化能力和稳定性。
针对粗粒度点云分类方法在细粒度数据集中局部特征提取不足的问题,提出了一种基于层次特征增强的三维细粒度点云分类网络(HFE-Net)。基于Veronese映射的点特征增强模块(V-PE)对点云数据进行数据增强,辅助网络学习法线和姿态高阶信息;基于多尺度上下文感知的簇内特征增强模块(CA-IntraCE),利用不同尺度的K近邻(K-nearest neighbors,KNN)算法以及交叉注意力实现不同尺度特征的增强,以消除最大池化带来的信息丢失;基于分组稀疏采样的簇间特征增强模块(GSS-InterCE),利用最远点采样(FPS)算法获得稀疏点,并采用交叉注意力实验不同簇间的特征增强,从而提高网络的细粒度判别能力。在FG3D数据集Airplane、Car和Chair 3个类别上的实验结果显示,HFE-Net的总体准确率分别达97.40%,80.53%和83.83%,已超过现有最优方法DC-Net、FGPNet的分类框架,说明HFE-Net的分类性能具有一定的优越性。
二维线性正则变换可灵活选择参数值,得到不同形式的线性正则变换级数。为提高线性正则变换图像表示算法的计算速度,将线性正则变换级数与非均匀剖分算法相结合,得到了一种有效的图像表示算法。利用多参数线性正则变换的灵活性,选择合适的表达式逼近区域图像像素。图像的特征矩阵由16×16网格的剖分矩形数构成,将其与Arnold变换相结合构建了能抵抗不同形式攻击的轻量级图像保护算法。实验结果表明,算法具有检测图像是否遭受攻击的能力。
在人脸微表情识别研究领域,现有特征提取方法主要依赖于有监督学习方式,限制了模型在微表情表征中的应用场景和泛化能力。为此,利用掩码自编码器(MAE)技术构建了面向微表情数据集特点的自监督特征编码器,并将其应用于下游微表情识别任务,提出了一种基于自监督掩码光流(self-supervised masked optical flow,SMOF)的人脸微表情识别方法。首先,使用微表情数据集中每个顶点帧的左右各两帧与起始帧计算的光流图作为初步输入。然后,使用重采样技术平衡数据集中各类样本。最后,利用增广后的数据集预训练SMOF模型,通过随机掩盖输入图像的局部块,重构缺失块的像素。在下游任务中,使用ViT-Large模型加载已训练好的特征提取器,取得了较好的微表情分类结果。采用留一受试者交叉验证(LOSO)方法,评估了模型在3DB微表情数据集上的性能,未加权F1分数(UF1)和未加权平均召回率(UAR)分别达0.861 4和0.871 6,优于其他深度学习微表情识别方法。实验结果表明,基于SMOF的微表情识别方法可行且有效,具有较好的可迁移性和扩展性。
人脸活体检测是确保人脸识别系统安全不可或缺的一环。当前大多数人脸活体检测算法采用的是深度卷积神经网络,尽管其检测性能卓越,但往往涉及庞大的参数量和计算复杂度,限制了其应用。为克服这些挑战,提出了一种基于蓝图差分卷积和双重辅助监督的轻量级人脸活体检测算法(BDC-DAL)。通过将轻量化的卷积结构和蓝图差分卷积设计相结合,有效降低了模型的参数和计算量,同时保留了捕捉复杂细粒度特征的能力。此外,引入的双重辅助监督机制,利用监督信号重建过程学习细微的欺诈线索,显著提高了模型对未知攻击场景的鲁棒性。为验证算法的有效性,在CelebA-Spoof和OULU-NPU人脸活体检测数据集上进行了广泛测试,并与当前主流的深度学习人脸活体检测算法和其他轻量化网络模型进行了比较,实验结果显示,BDC-DAL算法大幅降低了模型复杂度,参数量减少了近90%,模型的浮点计算量也下降了约10%。BDC-DAL算法在实现高效性和轻量化的同时,成功平衡了性能与资源消耗,为在资源受限环境下的人脸识别提供了可行的解决方案。
权因子是调整有理Bézier曲线形状的重要手段。当单个权因子趋于无穷时,有理Bézier曲线趋向于相应的控制顶点。已有研究表明,当所有权因子都以幂函数或指数函数形式趋于无穷时,有理Bézier曲线的极限曲线为其正则控制曲线。基于此,提出了一个新模型,结合幂权函数与指数权函数的转换关系,定义了具有混合权函数的有理Bézier曲线的正则控制曲线;结合toric退化理论,证明了当所有权因子都以混合函数形式趋于无穷时,有理Bézier曲线的极限曲线恰为其正则控制曲线;最后通过实例验证了结论的正确性。
斯特林基函数是由离散概率模型生成的一类有理基函数。通过分析基函数的逐层递推关系,构造了斯特林基函数的离散卷积结构。结合离散卷积满足的交换性,得到n次斯特林曲线的n!种de Casteljau算法,并将其用于曲线的递归求值,进而得到n次斯特林曲线的2种线性求值算法、速端曲线离散卷积表示以及首末两个n次斯特林基函数的导函数显式表达式。研究可推广至一类嵌套空间中的有理基函数及其曲线曲面。
基于反向蒸馏架构的异常检测方法在多种数据集上普遍取得了较好的结果,其中RD++算法的设计思路和实验结果尤为突出。由于RD++在推理环节的设计与以往大多数知识蒸馏算法相同,仍以经验方式汇总师生的特征差异,为此对RD++算法进行了改进。在其网络模型上加入分割网络,用通过训练的分割网络取代经验推理进行异常检测和定位;为进一步提升分割网络的性能,加入基于注意力的融合(attention based fusion,ABF)模块和层级上下文损失(hierarchical context loss,HCL),并选用能生成更自然异常的伪异常机制取代RD++的伪异常机制。基于以上4项改进,提出了SegRD++算法。在MVTec AD数据集上的实验结果表明,SegRD++的性能较RD++有明显提高,验证了加入改进措施对提升模型性能有帮助。改进算法的代码公开在https://github.com/JRZhang323/SegRRD上。
人体运动捕获数据恢复问题旨在恢复缺少的运动标记点位置信息,同时消除噪声。现有基于低秩矩阵填充的恢复方法大多利用人体运动捕获数据矩阵的低秩性。然而,随着运动数据帧数的不断增加,低秩性可能不再满足。为更好地刻画运动数据的低秩性,提出一种联合Schatten-p范数和lq范数的非凸时序差分低秩约束(NTDLR)的人体运动捕获数据恢复算法。首先,将数据矩阵投影至时序差分空间,构造时序差分矩阵。其次,引入非凸Schatten-p范数,刻画数据时序差分矩阵的低秩性,同时引入非凸lq范数约束稀疏噪声项。再次,利用交替方向乘子法求解模型,采用Newton-Raphson迭代法求解子问题。最后,在CMU数据集和HDM05数据集上,将NTDLR与经典的TrNN、CaNN和IRNNL Lp算法进行了比较,结果表明,NTDLR算法的视觉效果更优,具有更好的恢复性能。