在上一篇文章中,我们全面解析了注意力机制的发展历程。本文将深入探讨深度学习中的归一化技术
2025年05月15日
编者按:你是否有过图像检索的烦恼?或是难以在海量化的图像中准确地找到所需图像,或是在基于文本的检索中得到差强人意的结果。对于这个难题,微软亚洲研究院和微软云计算与人工智能事业部的研究人员对轻量化视觉模型进行了深入研究,并提出了一系列视觉预训练模型的设计和压缩方法,实现了视觉 Transformer 的轻量化部署需求。目前该方法和模型已成功应用于微软必应搜索引擎,实现了百亿图片的精准、快速推理和检索。本文将深入讲解轻量化视觉预训练模型的发展、关键技术、应用和潜力,以及未来的机遇和挑战,希望大家可以更好地了解轻量化视觉预训练领域,共同推进相关技术的发展。
2025年05月15日
在计算机视觉领域,特征提取是一种常见的技术,用于从图像或视频中提取出有用的信息。以下全文通过介绍特征提取常用的算法进行介绍:
是指从原始数据中提取出有用的特征,以便于进行后续的处理和分析,特征提取一般包含特征点检测和描述子计算两个过程。
特征点检测
2025年05月15日
UAV爱上了VIO
资料来源:《面向无人机的视觉-惯性里程计算法研究》
近年来随着计算机和人工智能的发展,涌现出了一大批高新产业,例如智能机器人、自动驾驶、AR、VR,无人机…这些产品的出现不仅在一定程度上减轻了人们的负担,同时又可以代替人类去做那些比较危险的工作,不断提高人们生活的智能性。
扫地机器人的出现极大的便利了人们日常生活,然而早期的扫地机器人智能实现室内的简单清扫,在房间内随机游走,经常出现碰壁现象。如今随着定位与构图技术的不断发展及其在扫地机器人中的应用,目前的扫地机器人已变得非常智能,可通过传感器对室内的环境进行扫描建图,并实现自主规划式清扫,还能做到自主回充断点续扫等功能。
2025年05月15日
一、首先说明几个情况:
1、完成双目标定必须是自个拿棋盘图摆拍,网上涉及用opencv自带的标定图完成双目标定仅仅是提供个参考流程。我原来还以为用自带的图标定就行,但想不通的是咱们实际摆放的双目摄像头和人家当时摆放的肯定不一样,那用人家的标定图怎么能反应自己摄像头的实际情况;后来问了大神,才知道用opencv自带的标定图(或者说别人提供的图)进行标定,这是完全没有意义的。
2025年05月14日
在这篇文章中,我将讨论用于目标检测任务的 Single Shot Multi-box Detector。 该算法属于一次性分类器系列,因此它的速度很快,非常适合嵌入到实时应用程序中。 SSD的关键特征之一是它能够预测不同大小的目标,并且为现在很多算法提供了基本的思路。 我们从讨论算法的网络架构开始这篇文章,然后我们将深入研究数据增强、锚框和损失函数。
SSD 算法已经在各种预训练算法上进行了训练,如 ResNet50、ResNet101、ResNet152、MobileNet、EfficientNet 和 VGG16。 但在本文中,我们将讨论在 SSD [1] 的原始实现过程中使用的 VGG-16。
2025年05月14日
交通物体检测与实例分割
本项目基于YOLOv8框架,能够对交通物体进行检测。对图片能检测到物体并用锚框进行标注展示,对于视频则是对每一帧进行物体检测分析,同样使用锚框进行标注,最终生成的物体检测视频能实时追踪物体并用不同颜色框进行标注展示。
用户除了选择常规的模型进行物体检测之外,还可以使用专门进行实例分割的模型。在训练预测之后,可以得到不同的物体。与单纯的物体检测有些不同,实例分割能够对物体的轮廓进行较为精细的标注,并将整个物体以特定的颜色进行标注,相比于普通的物体检测能够产生更精细且更好的可视化效果。
2025年05月14日
YOLO (You Only Look Once),由华盛顿大学的Joseph Redmon和Ali Farhadi开发的流行目标检测和图像分割模型,于2015年推出,由于其高速和准确性而迅速流行。