扩散模型最近是真的有点火。
2025年05月03日
阿里巴巴、香港大学、蚂蚁集团的研究人员提出了一种全新图片生成动态视频模型——LivePhoto。用户通过LivePhoto,可将一张静态图片快速生成高精准的动态视频。
2025年05月03日
在计算机视觉领域出现的问题,例如图像语义分割(semantic segmentation)和超分辨率图像生成(super resolution imaging)要求输入与输出均为格点数据且输入端的特征图大小可变。全卷积构筑就是为解决上述问题而设计的神经网络算法。
今天来看看SRCNN和UNet两个神经网络:
1、SRCNN(Super Resolution CNN)
2025年05月03日
【嘉勤点评】鸿泉物联发明的盲区行人检测方案及技术,该方案可以准确、实时地对行车视野盲区的危险区域进行检测,并在行人进入盲区危险区域时对行人进行报警提示,从而能够减少安全事故的发生。
集微网消息,众所周知,在现有的车辆结构设计方案中,由于车辆本身的设计,导致车身周边存在不少反光镜无法达到的盲区,当行人进入行车视野盲区时,尤其是在车辆转弯时刻,会存在极大的安全隐患。
2025年05月03日
一、前言:AI加持 轻薄本开始迈向实用全能
长期以来轻薄本一直都是定位于轻便,为了轻薄牺牲了很多,性能方便只能说能用,用户也逐渐习惯这种情况,选笔记本看厚度就能比较直观的判断性能。
2025年05月03日
随着人工智能的发展,图像分割已经成为计算机视觉的一个重要分支。图像分割的目的是将一幅图像划分为具有不同功能的相关区域。它为将输入图像分解为存在于其中的实体提供了基础,从而为其他计算机视觉任务,如目标检测,目标跟踪,图像语义分析,机器人视觉等提供基础。
机器学习技术已经被广泛应用于图像分割,其中神经网络是一种最受欢迎的机器学习技术。PyTorch是一个广受欢迎的基于Python的机器学习开发框架,它为神经网络的实现提供了非常便捷的API。在本文中,将介绍如何使用PyTorch实现神经网络图像分割。
2025年05月03日
随着遥感仪器性能的不断发展,我们所能获取的遥感图像数量激增,且光谱特征维数不断增加,有必要利用机器学习对图像进行自动处理。
本文概述了机器学习的主要方法及其在遥感影像的主要应用方向,并通过应用实例说明深度学习模型可以不断提高检测精度,解决传统机器学习难以解决的一些问题,带动遥感应用模式的创新。
2025年05月03日
【导读】:本文从unet的算法原理到模型代码,详细介绍了unet的模型框架以及如何使用已有的unet项目代码(pytorch实现)训练基于unet的显微镜细胞图像分割模型;保姆级的模型训练教程,即使无任何项目经验,按照文中步骤也可将模型跑通。文末附项目代码链接和手动翻译中文unet论文获取方式。
2025年05月03日
在训练Diffusion模型时,我们可以遵循怎样的阶段?这篇文章里,作者围绕训练Diffusion的过程、应用Diffusion模型阶段等内容做了梳理和讲解,不妨来看一下。
高斯噪声:是一种符合正态分布的随机噪声。
2025年05月03日
天眼查财产线索信息显示,近日,北京百度网讯科技有限公司申请的“图像生成模型的构建方法、图像生成方法及其装置”专利公布。
摘要显示,本专利涉及图像处理领域,尤其涉及人工智能领域。具体实现方案为:获取样本图像以及样本图像对应的样本提示词;基于第一预处理网络对样本图像进行处理,得到样本图像对应的控制条件和目标潜在空间编码;基于第二预处理网络将样本提示词转换为文本向量;将目标潜在空间编码、文本向量和控制条件作为待训练的UNet网络的输入,结合UNet网络输出的噪声分布对UNet网络进行训练,得到训练好的目标UNet网络;基于第一预处理网络、第二预处理网络、目标UNet网络和解码器构建图像生成模型。