PCA
Created: Apr 26, 2020 4:40 PM
PCA 简介
PCA是一种降维算法
属性:
- - 在数据集中保留了最多的信息,同时将数据转换到较低维的子空间
- - 主要的成分彼此正交(方差最大)
- - 有损数据压缩,特征提取和数据可视化等应用程序。
2025年07月13日
Created: Apr 26, 2020 4:40 PM
PCA是一种降维算法
属性:
2025年07月13日
上一节我们讲到了决策树这个算法,但是一棵决策树可能会存在过拟合的现象,而且对数据微小的变化也比较敏感,为了解决这些问题,我们可以通过多棵树的方式,也就是今天要介绍的随机森林。
随机森林算法也就是Random Forest,它是一种集成学习算法,所谓集成学习,就是通过多个能力比较弱的机器学习模型的预测结果来得到一个更好的预测结果。随机森林的这一种方式叫做Bagging,它是Bootstrap Aggregate的简写,就是通过自助采样(bootstrap sampling)生成多个训练子集,分别训练后把结果聚合起来。
2025年07月13日
下图显示了关于不同类型葡萄酒销量的月度多元时间序列。 每种葡萄酒类型都是时间序列中的一个变量。
假设要预测其中一个变量。 比如,sparkling wine。 如何建立一个模型来进行预测呢?
一种常见的方法是将该变量其视为单变量时间序列。 这样就有很多方法可以用来模拟这些系列。 比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。
但是其他变量可能包含sparkling wine未来销售的重要线索。 看看下面的相关矩阵。
2025年07月13日
羊毛行为、垃圾注册等违规行为会严重影响企业的运营与效益。而IP风险画像技术能够使防问网站IP数据进行地址、行为、时间等多维度的数据分析,精准识别IP地址的可能违规行为,并助力企业构建全面的风险模型,帮助企业防范网络风险。
2025年07月13日
特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表格数据集而言,显式特征工程仍然是不可替代的核心技术。本文通过实际案例演示特征工程在回归任务中的应用效果,重点分析包含数值型、分类型和时间序列特征的大规模表格数据集的处理方法。
特征工程是指从原始数据中选择、转换和构建新特征的系统性过程,旨在提升机器学习模型的预测性能。该过程需要运用领域知识,从数据中提取最具预测价值的信息,并将其转换为适合特定机器学习算法的表示形式。
2025年07月13日
来源:环球网
【环球网科技综合报道】2月28日消息,近日,云深处成功交付宁夏戈壁滩无人区升压站的智能巡检项目,为该地区提供了高效、智能化的无人值守解决方案。项目从2024年8月至25年2月期间,累计完成超过200次巡检,单日最高覆盖349个巡检对象,识别准确率达到96.5%,成为戈壁滩无人区设备管理的可靠助手。
据悉,以往每周运维人员都需要从柏油马路上再驱车10多公里石子路到达风电站巡检,在恶劣天气和环境中开展例行巡检。如今,风电升压站工作人员在办公室里便可收到由机器狗在无人区发来的详尽智能巡检报告。
2025年07月13日
智能AI在劳保用品识别方面的智慧应用
背景
在高温作业环境下,工人因劳保用品穿戴不适而违规操作的现象频发,尤其在建筑、化工、制造等高危行业,安全帽、反光背带、防护手套、劳保鞋等装备的脱卸行为直接威胁生命安全。传统人工巡检存在效率低、覆盖面窄、主观性强等问题,难以实现实时监管。