2025年07月13日
在C#中,可以通过使用
Microsoft.Office.Interop.Word命名空间下的类型来与Word文档进行交互。以下是一些示例代码,演示如何打开、保存、读取和写入Word文件。
2025年07月13日
全文共5835字,预计学习时长16分钟
机器学习问题一般可以分为三种类型,包括被称为监督学习的分类和回归,和无监督学习,无监督学习在机器学习中通常是指聚类。
本文将简要介绍这三个问题,并在流行的python库scikit-learn中演练。
在开始之前,先简要解释监督和无监督学习术语的含义。
监督学习:在监督学习中,有一组已知的输入(特征)和一组已知的输出(标签)。一般把输入特征和输出标签叫做X和y。该算法的目标是学习将输入映射到输出的映射函数。从而当给出新的X示例时,该机器可以正确地预测相应的y标签。
2025年07月13日
本文介绍了如何使用FastAPI和Redis缓存加速机器学习模型服务。FastAPI作为高性能Web框架用于构建API,Redis作为内存中的数据结构存储系统作为缓存层。通过集成FastAPI和Redis,系统能快速响应重复请求,避免冗余计算,显著降低延迟和CPU负载。此外还详细阐述了实现步骤,包括加载模型、创建FastAPI端点、设置Redis缓存及测试性能提升。
2025年07月13日
Python拥有大量封装好的功能模块和工具库,这些库广泛应用于数据分析、机器学习、Web开发、自动化等多个领域。库在Python的作用非常重要,利用库不仅能简化复杂的任务还能极大减少开发的时间。下面介绍了13个python常见库。
2025年07月13日
Created: Apr 26, 2020 4:40 PM
PCA是一种降维算法
属性:
2025年07月13日
上一节我们讲到了决策树这个算法,但是一棵决策树可能会存在过拟合的现象,而且对数据微小的变化也比较敏感,为了解决这些问题,我们可以通过多棵树的方式,也就是今天要介绍的随机森林。
随机森林算法也就是Random Forest,它是一种集成学习算法,所谓集成学习,就是通过多个能力比较弱的机器学习模型的预测结果来得到一个更好的预测结果。随机森林的这一种方式叫做Bagging,它是Bootstrap Aggregate的简写,就是通过自助采样(bootstrap sampling)生成多个训练子集,分别训练后把结果聚合起来。
2025年07月13日
下图显示了关于不同类型葡萄酒销量的月度多元时间序列。 每种葡萄酒类型都是时间序列中的一个变量。
假设要预测其中一个变量。 比如,sparkling wine。 如何建立一个模型来进行预测呢?
一种常见的方法是将该变量其视为单变量时间序列。 这样就有很多方法可以用来模拟这些系列。 比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。
但是其他变量可能包含sparkling wine未来销售的重要线索。 看看下面的相关矩阵。