大家周二好,祝好运连连,感谢支持!
2025年08月29日
最近在做图片识别时发现,python有好多方法可以做到,像pytesseract、paddle等,最后感觉pytesseract的速度比较快,但是中文特别是非印刷体的图片识别准确率较低,EasyOCR的准确率就较高,不过速度会慢一些(如果有牛逼的显卡还是很快的)。这里要介绍的是EasyOCR。
EasyOCR 是一个由 Jaided AI 开发的开源光学字符识别(OCR)库,基于 PyTorch 实现。它支持
2025年08月29日
图卷积网络 (GCN) 已越来越多地用于预测电池的健康状态 (SOH) 和剩余使用寿命 (RUL)。然而,传统的 GCN 存在局限性。首先,它们未考虑特征与 SOH 或 RUL 之间的相关性。其次,在将聚合的时间特征投影到另一个维度空间时,未考虑特征之间的时间关系。为了解决这些问题,本文引入了两种无向图,以同时考虑特征之间的相关性以及特征与 SOH 或 RUL 之间的相关性。构建了一个条件 GCN 来分析这些图。引入了一种双谱图卷积操作来分析这些图的拓扑结构。此外,还将膨胀卷积操作与条件 GCN 集成,以考虑聚合特征之间的时间相关性。本文使用两个电池数据集评估了所提出方法的有效性。实验结果表明,所提出的方法优于文献中报道的其他机器学习方法。
2025年08月29日
大家好,我是哪吒。
今天在修改前端页面的时候,发现程序中有一个页面的加载速度很慢,差不多需要
2025年08月29日
千万级数据与百万级数据在处理难度上存在质的差异,其核心挑战集中在内存占用控制、IO 效率优化和计算资源调度三个维度。基于此,我们需要对原有方案进行针对性调整,形成真正适配千万级数据场景的技术实现路径。
2025年08月29日
生成最佳执行计划是一个递归计算的过程:正向从DataSinkNode开始直到DataSourceNode,分别计算每个OptimizerNode的最佳计划,然后反向逐步将整个OptimizerNode DAG图转换为PlanNode DAG图,得到一个最优计划。其中,PlanNode的类继承结构,如下图所示:
通过与OptimizerNode对应的节点结构类图对比,PlanNode更加抽象了一个层次,更关注Operator之间的数据交换策略。其中,生成最佳执行计划的过程,可以在Optimizer类中看到,如下代码所示:
2025年08月29日
CSDN地址:
https://blog.csdn.net/Eclipse_2019/article/details/126362657
2025年08月29日
作者:张俊
出处:
https://ververica.cn/developers/advanced-tutorial-2-analysis-of-network-flow-control-and-back-pressure创作不易,未经授权,禁止转载,否则保留追究法律责任的权利。
本文根据 Apache Flink 系列直播整理而成,由 Apache Flink Contributor、OPPO 大数据平台研发负责人张俊老师分享。主要内容如下:
2025年08月29日
SPPF模块的depth-wise重设计
YOLOv11的SPPF模块虽然比SPP快,但我觉得还能继续优化。可以把传统的卷积替换成depth-wise separable convolution,再加上channel shuffle来保持信息流动。
更进一步,可以引入learnable pooling size,让模型自己决定最优的pooling kernel。这样既能减少参数量,又能保持多尺度特征提取的能力。
主要针对的是multi-scale detection在lightweight model上的性能损失问题。这个改进对small object detection特别有帮助。
2025年08月29日
分层级联注意力减参
这个思路从EfficientViT延伸出来,核心就是不要在每个stage都用全量注意力。具体做法是先在local patches内做自注意力建模局部关系,然后再把小patch合并成大patch做全局依赖建模。可以用Cascaded Group Attention的结构,配合channel shuffle操作。主要解决ViT计算复杂度过高的问题,特别是高分辨率图像处理时很有用。
稀疏-线性混合注意力