2025年03月28日
前面我写了一篇《如何用iPad Pro写代码》,看评论感觉大家不是很满意,这次晒出大绝招,大家心心念念的Intellij IDEA可以在iPad Pro上运行啦,惊不惊喜,意不意外。
2025年03月28日
2025年03月28日
在开发或生产环境中,我们经常会搞一套自动化部署方案(俗称一键部署)。比较流行的一种就是Gitlab+Jenkins实现方案,不过这种方案占用内存比较大,没有个8G内存,很难流畅运行,而且部署起来也不快。最近发现一款神器Drone,轻量级CI/DI工具,结合Gogs使用内存占用不到1G,几行脚本就能实现自动化部署,推荐给大家!
2025年03月28日
今天主要介绍下shell脚本中shift的一些用法,这个命令还是相对比较少见的。
shift命令用于对参数的移动(左移),通常用于在不知道传入参数个数的情况下依次遍历每个参数然后进行相应处理(常见于Linux中各种程序的启动脚本)。
简而言之,shift命令表示参数向左偏移,后面可跟数字(数字大小在参数个数范围内)
1、依次读取输入的参数并打印参数个数:
2025年03月27日
如果模型参数过多,而训练样本过少,容易陷入过拟合。过拟合的表现主要是:在训练数据集上 loss 比较小,准确率比较高,但是在测试数据上 loss 比较大,准确率比较低。Dropout 可以比较有效地缓解模型的过拟合问题,起到正则化的作用。Dropout,中文是随机失活,是一个简单又机器有效的正则化方法,可以和 L1 正则化、L2 正则化和最大范数约束等方法互为补充。在训练过程中,Dropout 的实现是让神经元以超参数 pp 的概率停止工作或者激活被置为 0,
2025年03月27日
今天抽空听完了《Maunus 产品合伙人张涛 - 手把手带你解读 DeepSeek R1 技术创新》,直接路转粉,产品同学能把技术讲的非常通透,非常不易,受到启发我也决定用通俗的语言介绍下Deepseek,再次读了一遍DeepSeek_R1/DeepSeek_V3摘录核心要点跟大家分享,本文重点涵盖训练范式、MOE、MLA、FP8混合训练,在下一篇中将介绍MTP、All2All通信、EP策略分析等偏工程架构的优化
2025年03月27日
智东西(公众号:zhidxcom)
作者 | 心缘
编辑 | 漠影
当下,计算机视觉领域最热议的方向,莫过于近两年越来越火的视觉Transformer(ViT)和传统的卷积神经网络(ConvNet),谁才能主宰计算机视觉的未来?
2025年03月27日
机器之心报道
机器之心编辑部
自动机器学习效果能有多好?比如让 MobileNet1.0 backbone 的 YOLO3 超过 ResNet-50 backbone 的 faster-rcnn 六个点?AutoGluon 的问世说明,人类炼丹师可能越来越不重要了。