你是否想过,LLM训练自己的数据,还能比人类筛选的更高效?传统code大模型依赖人工制定规则筛选数据,成本高、效率低,还容易带偏模型。
2025年06月05日
你是否想过,LLM训练自己的数据,还能比人类筛选的更高效?传统code大模型依赖人工制定规则筛选数据,成本高、效率低,还容易带偏模型。
2025年06月05日
字节跳动推出了一款全新的 8B 参数开源代码模型 Seed-Coder。令人惊叹的是,这款模型在性能上竟超越了众多百亿参数的竞争对手,在代码生成的竞技场上脱颖而出,为开发者们带来了前所未有的高效编程工具。
一、技术创新
传统数据筛选方式的困境,如同沉重的枷锁,限制着代码模型的发展速度与质量。而 Seed-Coder 团队另辟蹊径,提出了一种极具创新性的解决方案 ——“让 LLM 自己当老师”。用模型筛选数据训练自己,打造出一系列8B参数的轻量级开源代码模型,性能甚至超越百亿级对手!
2025年06月05日
字节跳动的 Seed 团队重磅发布了视觉 - 语言多模态大模型: Seed1.5-VL!
在60个主流测试中狂揽38项第一!这个模型的视觉编码器仅有532M参数,却能在零样本分类任务中硬刚17.5B参数的EVA-CLIP。
Seed1.5-VL由三个主要部分组成:视觉编码器(Seed-ViT)、MLP适配器和LLM(200亿激活参数)。
2025年06月05日
论文:Seed1.5-VL Technical Report
链接:https://github.com/ByteDance-Seed/Seed1.5-VL/blob/main/Seed1.5-VL-Technical-Report.pdf
2025年06月05日
一、NFS介绍
NFS即网络文件系统,英文全称Network File System,分为服务端(Server)和客户端(Client),是由SUN公司1984年研制的UNIX表示层协议(presentation layer protocol),它允许网络中的计算机之间通过TCP/IP网络共享资源。通过NFS,本地NFS的客户端应用可以透明地读写位于远端NFS服务器上的文件,就像访问本地文件一样方便。
2025年06月05日
图像分割技术在医疗病灶分析、自动驾驶车道线分割、绿幕人像抠图等领域发挥着举足轻重的作用。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代。
2025年06月05日
准备写一些关于自动驾驶方面的东西,以前研究过一些,也比较感兴趣。
本文简单讲解如何使用深度学习语义分割估计车辆可行驶区域(free space),并创建占位栅格(occupancy grid),然后使用占位栅格创建车辆代价图(vehicle costmap),代码运行环境为MATLAB R2018a。
2025年06月05日
语义分割是计算机视觉领域中的一个任务,旨在将图像中的每个像素标记为不同的语义类别。与对象检测将边界框绘制在图像中的物体上不同,语义分割更加精细,对每个像素进行分类。