admin
[39]
Qwen2.5-7B实例推理教程
一.概述 Qwen 是阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。目前,大语言模型已升级至 Qwen2.5 版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。Qwen 具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为 AI Agent 进行互动等多种能力。 最新版本 Qwen2.5 ...
Yolov5微调教程
YOLOv5(You Only Look Once) 是由 Ultralytics 开发的一种高效、轻量化的目标检测模型,基于 PyTorch 实现,支持实时检测任务。它结合 CSPNet 和 PANet 提升特征提取和融合能力,并通过 Mosaic 数据增强和自动锚框优化提高检测精度。YOLOv5 提供多种模型尺寸(如 YOLOv5s、YOLOv5x),适用于从嵌入式设备到高性能服务器的广泛场景 ...
SAM2Long推理过程
SAM2Long (Segment Anything Model for Long Videos) 是一种面向长视频语义分割任务的技术解决方案,其设计理念来源于 Segment Anything Model (SAM) 的先进能力,同时针对长视频中的时序特性和高效推理需求进行了扩展和优 1. 运行环境 类别 详细信息 CPU 12 vCPU Intel(R) Xeon(R) Plat ...
使用 Huggingface实现GPT2实例教程(微调)
一.概述 本教程提供了使用 GPT-2 模型进行文本生成任务的完整步骤。 GPT-2(Generative Pre-trained Transformer 2)是 OpenAI 提出的一个基于 Transformer 的语言模型,具有强大的文本生成能力。通过预训练和微调,GPT-2 可以在多种自然语言处理(NLP)任务中取得优异表现。 本教程: 使用数据集: German Recipes 数据集 ...
关于本站
对于大多数学习编程的人而言,第一步往往就劝退了很多人。他们顶着一大堆压根就看不懂的概念四处搜索,寻找教学视频和博客文章,在花费了N个小时后,终于能把代码跑起来了,但令人揪心的是,在以后的学习阶段中,像这样劝退的配环境跑代码环境,还会出现无数次。每一次配置环境的过程中,都会在心里发问:难道别人就从没遇到过这类问题吗? 目前全网上的大多数教学文章,比如CSDN,博客园,知乎,掘金等,上面的作者们其实写 ...
集群调度系统 slurm 介绍【一般向】
一般来说,集群是由很多台不同种类的服务器组成的,这些服务器有着相同或类似的操作系统,共享一块容量较大的共享存储。给不同用户分配不同服务器计算资源的软件被称为调度系统。同时,集群普遍处于内网环境中,一般都需要通过VPN再进入集群 目前国内外大部分的集群,都使用slurm调度系统进行集群的统一管理,本文将以普通用户的角度,对slurm的使用方式进行介绍 一 使用概述 1.1 集群组成 登录服务器 ...
BERT 微调实验指南
BERT(Bidirectional Encoder Representations from Transformers)是 Google 于 2018 年提出的一种预训练语言模型,其架构基于 Transformer。BERT 以其双向上下文理解能力,彻底改变了自然语言处理(NLP)领域,成为许多 NLP 任务(如问答系统、文本分类、情感分析等)的基石。 BERT 提供两种主要模型: BERT- ...
【打造你的替身】数字人创作分享与解析
From:有光AI Date:2024.3.19 同学们好,今天我们来聊一聊数字人。 认识数字人 何为数字人 数字人(Digital Human / Meta Human)是运用数字技术创造出来的、与人类形象接近的数字化人物形象。 ——中国新闻网2022.09 一般来说,我们说的数字人常常指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,我们所知的很多虚拟 ...
服务器GPU卡间带宽测试方法【P2P】
一 概述 本文档将对GPU的卡间带宽进行测试方法的说明,使用cuda-sample的程式,并对结果进行解释 二 准备 在测试之前,需要正确安装好GPU驱动和CUDA 如果是Nvlink的机器,除了安装常规的GPU驱动,还需要安装nvidia-fabricmanager服务,此部分可以参考:https://docs.aheadai.cn/193.html 三 安装 前往官网下载NVIDIA官方的CU ...
防止终端意外退出–Tmux介绍
一 概述 由于训练一般都是在远程的Linux上,如果本地网络出现波动救护导致断开与远程服务器的连接,假设这个时候训练是在前台执行的,那么训练一般都会直接因为会话的断开而终止。 命令行的典型使用方式是,打开一个终端窗口(terminal window,以下简称"窗口"),在里面输入命令。用户与计算机的这种临时的交互,称为一次"会话"(session) 。 会话 ...
Posts Navigation
上页
1
2
3
4
下页
返回顶部