编辑: huangshuowei01 2017-09-21

121 idle cn[1152-1177,1180-1223,1226-1243,1246 $ yhcontrol show node cn0 NodeName=cn0 Arch=x86_64 CoresPerSocket=12 CPUAlloc=0 CPUErr=0 CPUTot=24 Features=(null) OS=Linux RealMemory=64000 Sockets=2 State=DOWN* ThreadsPerCore=1 TmpDisk=0 Weight=1 Reason=Not responding [slurm@2015-03-15T15:17:11] 节点基本状态 ? 节点基本状态值 C UNKNOWN:未知, unk C IDLE:空闲, idle C ALLOCATED:已分配, alloc C DOWN:故障, down ? 状态标识 C DRAIN:不再分配, drng/drain C COMPLETING:有作业正在退出, comp C NO_RESPOND:无响应, * ? 指定查看特定状态的节点: C yhi Ct 状态值 分区状态查看 ? 使用yhinfo命令查看分区状态 C 与查看节点状态一致 $ yhinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST work* up infinite

1110 down* cn[0-451,494-1151] work* up infinite

42 idle cn[452-493] test up infinite

7 down* cn[1178-1179,1224-1225,1244-1245,1259] test up infinite

121 idle cn[1152-1177,1180-1223,1226-1243,1246 ? 分区名 ? 分区状态 C UP、DOWN、DRAIN、INACTIVE C DEFAULT/* ? 运行时间限制 ? 查看指定分区 C yhi Cp 分区名 ? 节点数量 ? 节点状态 ? 节点列表 分区属性查看 C 节点列表 C 状态: UP/DOWN C 隐藏分区 C 访问权限 C RootOnly C AllowGroups $ yhcontrol show partition work PartitionName=work AllocNodes=ALL AllowGroups=ALL Default=NO DefaultTime=NONE DisableRootJobs=NO Hidden=NO MaxNodes=UNLIMITED MaxTime=UNLIMITED MinNodes=1 Nodes=cn[0-1151] Priority=1 RootOnly=NO Shared=NO State=UP TotalCPUs=27648 TotalNodes=1152 ? 使用yhcontrol命令查看分区属性 C 资源限制 C 节点范围 C 运行时间 C 优先级 C 共享节点 C 默认分区 主要内容 ? 1.资源管理系统概述 C 系统组成 C 系统实体 ? 2.资源管理系统使用 C 资源状态查看 C 作业与资源分配 C 作业查看与控制 作业 = 资源分配请求 ? 提交:申请资源 ? 排队:等待资源 ? 运行:分配资源(无论是否执行程序) ? 挂起:暂时释放资源 ? 结束:释放资源 作业运行模式 ? 交互模式 C yhrun ? 批处理模式 C yhbatch ? 分配模式 C yhalloc ? 只是用户使用方式区别 ? 管理、调度、记账时同等对待 交互模式 - yhrun ? 交互模式作业 1.在终端提交资源分配请求,指定资源数量与限制 2.等待资源分配 3.获得资源后,加载计算任务 4.运行中,任务I/O传递到终端 5.可与任务进行交互:I/O,信号 6.任务执行结束后,资源被释放 ? 一个yhrun(一次资源分配)生成一个作业步(一次任务加载) $ yhrun -n

4 cpi yhrun: job

52 queued and waiting for resources yhrun: job

52 has been allocated resources Enter the number of intervals: (0 quits)

3 pi is approximately 3.1508492098656031, Error is 0.0092565562758100 wall clock time = 0.000014 Enter the number of intervals: (0 quits)

0 $ 批处理模式 - yhbatch ? 批处理模式 1.用户编写作业脚本 2.提交作业 3.作业排队等待资源分配 4.分配资源后,在首节点加载执行作业脚本 5.脚本执行结束,释放资源 6.运行结果定向到指定的文件中记录 ? 脚本中可通过yhrun加载计算任务 C 一个作业可使用多个yhrun生成多个作业步 C 也可以不包含yhrun命令,这样脚本只会在首节点运行 批处理模式 - yhbatch ? 脚本文件:第一行应以 #! 开头,指定脚本文件的解释程序;

在脚本中,如果一 行以 #SBATCH 开头,则该行中的其余部分被当作命令行选项,被yhbatch处理 ? 通过yhbatch命令运行 ? 运行后,生成输出文件 $ yhbatch job.sh Submitted batch job

53 $ yhqueue JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON)

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题