dpmd-dpgen

  1. 1. 关于groupsize
  2. 2. 关于训练的代数

1. 关于groupsize

dp中的任务是以组来运行的,groupsize定义了一组任务的数量有多少。组内的任务是串行的,不同组之间的任务是并行的。

例如,有90个任务,设置groupsize为5,那么dp会自动把这些任务分为18个组。提交到任务系统上,会产生18个任务,这些任务会去自动占用节点,每个任务里有5个小任务。

groupsize设大的好处是可以进行自我限制,限制使用的总节点数量。如果想使用所有的资源,可以把groupsize设置为1。

number_node 指的的每个小组任务占用的节点数量,而不是申请的节点资源总数量。设置为多那会开启多节点并行。

例如,有18个组,设置number_node=5 ,会自动给每个任务申请5个节点,这样就不合理了。

2. 关于训练的代数

0057820c0ddd57990a2765496116a6a

通过model_devi_jobs来控制,不会自动停止,写多少就会跑多少代。sys_idx控制使用哪一组结构,temps可以是多个温度点,这样在多个温度点跑nsteps步的分子动力学


转载请注明来源 有问题可通过github提交issue