1. 关于groupsize
dp中的任务是以组来运行的,groupsize
定义了一组任务的数量有多少。组内的任务是串行的,不同组之间的任务是并行的。
例如,有90个任务,设置groupsize
为5,那么dp会自动把这些任务分为18个组。提交到任务系统上,会产生18个任务,这些任务会去自动占用节点,每个任务里有5个小任务。
把groupsize
设大的好处是可以进行自我限制,限制使用的总节点数量。如果想使用所有的资源,可以把groupsize
设置为1。
number_node
指的的每个小组任务占用的节点数量,而不是申请的节点资源总数量。设置为多那会开启多节点并行。
例如,有18个组,设置number_node=5
,会自动给每个任务申请5个节点,这样就不合理了。
2. 关于训练的代数
通过model_devi_jobs来控制,不会自动停止,写多少就会跑多少代。sys_idx控制使用哪一组结构,temps可以是多个温度点,这样在多个温度点跑nsteps步的分子动力学
转载请注明来源 有问题可通过github提交issue