2017年04月18日 22:12

class paddle.distributed.fleet. UtilBase [源代码] ?

百度四．大股东增持红岭创投股份为保持红岭创投稳定过渡，大股东及关联方一直回购小股东股份，目前大股东及关联方持股总数已经超过60%（详细资料备查）；五．加大力度查处高管贪腐这是一项常抓不解的工作，根据不良资产清收过程中发现的线索进行调查，对公司内部高管利用职务之便获取不当利益的行为严肃查处，给公司造成重大损失报请经侦部门处理并报送行业黑名单；六．积极发展合规业务，抢抓备案先机去年10月28号，深南股份与神州农服正式签约，运用金融科技手段发展农村土地流转金融服务，该业务标的金额20万以下，借款成本不超过年化12%，因为有土地确权技术做保证，风险相对可控，初期合作规模将达到800亿。

分布式训练工具类，主要提供集合通信、文件系统操作等接口。

方法?

all_reduce(input, mode="sum", comm_world="worker")?

在指定的通信集合间进行归约操作，并将归约结果返回给集合中每个实例。

参数

input (list|tuple|numpy.array) – 归约操作的输入。

mode (str) - 归约操作的模式，包含求和，取最大值和取最小值，默认为求和归约。

comm_world (str) - 归约操作的通信集合，包含：server 集合(server)，worker 集合(worker)及所有节点集合(all)，默认为 worker 集合。

返回

Numpy.array|None：一个和``input``形状一致的 numpy 数组或 None。

代码示例

           >>> # Save the following code in `train.py` , and then execute the command `fleetrun --server_num 2 --worker_num 2 train.py` .
>>> import paddle.distributed.fleet as fleet
>>> from paddle.distributed.fleet import PaddleCloudRoleMaker
>>> import sys
>>> import numpy as np
>>> import os

>>> os.environ["PADDLE_WITH_GLOO"] = "2"

>>> def train():
...     role = PaddleCloudRoleMaker(
...         is_collective=False,
...         init_gloo=True,
...         path="./tmp_gloo")
...     fleet.init(role)
...
...     if fleet.is_server():
...         input = np.array([1, 2])
...         output = fleet.util.all_reduce(input, "sum", "server")
...         print(output) # [2, 4]
...     elif fleet.is_worker():
...         input = np.array([3, 4])
...         output = fleet.util.all_reduce(input, "sum", "worker")
...         print(output) # [6, 8]
...     output = fleet.util.all_reduce(input, "sum", "all")
...     print(output) # [8, 12]

>>> if __name__ == "__main__":
...     train()

          

barrier(comm_world="worker")?

在指定的通信集合间进行阻塞操作，以实现集合间进度同步。

参数

comm_world (str) - 阻塞操作的通信集合，包含：server 集合(server)，worker 集合(worker)及所有节点集合(all)，默认为 worker 集合。

代码示例

           >>> # Save the following code in `train.py` , and then execute the command `fleetrun --server_num 2 --worker_num 2 train.py` .
>>> import paddle.distributed.fleet as fleet
>>> from paddle.distributed.fleet import PaddleCloudRoleMaker
>>> import sys
>>> import os

>>> os.environ["PADDLE_WITH_GLOO"] = "2"

>>> def train():
...     role = PaddleCloudRoleMaker(
...         is_collective=False,
...         init_gloo=True,
...         path="./tmp_gloo")
...     fleet.init(role)
...
...     if fleet.is_server():
...         fleet.util.barrier("server")
...         print("all server arrive here") # all server arrive here
...     elif fleet.is_worker():
...         fleet.util.barrier("worker")
...         print("all server arrive here") # all server arrive here
...     fleet.util.barrier("all")
...     print("all servers and workers arrive here") #all servers and workers arrive here

>>> if __name__ == "__main__":
...     train()

          

all_gather(input, comm_world="worker")?

在指定的通信集合间进行聚合操作，并将聚合的结果返回给集合中每个实例。

参数

input (int|float) - 聚合操作的输入。

comm_world (str) - 聚合操作的通信集合，包含：server 集合(server)，worker 集合(worker)及所有节点集合(all)，默认为 worker 集合。

返回

output (List): List 格式的聚合结果。

代码示例

           >>> # Save the following code in `train.py` , and then execute the command `fleetrun --server_num 2 --worker_num 2 train.py` .
>>> import paddle.distributed.fleet as fleet
>>> from paddle.distributed.fleet import PaddleCloudRoleMaker
>>> import sys
>>> import os

>>> os.environ["PADDLE_WITH_GLOO"] = "2"

>>> def train():
...     role = PaddleCloudRoleMaker(
...         is_collective=False,
...         init_gloo=True,
...         path="./tmp_gloo")
...     fleet.init(role)
...
...     if fleet.is_server():
...         input = fleet.server_index()
...         output = fleet.util.all_gather(input, "server")
...         print(output) # [0, 1]
...     elif fleet.is_worker():
...         input = fleet.worker_index()
...         output = fleet.util.all_gather(input, "worker")
...         print(output) # [0, 1]
...     output = fleet.util.all_gather(input, "all")
...     print(output) # [0, 1, 0, 1]

>>> if __name__ == "__main__":
...     train()

          

get_file_shard(files)?

在数据并行的分布式训练中，获取属于当前训练节点的文件列表。

           示例 1：原始所有文件列表 `files` = [a, b, c ,d, e]，训练节点个数 `trainer_num` = 2，那么属于零号节点的训练文件为[a, b, c]，属于 1 号节点的训练文件为[d, e]。
示例 2：原始所有文件列表 `files` = [a, b]，训练节点个数 `trainer_num` = 3，那么属于零号节点的训练文件为[a]，属于 1 号节点的训练文件为[b]，属于 2 号节点的训练文件为[]。

参数

files (List)：原始所有文件列表。

返回

List：属于当前训练节点的文件列表。

代码示例

           >>> import paddle.distributed.fleet as fleet
>>> from paddle.distributed.fleet import UserDefinedRoleMaker

>>> role = UserDefinedRoleMaker(
...     is_collective=False,
...     init_gloo=False,
...     current_id=0,
...     role=fleet.Role.WORKER,
...     worker_endpoints=["127.0.0.1:6003", "127.0.0.1:6004"],
...     server_endpoints=["127.0.0.1:6001", "127.0.0.1:6002"])
>>> fleet.init(role)

>>> files = fleet.util.get_file_shard(["file1", "file2", "file3"])
>>> print(files)
["file1", "file2"]

          

print_on_rank(message, rank_id)?

在编号为 rank_id 的节点上打印指定信息。

参数

message (str) – 打印内容。

rank_id (int) - 节点编号。

代码示例

           >>> import paddle.distributed.fleet as fleet
>>> from paddle.distributed.fleet import UserDefinedRoleMaker

>>> role = UserDefinedRoleMaker(
...     is_collective=False,
...     init_gloo=False,
...     current_id=0,
...     role=fleet.Role.WORKER,
...     worker_endpoints=["127.0.0.1:6003", "127.0.0.1:6004"],
...     server_endpoints=["127.0.0.1:6001", "127.0.0.1:6002"])
>>> fleet.init(role)

>>> fleet.util.print_on_rank("I'm worker 0", 0)
I'm worker 0

          

小脑延髓池是什么意思	timing什么意思	六畜兴旺是什么生肖	蓝得什么	日单是什么意思
手机电池为什么会鼓包	循序渐进是什么意思	生姜水泡脚有什么好处	蛇胆是什么	汗是什么味道
leysen是什么牌子	什么是腺肌症	肝气不舒有什么症状	病毒性肠炎吃什么药	经期头疼吃什么药效果最好
手上有湿疹是什么原因引起的	肚皮冰凉是什么原因呢	荨麻疹忌口什么食物	什么奶不能喝	太阳最后会变成什么

嗓子发苦是什么原因hcv8jop8ns4r.cn	蓝莓泡酒有什么功效hcv8jop1ns6r.cn	一直流鼻血是什么原因hcv9jop4ns0r.cn	神仙是什么意思aiwuzhiyu.com	9月11号是什么星座hcv8jop7ns1r.cn
行运是什么意思hcv9jop6ns7r.cn	小龙虾吃什么食物hcv7jop4ns5r.cn	胃火大吃什么药hcv9jop1ns8r.cn	湿痹是什么意思hcv8jop4ns2r.cn	肠炎吃什么药hcv8jop2ns0r.cn
邹的左边读什么hcv8jop9ns5r.cn	巴西龟吃什么食物hcv9jop6ns0r.cn	218是什么星座hcv7jop9ns7r.cn	九寨沟在四川什么地方hcv9jop0ns9r.cn	黄体破裂是什么hcv8jop5ns7r.cn
7月16号是什么星座hcv8jop8ns0r.cn	假唱是什么意思luyiluode.com	外阴皮肤痒是什么原因hcv8jop1ns6r.cn	什么的梦xscnpatent.com	右侧上颌窦粘膜增厚是什么意思hcv9jop5ns4r.cn