HBox是由360公司开源的一个大数据和人工智能调度平台。它具有以下主要特点:
HBox不仅支持TensorFlow和MXNet的分布式模式,还支持Caffe、Theano、PyTorch等框架的单机模式。用户可以灵活自定义框架版本。
训练数据和模型结果可以保存在HDFS中。HBox支持多种数据读取策略,如Download、Placeholder和InputFormat模式。
HBox提供了友好的Web界面,可以查看容器列表、TensorBoard、模型保存等信息。
除了TensorFlow分布式模式需要自动构建ClusterSpec外,其他框架的程序可以直接在HBox上执行。
编译环境要求:
编译方法:
./mvnw package
部署环境要求:
客户端部署: 配置$HBOX_HOME/conf下的hbox-env.sh、hbox-site.xml等文件
提交应用示例:
$HBOX_HOME/bin/hbox-submit \
--app-type "tensorflow" \
--app-name "tf-demo" \
--input /tmp/data/tensorflow#data \
--output /tmp/tensorflow_model#model \
--files demo.py,dataDeal.py \
--worker-memory 10G \
--worker-num 2 \
--worker-cores 3 \
--ps-memory 1G \
--ps-num 1 \
--ps-cores 2 \
--queue default \
python demo.py --data_path=./data --save_path=./model --log_dir=./eventLog --training_epochs=10
HBox为大数据环境下的机器学习和深度学习应用提供了便捷高效的调度平台,欢迎大家使用并贡献代码!