NVIDIA Unified Fabric Manager - 容器化部署方案
UFM Fabric Validation 插件是一个用于运行验证测试并可视化结果的工具。支持选择计算节点范围和执行测试列表,提供实时进度和节点状态信息。
UFM Enterprise 提供完整的 InfiniBand 和以太网络管理功能。包括拓扑可视化、性能监控、故障诊断和配置管理等企业级特性。
docker pull mellanox/ufmfv:latest
# 下载后加载镜像文件
docker load -i mellanox_ufmfv_latest-amd64.tar.gz
docker run -dit --name ufmfv -p 9000:9000 mellanox/ufmfv
http://[服务器IP]:9000
docker load -i mellanox_ufm-enterprise_6.19.4-3-amd64.tar.gz
# 创建主目录,并将 UFM license 文件复制到临时目录
mkdir -p /opt/ufm/files
mkdir -p /tmp/license_file
cp your_license.lic /tmp/license_file/
docker run -it --name=ufm_installer --rm \
-v /var/run/docker.sock:/var/run/docker.sock \
-v /etc/systemd/system/:/etc/systemd_files/ \
-v /opt/ufm/files/:/installation/ufm_files/ \
-v /tmp/license_file/:/installation/ufm_licenses/ \
mellanox/ufm-enterprise:6.19.4-3 \
--install \
--fabric-interface ibs5
systemctl daemon-reload
systemctl start ufm-enterprise
systemctl status ufm-enterprise
https://[服务器IP]