v1.3.0 · 基于 ns-3.44

高性能互连协议研究的
开源仿真平台

基于 ns-3.44，仿真灵衢协议栈的核心能力。模块化架构让协议各层独立替换，适用于算法研究、性能对比等多类高性能互连实验场景。

快速开始查看协议栈架构

协议栈架构

五层协议栈，每层开放独立扩展点

灵衢协议栈分层实现，每层开放独立扩展点。拥塞控制、流控、路由和链路行为均可独立替换，同一架构适用于多类高性能互连实验场景。点击左侧查看各层详情。

功能层

Load/Store · URMA · Jetty

事务层

服务模式 · 事务序 · 事务类型

传输层

可靠传输 · 负载均衡 · 拥塞控制 · 连接管理

网络层

寻址路由 · 虚通道调度 · 拥塞标记

数据链路层

信用流控 · 优先级流控 · 虚通道 · 逐跳重传

功能层

功能层负责把上层通信语义映射到可执行的网络事务。它同时覆盖 Load/Store 与 URMA 两类接口，并通过 Jetty 把应用侧意图交给下层传输与调度逻辑。

应用 (UBPU)

↙ ↘

Load / Store 同步访问

内存语义 · 远程 Store / Load
多线程并发 · 逐线程独立配置
控制器自动转换为事务操作

URMA 异步访问

消息语义 · Write / Read / Send
大消息自动切分 · 乱序确认
通过 Jetty 接口提交事务操作

↘ ↙

Jetty 通信码头 — 多对多 / 单对单 · 通信对建立 · 事务提交与查询

Load/Store 接口

用同步内存语义描述远端读写，由控制器翻译成事务流
线程级配置可以独立控制路径策略与发送方式

URMA 接口

用异步接口表达 Write / Read / Send 等操作
适合研究消息与内存访问混合场景

Jetty 通信码头

多对多：一个端点同时管理多个通信对
单对单：固定绑定单一对端，便于复现实验

扩展方式

新增功能类型只需实现对应上层接口并接入 Jetty
消息切分与调度逻辑可独立替换

事务层

事务层把不同编程模型统一到一组明确的事务语义上。它的价值在于让上层接口差异不会直接污染下层传输与可靠性设计。

服务模式

ROI 可靠 · 发起端保序 · 多路径
ROL 可靠 · 下层保序 · 单路径
UNO 无保序 · 最低开销

事务序 (TEO/TCO)

NO 无序 — 无执行序和完成序约束
RO 松弛 — 同类有序，不同类可乱序
SO 严格 — 按提交顺序执行

事务类型

Write 发送端写入远端内存
Read 请求远端回传数据
Send 双边消息传递

服务模式

ROI：可靠交付 + 发起端顺序约束，同时允许路径层面并发
ROL / UNO：分别面向下层保序与最低约束的两类实验场景

事务序 (TEO/TCO)

执行顺序和完成顺序被显式建模，便于研究语义差异带来的代价
三级有序性（NO/RO/SO）覆盖从全乱序到全严格的实验需求

事务类型

Write、Read、Send 构成统一事务集合，覆盖常见远端访问模式
大事务会被自动拆分后重组交付，语义与数据面保持一致

扩展方式

新增服务模式只需在事务层注册，下层传输和可靠性设计可复用
事务切片策略可独立调整，适配不同 MTU 和多路径场景

传输层

传输层提供端到端数据传输的核心能力：可靠交付、多路径均衡、拥塞控制和连接管理。各项能力可独立配置，方便对比不同策略组合对性能的影响。

端到端传输路径

发

→

连接管理

通道建立 · 分组调度

→

传输服务

可靠 / 旁路 · 序号 · 重传

→

拥塞控制

发送限速 · 交换机标记

→

负载均衡

多路径 · 逐包分散

→

收

← 确认与拥塞反馈 · 各环节算法均可独立替换
新策略按接口规范实现即可接入，无需修改其他环节

传输服务

基于报文序号的可靠传输，支持超时重传与自动退避
可选旁路（bypass）模式，便于对比有无传输保障的性能差异

负载均衡

原生多路径，数据在多条等价路径上同时传输
逐包均衡基于虚拟随机端口实现，接收端自动重排恢复原序

拥塞控制

内置 CAQM 算法，覆盖发送限速、交换机标记、接收反馈完整链路
预留标准算法接入位置，新策略按接口规范实现即可替换

连接管理

每条传输连接独立维护状态，并发连接互不干扰
连接可分组统一调度，配合多路径协同工作

网络层

网络层承担寻址、路由、调度与拥塞标记，支持 ECMP、自适应路由和多种拥塞反馈策略。

交换机转发流水线

入

→

报文解析

IPv4 / CNA 包头

→

地址管理

CNA↔IP

→

路由查找

ECMP / 自适应

→

出口处理

拥塞标记 · 优先级映射

→

出

虚通道调度（严格优先级 / 加权轮询）· 16 个虚通道
缓冲区管理：预留 → 共享 → 溢出保护 · 动态阈值 · 暂停/恢复水位

报文格式与地址

同时支持 IPv4 与 16-bit CNA 两种地址表达
CNA↔IP 转换和 Primary / Port CNA 双地址让跨域实验易于建模

路由查找

路径 Cost 建模使最短路径与绕路策略可直接对比
支持 ECMP Hash 与按端口负载的自适应选路

服务质量 (QoS)

服务等级到虚通道的映射让业务分类与调度策略解耦
严格优先级与加权轮询两种调度可直接对比隔离性与公平性

拥塞标记与缓冲区

拥塞标记与下游反馈链路衔接，形成端到端拥塞感知
动态阈值与暂停/恢复水位共同决定背压触发条件

数据链路层

数据链路层负责逐跳可靠传输、虚通道隔离与流量控制。信用流控和优先级流控两大机制均已建模，可直接对比不同策略的队列行为。

逐跳流量控制（可扩展）

上游节点

发送门控根据信用余量或暂停状态决定是否发送

→

下游节点

缓冲准入根据队列水位判定是否接收

信用归还释放缓冲后向上游回传信用

← 信用回传 / 暂停 / 恢复 — 新流控算法按接口规范实现即可替换

五种流控模式

CBFC 独占 CBFC 共享 PFC 固定 PFC 动态 NONE

报文收发

以 Flit 为基本单位；CRC / Non-CRC 模式让可靠性与时延权衡可显式比较
点到点重传 把逐跳纠错与端到端重传分开建模

虚通道 (VL)

每链路最多 16 个 VL，SP 与 DWRR 可直接对比隔离性与公平性
通过服务等级映射把业务语义绑定到具体虚通道

信用流控 (CBFC)

独占适合严格隔离场景；共享允许在预留之上复用信用池
Credit Ack 逐包归还信用，接收端缓冲状态可细粒度感知

优先级流控 (PFC)

固定阈值 便于控制变量；动态阈值 研究缓冲占用对暂停策略的影响
与上层缓冲区准入逻辑直接联动，形成完整背压信号链路

以上分层首先服务于灵衢协议研究，模块化扩展点同样适用于其他高性能互连场景的算法建模。

这些分层接口可以直接组合成以下典型实验场景 ↓

研究场景

用仿真可以研究什么

6 个典型实验方向，每一项在仓库中都有对应的预置场景和可直接修改的参数入口。

流哈希

路径热点

包喷洒

负载均衡

3 条等带宽路径 · 同一流量矩阵

包喷洒 vs 流哈希

在 Fat-tree 拓扑下对比逐包随机喷洒与流级 ECMP Hash，观察各路径的负载分布、队列深度与整体吞吐差异。

网络层多路径路由

T=10

T=30

T=60

α=0.1

α=0.5

α=1.0

ECN 门限

动态阈值因子

Y 轴 = 稳态队列深度

拥塞控制参数扫描

扫描 C-AQM 的 ECN 标记门限 T 与动态阈值因子 α，量化参数组合对队列深度、吞吐与 P99 时延的影响规律。

传输层拥塞控制

Fat-tree

AllReduce

T₁ (短)

Ring

AllReduce

T₂ (长)

集合通信拓扑对比

在 Fat-tree 与 Ring 拓扑下运行相同的 AllReduce 工作负载，对比完成时间、链路利用率与瓶颈位置的差异。

拓扑建模集合通信

CBFC

VL0

VL1

VL2

独立背压

PFC

VL0

⏸

VL1

VL2

HOL 阻塞

CBFC vs PFC 流控对比

在相同拥塞场景下比较信用流控与优先级流控，量化 HOL 阻塞对低优先级流吞吐与时延的影响程度。

数据链路层流量控制

注入丢包 / 闪断

绕行路径

链路故障与传输韧性

向链路注入丢包、闪断或降速，观察端到端重传、RTO 触发与流量绕行的恢复过程，量化不同可靠性配置的代价。

传输层故障注入

单路径

25% 利用率

→

TPG 多路径

96% 利用率

TPG 多路径带宽聚合

通过 TP Channel Group 把多条并行路径纳入同一传输对象，对比不同喷洒策略下的有效带宽、乱序率与重排开销。

传输层 TPG

以上场景均有对应的预置配置，可开箱即跑 ↓

开箱即用

14 个预置仿真场景

仓库内置 14 个预配置场景，覆盖从双节点机制验证到 32 节点数据中心实验。可以先跑通确认环境，再替换参数、路由策略或拓扑结构。

双节点

2 个节点直连，1 条链路，最小可运行的点对点配置

32 节点 Clos

2 层 Spine-Leaf，4 Spine 全连 4 Leaf，每 Leaf 下挂 8 台 Host，共 32 节点

4×4 FullMesh

16 个 Host 排成 4×4 网格，同行同列节点两两直连，无交换机

自定义拓扑

用 Python 脚本自定义节点、链路和路由，自动生成整套 CSV 配置

每个场景从拓扑到结果的完整路径由内置工具链串联 ↓

完整工具链

拓扑定义 → 流量生成 → 仿真执行 → 结果解析

仓库内置工具链将上述四步串成可复用的实验路径，减少手工拼接配置文件的工作。

# user_topo.py
g = Graph()
g.add_nodes("0..31")
g.build()

定义拓扑

用 Python 描述节点、
链路和路由结构

→

✓ node.csv

✓ topology.csv

✓ routing.csv

write_config() 自动生成

导出配置

自动生成拓扑图
及 node/topology/routing CSV

→

N0 → N1

N2 → N3

N0 → N2

N1 → N3

traffic.csv · All-to-All

编排流量

覆盖 All-Reduce / All-to-All
RDMA 读写和自定义 DAG

→

PortGbps

throughput.csv

解析结果

输出 task_statistics.csv
与逐端口 throughput.csv

任意拓扑生成

用代码描述拓扑，自动生成节点与链路配置，无需手写 CSV。

流量模式编排

集合通信与 RDMA 负载统一编排，实验输入格式一致，可复现、可对比。

Trace 结果解析

原始 trace 自动收敛为任务统计和端口吞吐摘要，直接用于跨实验对比。

工具链就绪后，五步即可跑通第一个仿真 ↓

快速开始

五步跑通第一个仿真

# 克隆项目并初始化子模块
$ git clone https://gitcode.com/open-usim/ns-3-ub.git
$ cd ns-3-ub
$ git submodule update --init --recursive

# 安装 Python 工具依赖
$ pip install -r scratch/ns-3-ub-tools/requirements.txt

# 配置并构建
$ ./ns3 configure
$ ./ns3 build

# 运行第一个仿真
$ ./ns3 run 'scratch/ub-quick-example \
    --case-path=scratch/2nodes_single-tp'

  [00:00:01] Run case: scratch/2nodes_single-tp
  [00:00:01] Simulator finished!
  [00:00:01] Start Parse Trace File.
  处理完成 → output/task_statistics.csv
  处理完成 → output/throughput.csv

更完整的命令说明见 QUICK_START.md · 支持 Linux 与 Windows WSL · 需要 g++≥10 / clang++≥11 · Python≥3.8 · CMake≥3.13

基础与扩展

技术基础

灵衢基础规范

OpenUSim 首先提供灵衢协议的开源参考实现，为协议语义和实现细节建立可验证的仿真基础。

访问官网 →

ns-3.44

平台建立在成熟的离散事件仿真底座上，但真正的价值在于其上层的分层互连建模与实验工具链。

了解 ns-3 →

Unison 并行仿真

多线程并行能力让平台不仅适合做小规模机制验证，也能把研究逐步推进到更大规模的拓扑实验。

阅读论文 →

Agent Skills 把项目上下文带给 AI 工具，让建议更贴合实验场景 ↓

Agent Skills 辅助

专为网络仿真定制的 Agent Skills

Agent Skills 覆盖环境检查、实验规格设计、脚本生成执行到结果解读的完整流程，让 Cursor、Claude Code、Codex 等工具在这个项目里更准确地执行每一步。

仓库就绪

检查构建环境与依赖

规格设计

自然语言 → experiment-spec.md

生成执行

脚本生成 + ./ns3 run

结果解读

CSV + trace 对比实验目标

仓库就绪检查

✓ ./ns3 & scratch/ns-3-ub-tools/

✗ build/ & cmake-cache/ — 缺失

→ 需执行 ./ns3 configure && ./ns3 build，确认执行吗？

我想跑一个仿真实验

好，先检查仓库就绪情况…
build/ 和 cmake-cache/ 不存在，需要先构建（需要几分钟）。是否执行 ./ns3 configure && ./ns3 build？

确认执行

构建完成，仓库就绪。你想做什么样的仿真？

experiment-spec.md 生成

Goal: 比较 CBFC 与 PFC 队列行为
Topology: 双节点 (2nodes_cbfc)
Workload: 单流 100% line-rate
Network: FlowControl=CBFC_Exclusive
Observability: queue_depth + latency

我想比较 CBFC 和 PFC 在拥塞下的队列行为

好，先锁定拓扑规模：1. 双节点（最简）2. 8 节点 ring 3. 32 节点 Clos

双节点就行

工作负载选哪个：1. 单流 100% 2. 多流并发 3. 自定义

单流

好，已写入 scratch/20260328-cbfc-pfc/experiment-spec.md，准备生成执行。

执行流水线

experiment-spec.md → generate_topology.py → node/topology/routing.csv

traffic.csv → network_attribute.txt → ./ns3 run

读取 experiment-spec.md，生成拓扑 CSV。写入 network_attribute.txt：FlowControl=CBFC（规范基线），CbfcFlitsPerCell=8，CbfcInitCreditCell=6553（Spec §4 默认值），Trace 默认开启。

这些参数是你自己定的还是规范里的？

来自代码（ub-port.cc）和 UB Base Spec 2.0 §4，有据可查。执行 ./ns3 run 中…

仿真完成，输出 task_statistics.csv 和 throughput.csv。

时延对比 (μs)

CBFC

PFC

P50

P99

时延 CDF

PFC

CBFC

CBFC 跑完了，P99 时延比预期高

对比实验目标与输出：task_statistics.csv 显示 TP Channel 4 队列积压，是高 P99 来源。结合 network_attribute.txt 与基线 2nodes_pfc 对比，差异在 FlowControl 模式和 cc_alpha。建议单变量：只改 FlowControl=PFC_Fixed 重跑。

好，调整后重新规划实验

记录本次发现到 experiment-spec.md，移交规格设计阶段。

4 个 skill 串联成闭环流程，从环境检查到结果分析全程有据可查；规范参数对齐之后，工具的建议也更贴合实验场景。查看 Agent Skills 专题页 →

从这里开始你的仿真研究

先跑通预置场景确认环境，再按需深入协议细节或扩展至其他研究方向。

获取源码查看 Agent Skills 专题

高性能互连协议研究的开源仿真平台

五层协议栈，每层开放独立扩展点

功能层

事务层

传输层

网络层

数据链路层

功能层

Load/Store 接口

URMA 接口

Jetty 通信码头

扩展方式

事务层

服务模式

事务序 (TEO/TCO)

事务类型

扩展方式

传输层

传输服务

负载均衡

拥塞控制

连接管理

网络层

报文格式与地址

路由查找

服务质量 (QoS)

拥塞标记与缓冲区

数据链路层

报文收发

虚通道 (VL)

信用流控 (CBFC)

优先级流控 (PFC)

用仿真可以研究什么

包喷洒 vs 流哈希

拥塞控制参数扫描

集合通信拓扑对比

CBFC vs PFC 流控对比

链路故障与传输韧性

TPG 多路径带宽聚合

14 个预置仿真场景

双节点

32 节点 Clos

4×4 FullMesh

自定义拓扑

拓扑定义 → 流量生成 → 仿真执行 → 结果解析

定义拓扑

导出配置

编排流量

解析结果

任意拓扑生成

流量模式编排

Trace 结果解析

五步跑通第一个仿真

技术基础

灵衢基础规范

ns-3.44

Unison 并行仿真

专为网络仿真定制的 Agent Skills

仓库就绪

规格设计

生成执行

结果解读

从这里开始你的仿真研究

高性能互连协议研究的
开源仿真平台