5-5 TCP的拥塞控制
# 550.5-5 TCP 的拥塞控制
本节课我们介绍 TCP 的拥塞控制,首先来看拥塞控制的基本概念:
- 在某段时间,若对网络中某一资源的需求超过了该资源所能提供的可用部分,网络性能就要变坏,这种情况就叫做拥塞
- 在计算机网络中的链路容量,交换节点中的缓存和处理机等都是网络的资源,若出现拥塞而不进行控制,整个网络的吞吐量将随输入负载的增大而下降
- 我们使用下图来说明拥塞控制的作用。横坐标是输入负载,代表单位时间内输入给网络的分组数量,纵坐标是吞吐量,代表单位时间内从网络输出的分组数量,具有理想拥塞控制的网络,在吞吐量达到饱和之前,网络吞吐量应等于所输入的负载,故吞吐量曲线是 45 度的斜线,但当输入负载超过某一限度时,由于网络资源受限,吞吐量就不再增长,而保持水平线,也就是吞吐量达到饱和,这就表明输入的负载中有一部分损失掉了。例如输入到网络中的某些分组,被某个节点丢弃了
- 虽然如此,在这种理想的拥塞控制作用下,网络的吞吐量仍然维持在其所能达到的最大值。然而实际的网络情况就很不同了。我们再来看这条吞吐量曲线,随着输入负载的增大,网络吞吐量的增长率逐渐减小,也就是在网络吞吐量还未达到饱和时,就已经有一部分的输入分组被丢弃了。当网络的吞吐量明显的小于理想的吞吐量时,网络就进入了轻度拥塞的状态
- 更值得注意的是,当输入负载到达某一数值时,网络的吞吐量反而随输入负载的增大而减小,这时网络就要进入了拥塞状态,当输入负载继续增大到某一数值时,网络的吞吐量就要减小为零,此时网络就要无法工作了,这就是所谓的死锁。因此进行拥塞控制是非常有必要的。实际的拥塞控制曲线应该尽量接近理想的拥塞控制曲线
接下来我们介绍 TCP 的 4 种拥塞控制算法,他们分别是慢开始,拥塞避免,快重传,快恢复。我们来举例说明 TCP 这 4 种拥塞控制算法的基本原理,为了集中精力讨论拥塞控制,我们假定如下条件:
- 一数据是单方向传送的,而另一个方向只传送确认
- 二接收方总是有足够大的缓存空间,因而发送方发送窗口的大小仅由网络的拥塞程度来决定
- 三以 TCP 最大报文段 MSS 的个数为讨论问题的单位,而不是以字节为单位
假设这是 TCP 的发送方和接收方,发送方给接收方发送 TCP 数据报文段,接收方收到后给发送方发送 TCP 确认报文段:
发送方要维护一个叫做拥塞窗口 cwnd 的状态变量,其值取决于网络的拥塞程度,并且动态变化
- 拥塞窗口的维护原则是只要网络没有出现拥塞,拥塞窗口就再增大一些,但只要网络出现拥塞,拥塞窗口就减小一些
- 判断出现网络拥塞的依据是没有按时收到应当到达的确认报文段,也就是发生了超时重传
发送方将拥塞窗口作为发送窗口 swnd,也就是发送窗口等于拥塞窗口 swnd=cwnd
发送方还需要维护一个叫做慢开始门线的状态变量 ssthresh
- 当拥塞窗口小于慢开始门线时,使用慢开始算法
- 当拥塞窗口大于慢开始门限时停止使用慢开始算法,而改用拥塞避免算法
- 当拥塞窗口等于慢开始门限时,既可以使用慢开始算法,也可以使用拥塞避免算法
首先来看慢开始算法,为了更清楚的显示出拥塞控制过程,我们还可以绘制这样一幅拥塞窗口随传输轮次变化的图,横坐标为传输轮次,传输轮次是指发送方给接收方发送数据报文段后,接收方给发送方发回相应的确认报文段。一个传输轮次所经历的时间,其实就是往返时间。请注意往返时间并非是恒定的数值,使用传输轮次是为了强调把拥塞窗口所允许发送的报文段都连续发送出去,并收到了对已发送的最后一个报文段的确认。
纵坐标是拥塞窗口,它会随网络拥塞程度以及所使用的拥塞控制算法动态变化。
在 TCP 双方建立逻辑连接关系时,拥塞窗口的值被设置为 1,我们在图上标出传输轮次 0 时的拥塞窗口值为一,另外还需设置慢开始门线的初始值,本例采用 16,我们也将它在图中标出,在执行慢开始算法时,发送方每收到一个对新报文段的确认时,就把拥塞窗口值加一,然后开始下一轮的传输,当拥塞窗口值增长到慢开始门限值时,就要改为执行拥塞避免算法。
由于发送方当前的拥塞窗口值是 1,而发送窗口值等于拥塞窗口值,因此发送方当前只能发送一个 TCP 数据报文段,换句话说,拥塞窗口值是几,就能发送几个数据报文段,如图所示发送方发送 0 号数据报文段,接收方收到后给发送方发回对 0 号报文段的确认报文段,发送方收到该确认报文段后,将拥塞窗口值加一增大到二,我们在图中标出该值,这意味着发送方现在可以发送 1~2 号共两个数据报文段
由于发送方当前的拥塞窗口值是 1,而发送窗口值等于拥塞窗口值,因此发送方当前只能发送一个 TCP 数据报文段,换句话说,拥塞窗口值是几,就能发送几个数据报文段,如图所示发送方发送 0 号数据报文段,接收方收到后给发送方发回对 0 号报文段的确认报文段,发送方收到该确认报文段后,将拥塞窗口值加一增大到二,我们在图中标出该值,这意味着发送方现在可以发送 1~2 号共两个数据报文段
接收方收到后给发送方发回,对 1~2 号报文段的确认报文段。
发送方收到后将拥塞窗口值加 2 增大到 4。我们在图中标出该值,发送方现在可以发送 3~6 号共 4 个数据报文段,接收方收到后给发送方发回,对 3~6 号报文段的确认报文段,发送方收到后将拥塞窗口值加四增大到 8。
我们在图中标出该值发送方现在可以发送 7~14 号,共 8 个数据报文段,接收方收到后给发送方发回,对 7~14 号报文段的确认报文段,发送方收到后将拥塞窗口值加 8 增大到 16,我们在图中标出该值,发送方当前的拥塞窗口值已经增大到了慢开始门限值之后,我们要改用拥塞避免算法,也就是每个传输轮次结束后,拥塞窗口值只能线性加一,而不像慢开始算法那样,每个传输轮次结束后,拥塞窗口值按指数规律增长。
发送方现在可以发送 15~30 号,共 16 个数据报文段,接收方收到后给发送方发回,对 15~30 号报文段的确认报文段,发送方收到后将拥塞窗口值加一增大到 17。我们在图中标出该值现在可以发送 31~47 号,共 17 个数据报文段,接收方收到后给发送方发回,对 31~47 号报文段的确认报文段,发送方收到后将拥塞窗口值加一增大到 18,我们在图中标出该值:
随着传输轮次的增加,拥塞窗口值每轮次都线性加一,例如当前拥塞穿口值增加到了 24,发送方现在可以发送 171~194 号,共 24 个数据报文段。假设这 24 个数据报文段在传输过程中丢失了几个,这必然会造成发送方对这些丢失报文段的超时重传。发送方以此判断网络很可能出现了拥塞,需要进行以下工作。
1.将慢开始门限值,更新为发生拥塞时拥塞窗口值的一半,网络发生拥塞时的拥塞窗口值是 24,因此更新慢开始门限值为该值的一半,即 12 如图所示:
2.将拥塞窗口值减小为一,并重新开始执行慢开始算法,当慢开始执行到拥塞窗口值增大到新的慢开始门限值时,就要停止使用慢开始算法,转而执行拥塞避免算法,如图所示:
通过本例可以看出,TCP 发送方一开始使用慢开始算法,让拥塞窗口值从一开始按指数规律增大,当拥塞窗口值增大到慢开始门线值时停止使用慢开始算法,转而执行拥塞避免算法,让拥塞窗口值按线性加一的规律增大。当发生超时重传时,就要判断网络很可能出现了拥塞,采取相应的措施,一方面将慢开始门限值,更新为发生拥塞时拥塞窗口值的一半,另一方面将拥塞窗口值减小为一,并重新开始执行慢开始算法。
拥塞窗口值又从一开始按指数规律增大,当增大到了新的慢开始门限值时,停止使用慢开始算法,转而执行用在避免算法,让拥塞窗口值按线性加一的规律增大。
需要注意的是慢开始是指一开始向网络注入的报文段少,而并不是指拥塞窗口值增长速度慢。
拥塞避免,也并非指完全能够避免营塞。而是只在拥塞避免阶段将拥塞窗口值控制为按线性规律增长,使网络比较不容易出现拥塞。
慢开始和拥塞避免是 1988 年就提出的 TCP 拥塞控制算法,也就是 TCP 的 Tahoe 版本,1990 年又增加了两个新的拥塞控制算法,以便改进 TCP 的性能,这就是快重传和快恢复,被称为 TCP 的 Reno 版本。有时个别报文段会在网络中丢失,但实际上网络并未发生拥塞,这将导致发送方超时重传,并误认为网络发生了拥塞。
例如在之前的例子中,当拥塞窗口值增大到 24 时,发生了超时重传,而网络此时并没有发生拥塞,但是发送方却误认为网络发生了拥塞,于是发送方把拥塞窗口值减小为一并错误的启动慢开始算法,因而降低了传输效率。
采用快重传算法,可以让发送方尽早知道发生了个别报文段的丢失。所谓快重传是发送方尽快进行重传,而不是等超时重传计时器超时再重传:
- 这就要求接收方不要等待自己发送数据时才进行捎带确认,而是要立即发送确认
- 即使收到了失序的报文段,也要立即发送,对已收到的报文段的重复确认
- 发送方一旦收到三个连续的重复确认,就将相应的报文段立即重传,而不是等该报文段的重传计时器超时再重传
我们来举例说明快重传算法:
- 发送方发送 1 号数据报文段,接收方收到后给发送方发回,对 1 号报文段的确认,在该确认报文段到达发送方之前,发送方还可以将发送窗口内的 2 号数据报文段发送出去
- 接收方收到后给发送方发回对 2 号报文段的确认
- 在该确认报文段到达发送方之前,发送方还可以将发送窗口内的 3 号数据报文段发送出去,但该报文段丢失了,接收方自然不会给发送方发回针对该报文段的确认
- 发送方还可以将发送窗口内的 4 号数据报文段发送出去,接收方收到后,发现这不是按序到达的报文段,因此给发送方发回,针对 2 号报文段的重复确认,表明我现在希望收到的是三号报文段,但是我没有收到三号报文段,而是收到了未按序到达的报文段
- 发送方还可以将发送窗口内的 5 号数据报文段发送出去,接收方收到后发现这不是按序到达的报文段,因此给发送方发回针对 2 号报文段的重复确认
- 发送方还可以将发送窗口内的 6 号数据报文段发送出去,接收方收到后发现这不是按需到达的报文段,因此给发送方发回针对 2 号报文段的重复确认,至此发送方会收到三个连续的对二号报文段的重复确认,就要立即重传三号报文段
- 接收方收到后给发送方发回针对 6 号报文段的确认,表明序号到六为止的报文段都正确接收了,这样就不会造成对三号报文段的超时重传,而是提早进行了重传
- 对于个别丢失的报文段,发送方不会出现超时重传,也就不会误认为出现了拥塞,而错误的降低拥塞窗口值为最小值一,使用快重传可以使整个网络的吞吐量提高约 20%
再来看快恢复算法,发送方一旦收到三个重复确认,就知道现在只是丢失了个别的报文段,于是不启动慢开始算法,而是执行快恢复算法。
发送方将慢开始门限值和拥塞窗口值调整为当前窗口值的一半,开始执行拥塞避免算法。
也有的快恢复实现,是把快恢复开始时的拥塞窗口值再增大一些,也就是等于新的慢开始门限值 +3 。这样做的理由是:
- 既然发送方收到三个重复的确认,就要表明有三个数据报文段已经离开了网络
- 这三个报文段不再消耗网络资源,而是停留在接收方的接收缓存中
- 可见现在网络中不是堆积的报文段,而是减少了三个报文段,因此可以适当把用塞窗口值扩大一些
接下来我们给出 TCP 拥塞窗口值,在拥塞控制时的变化情况举例,里面包含了 TCP 拥塞控制的 4 种算法,TCP 发送方一开始使用慢开始算法,让拥塞窗口值从一开始按指数规律增大,当增大到慢开始门线初始值时,停止使用慢开始算法,转而执行拥塞避免算法,让拥塞窗口值按线性加 1 的规律增大。
当发生超时重传时,就要判断网络可能出现了拥塞,采取相应的措施,一方面将慢开始门限值,更新为发生拥塞时拥塞窗口值的一半,另一方面将拥塞窗口值减小为一,并重新开始执行慢开始算法。
拥塞窗口值又从一开始按指数规律增大,当增大到了新的慢开始门限值时,停止使用慢开始算法,转而执行拥塞避免算法,让拥塞窗口值按线性加一的规律增大。当发送方收到三个重复的确认时,就要进行快重传和快恢复,也就是更新慢开始门限值为当前拥塞窗口值的一半,并将拥塞窗口值也取为新的慢开始门限值,转而执行拥塞避免算法,让拥塞窗口值按线性交易的规律增大。
练习题,这是计算机专业考研全国统考计算机网络部分 2009 年的题 39,答案是选项 C 根据题意,我们可以画出发送方拥塞窗口值,随传输轮次的变化图,这是慢开始部分,当拥塞窗口值增大到慢开始门线的初始值时停止使用慢开始算法,转而执行拥塞避免算法。根据题意,当拥塞窗口值增大到 16K 字节时,发生了超时重传,于是将慢开始门限值更新为当前用塞窗口值的一半,并将用塞窗口值减小为 1KB,并重新开始执行慢开始算法。当拥塞窗口值增大到新的慢开始门限值时,停止使用慢开始算法,转而执行拥塞避免算法。可以看到该处就是题目所问的,在超时后的 4 个往返时间后,也就是在超时后的 4 个传输轮次结束后,拥塞窗口值增长到 9K 字节。
需要说明的是题目并未给出慢开始门限值的初始值,因此这部分传输轮次只是示意,目的是为了让大家能够更好的理解
本节课的内容小结如下: