深入理解connection multiplexing

yamux是golang连接多路复用(connection multiplexing)的一个库,想法来源于google的SPDY(也就是后来的http2)。yamux能用很小的代价在一个真实连接(net connection)上实现上千个Client-Server逻辑流。

基本概念

  • session(会话) session用于包裹(wrap)可靠的有序连接(net connection)并将其多路复用为多个流(stream)。

  • stream(流) 在session中,stream代表一个client-server逻辑流。stream有唯一且自增(+2)的id,客服端向server端的stream id为奇数,服务端向客户端发送的stream为偶数,同事0值代表session。stream是逻辑概念,传输的数据是以帧的形态传输的。

  • frame(帧)
    帧是在session中真正传输的数据,帧有两部分header和body

    • header包含12个字节的数据,(也就算每次消息发送会参数额外12字节)。
      • Version (8 bits) 协议版本,目前总是为0
      • Type (8 bits) 帧消息类型,
        • 0x0(Data)数据传输
        • 0x1(Window Update) 用更新stream收消息recvWindow的大小。(注意这个时候length字段则为窗口的增量值)
        • 0x2(Ping)心跳,keep alives和RTT度量作用
        • 0x3(Go Away) 用于关闭会话
      • Flags (16 bits)
        • 0x1 SYN : 新stream需要被创建
        • 0x2 ACK : 确认新stream开始
        • 0x4 FIN : 执行stream的半关闭
        • 0x8 RST : 立即重置stream
      • StreamID (32 bits) 流ID用于区分逻辑流
      • Length (32 bits) body的长度或者type为Window Update时的delta值
    • body 是真实需要传输的数据,可能没有。

实现原理

yamux multiplexing 如何实现的

从上图我们可以看出multiplexing的原理:传输过程中使用frame传输,每个frame都带有stream ID,在传输过程中stream相同stream的数据有先后顺序但可能不是连续的,接收端通过逻辑映射关系整合成有序的stream。

stream的状态变迁

类似tcp连接,每一个stream都是有链接状态的。一个新的stream在创建的时候client会向server发送SYN信息(这边和tcp有个不一样的地方是,SYN发送后可以立即发送数据而不是等等对方ACK后再发),server端接收到SYN信息后会回传ACK信息。close的时候会给对方发送FIN,对方接收到同样会回一个FIN。这个过程会伴随整个stream的状态变迁。

上图还有一种 streamReset 状态没有呈现,server端Accept等待队列满的时候会发flagRST送给client的信息,client收到这个消息后会把流状态设置成streamReset这个时候流会停止。

流控制(Flow Control)

类似TCP的流控制,yamux也提供一种机制可以让发送端根据接收端接收能力控制发送的数据的大小。Tcp流控制的操作是接收端向发送端通知自己可以接收数据的大小,发送端会发送不超过这个限度的数据。这个大小限度就被称作窗口(window)大小。我们从stream状态迁移的图中看到了一个概念-window(窗口),就是和Tcp窗口类似的概念。

yamux的每个stream的初始窗口为256k,当然这个值是是可以配置修改的,在stream的SYN和ACK的消息交互中就带了窗口大小的协商。

窗口的大小由接收端决定的,接收端将自己可以接收的缓冲区大小通typeWindowUpdate类型的Header发送给发送端,发送端根据这个值调整自己发送数据的大小,如果发现是0就会阻塞发送。

源码分析

创建session和数据读写

创建session只能通过 Server(conn io.ReadWriteCloser, config *Config) func Client(conn io.ReadWriteCloser, config *Config) 这两个方法创建,本质上都调用了newSession的方法。我们具体看下newSession的方法。

func newSession(config *Config, conn io.ReadWriteCloser, client bool) *Session {
...
	s := &Session{
		config:     config,
		logger:     logger,
		conn:       conn,                  //真实连接(实际上io.ReadWriteCloser)
		bufRead:    bufio.NewReader(conn),           
		pings:      make(map[uint32]chan struct{}),
		streams:    make(map[uint32]*Stream),         //流映射
		inflight:   make(map[uint32]struct{}),
		synCh:      make(chan struct{}, config.AcceptBacklog), 
		acceptCh:   make(chan *Stream, config.AcceptBacklog), // 控制accept 队列长度
		sendCh:     make(chan sendReady, 64), //发送的队列长度
		recvDoneCh: make(chan struct{}),    //recvloop 终止信号
		shutdownCh: make(chan struct{}),     //session 关闭信号
	}
	if client {
		s.nextStreamID = 1    //client端的话初始stream Id是1
	} else {
		s.nextStreamID = 2    //client端的话初始stream Id是2
	}
	go s.recv()      //循环读取真实连接frame数据,然后分发到相应的message-type handler
	go s.send()      //循环通过真实连接发送frame数据
	if config.EnableKeepAlive {
		go s.keepalive() //通过`ping`心跳保持连接
	}
	return s
}

从上面的代码我们可以看出client和server唯一的区别是nextStreamID不一样,发送和接收数据的方式并没有区别。

Session.recv() 实际调用的是Session.recvLoop方法

defer close(s.recvDoneCh)
	hdr := header(make([]byte, headerSize))
	for {
		// Read the header
		if _, err := io.ReadFull(s.bufRead, hdr); err != nil {  //读取 frame Header
			...省略错误处理代码
        }
        ...省略版本确认代码
		mt := hdr.MsgType()
		if mt < typeData || mt > typeGoAway {  //验证header type
			return ErrInvalidMsgType
		}

        if err := handlers[mt](s, hdr); err != nil {  //handle header type 
           ...省略代码
		}
	}

handlers 是一个全局变量,已经初始化的一个函数指针数组

handlers = []func(*Session, header) error{
		typeData:         (*Session).handleStreamMessage,
		typeWindowUpdate: (*Session).handleStreamMessage,
		typePing:         (*Session).handlePing,
		typeGoAway:       (*Session).handleGoAway,
	}

我们重点关注 handleStreamMessage方法,这个方法处理typeWindowUpdatetypeData这两个核心的消息类型。

func (s *Session) handleStreamMessage(hdr header) error {
	id := hdr.StreamID()
	flags := hdr.Flags()
	if flags&flagSYN == flagSYN {
		if err := s.incomingStream(id); err != nil { //如果是SYN信号,在接收端初始化stream作为发送端的副本和发送的stream保持通讯和协同window大小。创建后又通过 
			return err
		}
	}
	// Get the stream
	s.streamLock.Lock()
	stream := s.streams[id]
	s.streamLock.Unlock()

     ...省略代码
	if hdr.MsgType() == typeWindowUpdate {
		if err := stream.incrSendWindow(hdr, flags); err != nil { //如果是typeWindowUpdate类型,这个调节本地发送窗口(sendWindow),触发`sendNotifyCh`可以发送更多数据
			...省略错误处理代码
			return err
		}
		return nil
	}
	if err := stream.readData(hdr, flags, s.bufRead); err != nil { //读取body
		...省略错误处理代码
		return err
	}
	return nil
}

总得来说 recv 的工作职责就是,读取每一个frame header,然后根据header type handle到不同的处理函数中。

Session.send()方法就相对简单些,职责是用底层真实链接发送frame给接收方。

func (s *Session) send() {
	for {
		select {
		case ready := <-s.sendCh:  //从缓冲管道(队列)获取frame
			if ready.Hdr != nil {
				sent := 0
				for sent < len(ready.Hdr) {
					n, err := s.conn.Write(ready.Hdr[sent:]) //先写header
					if err != nil {
					    ...省略错误处理代码
						return
					}
					sent += n
				}
			}
			if ready.Body != nil {  //如果有body写body
				_, err := io.Copy(s.conn, ready.Body)
				if err != nil {
					...省略错误处理代码
				}
			}
            ...省略代码
	}
}

Stream创建和数据读写

Stream的创建一定是先在发送端创建的,然后通过一个SYN信号的发送到了接收方,Session.incomingStream的接收的stream就是从客户端发送过来的。

func (s *Session) OpenStream() (*Stream, error) {
	 ...省略代码
GET_ID:
	id := atomic.LoadUint32(&s.nextStreamID)
     ...省略代码
	if !atomic.CompareAndSwapUint32(&s.nextStreamID, id, id+2) {
		goto GET_ID
	}

	stream := newStream(s, id, streamInit)  //创建新的stream,注意streamInit 状态和上面状态迁移的图对应这看
	s.streamLock.Lock()
	s.streams[id] = stream //这边发送端注册stream 
	s.inflight[id] = struct{}{}
	s.streamLock.Unlock()
	if err := stream.sendWindowUpdate(); err != nil {  //通知接收方有新的stream创建,stream状态改成flagSYN,还把window的size告诉接收方
		select {
		case <-s.synCh:
		default:
			...省略错误处理代码
		}
		return nil, err
	}
	return stream, nil
}

这边对照这Session.incomingStream的代码一块看

func (s *Session) incomingStream(id uint32) error {
    ...省略错误处理代码
	stream := newStream(s, id, streamSYNReceived)  //id和客户端的一样。状态迁移
	s.streamLock.Lock()
	defer s.streamLock.Unlock()
	if _, ok := s.streams[id]; ok {
		...省略错误处理代码
		return ErrDuplicateStream
	}
	s.streams[id] = stream  //在接收到注册新的stream
	select {
	case s.acceptCh <- stream:  //通过 Session.acceptCh管道通知接收端有新的stream
		return nil
	default:
	...省略错误处理代码
	}
}

Stream的读取操作

func (s *Stream) Read(b []byte) (n int, err error) {
	defer asyncNotify(s.recvNotifyCh)
START:
	...省略状态判断代码

	s.recvLock.Lock()
	if s.recvBuf == nil || s.recvBuf.Len() == 0 {
		s.recvLock.Unlock()
		goto WAIT
	}

	n, _ = s.recvBuf.Read(b)
	s.recvLock.Unlock()

	err = s.sendWindowUpdate() //这边就是上文提到流控相关的代码,向发送端发送改变window大小的信息,调节(增加)发送端发送流量。
	return n, err

WAIT:
	var timeout <-chan time.Time
	var timer *time.Timer
	readDeadline := s.readDeadline.Load().(time.Time)
	if !readDeadline.IsZero() {  //读超时判断
		delay := readDeadline.Sub(time.Now())
		timer = time.NewTimer(delay)
		timeout = timer.C
	}
	select {
	case <-s.recvNotifyCh:  
		if timer != nil {
			timer.Stop()
		}
		goto START
	case <-timeout:
		return 0, ErrTimeout
	}
}

stream的写操作,yamux稍微做了下个封装,来处理由于window大小限制带来的分包发送问题。

func (s *Stream) Write(b []byte) (n int, err error) {
	s.sendLock.Lock()
	defer s.sendLock.Unlock()
	total := 0
	for total < len(b) { //被分包了
		n, err := s.write(b[total:]) 
		total += n
		if err != nil {
			return total, err
		}
	}
	return total, nil
}

func (s *Stream) write(b []byte) (n int, err error) {
	var flags uint16
	var max uint32
	var body io.Reader
START:
    ...省略状态判断代码
	window := atomic.LoadUint32(&s.sendWindow)
	if window == 0 {
		goto WAIT
	}

	flags = s.sendFlags()
	max = min(window, uint32(len(b)))
	body = bytes.NewReader(b[:max])
	s.sendHdr.encode(typeData, flags, s.id, max)     //封装header
	if err = s.session.waitForSendErr(s.sendHdr, body, s.sendErr); err != nil { //封装sendReady{Hdr: hdr, Body: body, Err: errCh}给 Session.sendCh 管道,然后Session.send会发送这个frame
	select {
	case s.sendCh <- ready:
		return 0, err
	}
	atomic.AddUint32(&s.sendWindow, ^uint32(max-1)) //减少sendWindow大小
	return int(max), err

WAIT:
	var timeout <-chan time.Time
	writeDeadline := s.writeDeadline.Load().(time.Time)
	if !writeDeadline.IsZero() { //写超时判断
		delay := writeDeadline.Sub(time.Now())
		timeout = time.After(delay)
	}
	select {
	case <-s.sendNotifyCh: //可以在发送的信号
		goto START
	case <-timeout:
		return 0, ErrTimeout
	}
	return 0, nil
}

总的来说,了解connection multiplexing的工作原理后在看代码会非常容易理解,如果不懂原理直接看代码就会非常晦涩难懂,特别是向golang这样,一个channel或者interface之后代码上下文就不好联系上。

总结

yamux的原理和代码分析到这边,我大致等了解它的工作原理,这对我们了解grpc和http2非常有帮助。yamux作为golang生态中优秀的connection multiplexing库目前被广泛用在p2p领域。

参考文档