零拷贝基本介绍

  1. 零拷贝是网络编程的关键,很多性能优化都离不开。
  2. 在 Java 程序中,常用的零拷贝有 mmap(内存映射) 和 sendFile。那么,他们在OS 里,到底是怎么样的一个的设计?我们分析 mmap 和 sendFile 这两个零拷贝
  3. 另外我们看下NIO 中如何使用零拷贝

传统IO数据读写

  1. Java 传统 IO 和 网络编程的一段代码
    1
    2
    3
    4
    5
    6
    File file = new File("test.txt");
    RandomAccessFile raf = new RandomAccessFile(file, "rw");
    byte[] arr = new byte[(int) file.length()];
    raf.read(arr);
    Socket socket = new ServerSocket(8080).accept();
    socket.getOutputStream().write(arr);

在这里插入图片描述
DMA: direct
memory access
直接内存拷贝(不使用CPU)

mmap 优化

  1. mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样,在进行网络传输时,就可以减少内核空间到用户控件的拷贝次数。如下图
    在这里插入图片描述

sendFile 优化

1.
Linux 2.1 版本 提供了sendFile 函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到 SocketBuffer,同时,由于和用户态完全无关,就减少了一次上下文切换

1.
示意图和小结提示:零拷贝从操作系统角度,是没有cpu 拷贝
在这里插入图片描述

1.
Linux 在 2.4 版本中,做了一些修改,避免了从内核缓冲区拷贝到 Socketbuffer 的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。具体如下图和小结:
4)这里其实有 一次cpu 拷贝kernel buffer -> socket buffer但是,拷贝的信息很少,比如lenght , offset , 消耗低,可以忽略
在这里插入图片描述

零拷贝的再次理解

  1. 我们说零拷贝,是从操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有 kernel buffer 有一份数据)。
  2. 零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪共享以及无 CPU 校验和计算。

mmap 和 sendFile 的区别

  1. mmap 适合小数据量读写,sendFile 适合大文件传输。
  2. mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
  3. sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket

案例

使用NIO 零拷贝方式传递(transferTo)一个大文件

server

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
package com.jhj.zerocopy;

import java.net.InetSocketAddress;
import java.net.ServerSocket;
import java.nio.ByteBuffer;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;


//服务器端
public class NewIoServer {

public static void main(String[] args) throws Exception{

InetSocketAddress inetSocketAddress = new InetSocketAddress(7001);

ServerSocketChannel open = ServerSocketChannel.open();

ServerSocket socket = open.socket();

socket.bind(inetSocketAddress);

//创建buffer
ByteBuffer allocate = ByteBuffer.allocate(4096);
while (true){

SocketChannel accept = open.accept();

int readcount=0;
while (-1!=readcount){

try {

readcount=accept.read(allocate);
}catch (Exception e){

// e.printStackTrace();
break;
}
//让buffer倒带 position=0 mark作废
allocate.rewind();
}

}
}
}

client

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
package com.jhj.zerocopy;

import java.io.FileInputStream;
import java.net.InetSocketAddress;
import java.nio.channels.FileChannel;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;

public class NewIoClient {

public static void main(String[] args) throws Exception {

SocketChannel open = SocketChannel.open();

open.connect(new InetSocketAddress("localhost",7001));

String fileName="F:\\1.txt";

//得到文件channel
FileChannel channel = new FileInputStream(fileName).getChannel();
//准备发送
long start = System.currentTimeMillis();

/**
* transferTo底层使用零拷贝
* 在linux下一个transferTo方法就可以完成传输
* 在windows下 一次调用transferTo 只能发送8m,就需要分段传输 如果大于8M 就需要循环
* int count = (int) Math.ceil(channel.size() / 8388608.0);
* long l=0;
* for (int i = 0; i < count-1; i++) {
*
* l+=channel.transferTo(i * 8388608, (i + 1) * 8388608, open);
* }
* l+=channel.transferTo((count - 1) * 8388608, channel.size(), open);
*
* 参数1 位置
* 参数2 大小
* 参数3 通道
*/


long l = channel.transferTo(0, channel.size(), open);

System.out.println("发送总的字节数="+l+"耗时"+(System.currentTimeMillis()-start));

//关闭通道
channel.close();
}
}

作者声明

1
如有问题,欢迎指正!