2020-05-20

Linux

如何评估一个进程占用的内存空间

Linux提供了非常丰富的手段，供我们来评估一个进程的内存占用。top，/proc/[pid]/status，/proc/[pid]/statm等等。什么RSS，RES，VIRT，到底哪个才是真正的进程使用内存量？

有没有简单的手段直接就能知识一个进程的内存占用？很遗憾地说，没有。因为内存的使用，本来就不简单。

但是我们可以找到相对简单的方式。

进程的内存分布

我们要先从进程的内存分布说起。Linux下，一个进程的内存分布如下：

进程内存分布

从低到高，分别包括：

文本段，也叫代码段，是对象文件或内存中程序的一部分，其中包含可执行指令。通常代码段是共享的，对于经常执行的程序，只有一个副本需要存储在内存中，代码段是只读的，以防止程序以外修改指令。
初始化的数据段，是程序的虚拟地址空间的一部分，它包含有程序员初始化的全局变量和静态变量，可以进一步划分为只读区域和读写区域。例如，C中的char=“hello world”的全局字符串，以及main(例如全局)之外的int debug=1这样的C语句。
未初始化的数据段，通常称为bss段，这个段的数据在程序开始之前有内核初始化为0，包含所有初始化为0和没有显示初始化的全局变量和静态变量，
堆，堆是动态内存分配通常发生的部分。堆是由程序员自己分配的（malloc kmalloc等）。堆区域由所有共享库和进程中动态加载的模块共享。
栈，存放临时变量，以及每次调用函数时调用栈。每当调用一个函数时，返回到的地址和关于调用者环境的某些信息的地址，比如一些机器寄存器，就会被保存在栈中。然后，新调用的函数在栈上分配空间，用于自动和临时变量。

要评估一个进程的内存占用，就是要把以上几个段的内存占用一一加起来。

Linux环境下内存信息的几个来源

/proc/[pid]/status

此文件包含了有关内存使用情况的重要信息，以Vm为前缀。

VmPeak / VmSize：最大/当前进程正在占用的内存总大小。听起来不错，但实际上，这并不是一个好的评估内存的数据的办法。因为它包含了 1）申请但实际上未使用的内存。（malloc一段地址空间，但不使用它） 2）共享库使用的代码段地址空间，会被多个进程的VmSize同时统计。即存在重复统计的问题。
VmHWM / VmRss：最大时/当前应用程序正在使用的物理内存的大小。没有被交换到swap的内存。是评估进程内存使用量的重要依据。
VmData：包含initialized data+bss+heap。通常不准确，原因是heap的大小不准确。系统常常出于优化性能的考虑，多申请栈空间。
VmExe：代码段中不包含lib的部分，即进程可执行文件的部分
VmLib：代码段中lib的部分。

VmSize = VmRss + 申请但未使用的内存块

/proc/[pid]/smap

这个文件反应了运行时的进程的在内存中的完整分布。这是一张完整的清单。通过它可以看到对应进程所关联的所有的内存信息（包含共享的，和私有的）

smap示例：

7fc4d49df000-7fc4d49e1000 rw-p 001eb000 08:01 2102913                    /lib/x86_64-linux-gnu/libc-2.27.so
Size:                  8 kB
KernelPageSize:        4 kB
MMUPageSize:           4 kB
Rss:                   0 kB
Pss:                   0 kB
Shared_Clean:          0 kB
Shared_Dirty:          0 kB
Private_Clean:         0 kB
Private_Dirty:         0 kB
Referenced:            0 kB
Anonymous:             0 kB
LazyFree:              0 kB
AnonHugePages:         0 kB
ShmemPmdMapped:        0 kB
Shared_Hugetlb:        0 kB
Private_Hugetlb:       0 kB
Swap:                  8 kB
SwapPss:               8 kB
Locked:                0 kB
THPeligible:		0

几个关键字段：

Rss：是进程的物理内存占用，包括进程本身和所有链接库，RSS = private + share
Pss：链接库的共享内存平摊计算后的使用内存，（比如一个动态库有5个人引用，则将其代码段和共享内存除于5），PSS = private + share / share_num
Shared_Clean：和其他进程共享的未改写页面
Shared_Dirty：和其他进程共享的已改写页面
Private_Clean：未改写的私有页面页面
Private_Dirty：已改写的私有页面页面

其中：
private = private_clean + private_dirty：这个数据一般能够比较准确反映一个进程内部占用的内存，在内存优化的时候使用这个作为参考值比较合理，进程的物理内存占用就是smaps中所有的private的相加（链接的动态库的也要统计进去）。

总结

/proc/[pid]/status中，VmSize 因包含重复统计和未实际使用的内存，存在夸大的情况。VmHWM / VmRss 是相对理想的内存评估依据。
想要得到确定的内存使用量，将/proc/[pid]/smap中的所有Private_Clean和Private_Dirty累加起来，是很好的解决方案。

2020-05-04

日记

打蚊子与找bug

昨晚和蚊子斗争了一晚上，斗争到睡不着。得出感悟，以下：

打蚊子的一晚上	找bug的一晚上
一关灯蚊子就出来嗡嗡嗡，但是开灯手握电蚊拍，它就不见踪影。	一上生产环境bug就出现，但是打开调试开关，它就不复现。
好不容易打死一只，另一只又出来嗡嗡嗡，永远不知道房子里一共有多少只蚊子。	好不容易修复一个bug，又有别的bug出现，永远不知道程序里到底有多少bug。
不打死蚊子，撑起蚊帐，让蚊子不影响睡眠。	搞不定bug，引入规避手段，让bug不影响程序的核心功能。继续运行

结论：打蚊子与找bug真是一模一样。

2020-01-24

Docker

用docker打包一个demo image

目标

用docker打包一个image，这个image的容器实现打包输出”hello docker”

打包过程

搜索基线

我们计划使用echo命令打印，echo命令基于bash。因此，我们先搜索看看是否有bash相关的image。

~$ sudo docker search bash
NAME                           DESCRIPTION                                     STARS               OFFICIAL            AUTOMATED
bash                           Bash is the GNU Project's Bourne Again SHell    232                 [OK]                
basho/riak-kv                  Docker image for running a minimal Riak KV c…   29                                      
...

可以看到官方的bash image。因此我们可以基于此image来打包生成我们自己的image。

Dockerfile编写

创建一个目录hello_docker，在下面创建子目录app，Dockerfile，和脚本hello.sh

spencer@ubuntu:~/my_docker/hello_docker$ tree .
.
├── app
├── Dockerfile
└── hello.sh

hello.sh中，就是我们的容器需要执行的指令。

1	echo "hello docker"

Dockerfile是此步的关键，其内容是：

FROM bash
WORKDIR /app
COPY hello.sh .
CMD [ "bash", "hello.sh" ]

解释：

FROM: 表示当前image基于bash这个官方image来打包
WORKDIR: 指定容器工作目录，此目录下的内容，才会被打包进容器
COPY: 将脚本拷贝进工作目录。注意，此命令的第一个参数是基于宿主机上的当前路径的，也就是Dockerfile所在的目录的相对路径，第二个参数的是基于WORKDIR的相对路径（此例中是app目录）
CMD: 指定了容器运行起来后，默认要执行的脚本

可以看出，Dockerfile中，除了CMD指令外，其它指令即是在告诉docker框架，如何一步一步地生成image。

打包生成容器

执行以下命令打包：

1	docker image build -t hello_docker .

打包完成后，验证一下image已生成

1
2
3

spencer@ubuntu:~$ docker image ls
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
hello_docker        latest              39dc2cd8ee2b        16 minutes ago      15.2MB

运行容器

1 2	spencer@ubuntu:~$ docker run hello_docker hello docker

搞定！

Dockerfile是打包image的关键，此例中只用到了简单的几个。如果想进一步了解Dockerfile，请参考这里。

2018-08-20

通信

SDN环境下的网络流量识别

近来成了一篇论文，发表于IHMSC 2018。把近来学习的神经网络知识应用到网络流量识别中。

论文主旨

这篇论文并没有高深的理论研究，可以说是一篇纯应用性质的论文。
把SDN与神经网络结合起来，去实现一个网络流量分类系统。
SDN与神经网络可以说是一对神仙CP。

SDN：

全局性的网络抽象，很方便地收集大量流量特征
在服务器端可以提供快速的算力支持
网络可编程

神经网络：

需要大量的数据以供训练
需要大算力

把这对神仙CP结合起来，SDN负责收集训练流量数据，用于训练神经网络。然后将实时流量数据，输入到训练好的神经网络中，即可得到实时的流量分类数据。

实际的SDN APP在系统中的位置

系统结构图

论文下载

下载链接

感恩

让我比较感恩的是，这个论文研究纯属兴趣，与公司的工作没有太大的关系。但主管仍然对我的研究给予了支持。在一个纯工程团队中，能让我有机会做算法的研究与应用。
更让我高兴的一点是：在论文发表了半年之后，这份研究的成果也反哺了公司中一个项目，应用到实际项目中，反哺了公司对我的投资。

小耸的博客 Spencer's Blog

Laugh and the world laughs with you, weep and you weep alone.