Home / PostsPost

用systemd 管理你的进程

嘟噜聪2020/10/29 11:55:24 [System] [Systemd] [v2ray] [进程管理] [守护进程] 124人已阅

简介 进程管理一真是个比较头疼的问题,通常咱们会使用耳熟能详的Supervisor来管理我们的进程,但Supervisor也有它的问题。比如我就遇到过Supervisor卡死的问题。本文章介绍如何Systemd及如何配置一个Unit工,以v2ray client为例。

用systemd 管理你的进程

进程管理一真是个比较头疼的问题,通常咱们会使用耳熟能详的Supervisor来管理我们的进程,但Supervisor也有它的问题。比如我就遇到过Supervisor卡死的问题。

本文章介绍如何Systemd及如何配置一个Unit工,以v2ray client为例。

如果直接想看v2ray的配置,直接跳过介绍到最后看案例v2ray client 的unit案例

Systemd

SystemD是一个专用于 Linux 操作系统的系统与服务管理器。当作为启动进程(PID=1)运行时,它将作为初始化系统运行,也就是启动并维护各种用户空间的服务。 作为系统初始化系统,systemd 的最大特点有两个:

  • 令人惊奇的激进的并发启动能力,极大地提高了系统启动速度;
  • 用 CGroup 统计跟踪子进程,干净可靠。

Systemd 必须基于CentOS7及以上的系统版本运行。

Unit

系统初始化要做很多工作,如挂在文件系统,配置交换分区等等,这都可以看做是一个配置单元,Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。Systemd把配置单元分成分成12种:

  • Service unit:系统服务
  • Target unit:多个 Unit 构成的一个逻辑分组,可以当成是SystemV中的运行级。
  • Device Unit:硬件设备
  • Mount Unit:文件系统的挂载点,systemd据此进行自动挂载,为了与SystemV兼容,目前systemd自动处理/etc/fstab并转化为mount
  • Automount Unit:自动挂载点
  • Path Unit:文件或路径
  • Scope Unit:不是由 Systemd 启动的外部进程
  • Slice Unit:进程组
  • Snapshot Unit:Systemd 快照,可以切回某个快照
  • Socket Unit:进程间通信的 socket
  • Swap Unit:配置swap交换分区文件
  • Timer Unit:定时器。用来定时触发用户定义的操作,它可以用来取代传统的atd,crond等。

每一个配置单元都有一个对应的配置文件,系统管理员的任务就是编写和维护这写不同的配置文件, 用这个配置文件来告诉 Systemd 怎么启动这个 Unit ,比如一个Redis服务对应一个redis.service文件。

Systemd 默认从目录/etc/systemd/system/读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/,真正的配置文件存放在那个目录。

一般用户的Unit会存在/usr/lib/systemd/system/目录下,而系统的一般会存在/etc/systemd/system//lib/systemd/system/目录下。通常情况下我们一般放在用户的Systemd目录下。

配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket。如果省略,Systemd 默认后缀名为.service,所以sshd会被理解成sshd.service。

依赖关系

Systemd并不能完全解除各个单元之间的依赖关系,如物理设备单元准备就绪之前,不可能执行挂载单元。为此需要定义各个单元之间的依赖关系。有依赖的地方就会有出现死循环的可能,比如A依赖于B,B依赖于C,C依赖于A,那么导致死锁。Systemd为此提供了两种不同程度的依赖关系,一个是require,一个是want,出现死循环时,Systemd会尝试忽略want类型的依赖,如仍不能解锁,那么systemd报错。

Unit配置文件结构

配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如[Unit]。注意:

  • 配置文件的区块名和字段名,都是大小写敏感的。
  • 每个区块内部是一些等号连接的键值对,键值对的等号两侧不能有空格。

    [Unit]
    Description=ATD daemon
    
    [Service]
    Type=forking
    ExecStart=/usr/bin/atd
    
    [Install]
    WantedBy=multi-user.target
    

[Unit]区块

[Unit]区块通常是配置文件的第一个区块。用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。

  • Description:简短描述
  • Documentation:文档地址
  • Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败
  • Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败
  • BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行
  • Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动
  • After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动
  • Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行
  • Condition...:当前 Unit 运行必须满足的条件,否则不会运行
  • Assert...:当前 Unit 运行必须满足的条件,否则会报启动失败

[Service]区块

[Service]区块用来定义如何启动当前服务,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。

  • Type:定义启动时的进程行为。它有以下几种值。
  • Type=simple:默认值,执行ExecStart指定的命令,启动主进程
  • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
  • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
  • Type=dbus:当前服务通过D-Bus启动
  • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
  • Type=idle:若有其他任务执行完毕,当前服务才会运行
  • ExecStart:启动当前服务的命令
  • ExecStartPre:启动当前服务之前执行的命令
  • ExecStartPost:启动当前服务之后执行的命令
  • ExecReload:重启当前服务时执行的命令
  • ExecStop:停止当前服务时执行的命令
  • ExecStopPost:停止当其服务之后执行的命令
  • RestartSec:自动重启当前服务间隔的秒数
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdog
  • TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数
  • Environment:指定环境变量

[Install]区块

[Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下。

  • WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 +.wants后缀构成的子目录中
  • RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
  • Alias:当前 Unit 可用于启动的别名
  • Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

Unit管理

Unit进程管理命令

  • systemctl enable: 命令用于在上面两个目录之间,建立符号链接关系。如果配置文件里面设置了开机启动,systemctl enable命令相当于激活开机启动。

    $ systemctl enable nginx.service
        
    // 等同于
    $ ln -s '/usr/lib/systemd/system/nginx.service' '/etc/systemd/system/multi-user.target.wants/nginx.service'
    
  • systemctl disable: 撤销符号链接关系,相当于撤销开机启动。

    $ systemctl disable nginx.service
    
  • systemctl list-unit-files: 显示每个配置文件的状态。而每个配置文件的状态,一共有四种

    • enabled:已建立启动链接
    • disabled:没建立启动链接
    • static:该配置文件没有[Install]部分(无法执行),只能作为其他配置文件的依赖
    • masked:该配置文件被禁止建立启动链接

      // 列出所有配置文件 
      $ systemctl list-unit-files
          
      // 列出指定类型的配置文件
      $ systemctl list-unit-files --type=service
      
  • systemctl list-units: 查看当前系统的所有 Unit

    // 列出正在运行的 Unit
    $ systemctl list-units
        
    // 列出所有Unit,包括没有找到配置文件的或者启动失败的
    $ systemctl list-units --all
        
    // 列出所有没有运行的 Unit
    $ systemctl list-units --all --state=inactive
        
    // 列出所有加载失败的 Unit
    $ systemctl list-units --failed
        
    // 列出所有正在运行的、类型为 service 的 Unit
    $ systemctl list-units --type=service
    
  • systemctl status: 用于查看系统状态和单个 Unit 的状态

    $ systemctl status v2ray
    ● v2ray.service - V2Ray Service
       Loaded: loaded (/usr/lib/systemd/system/v2ray.service; enabled; vendor preset: disabled)
       Active: active (running) since Wed 2020-10-28 20:20:46 CST; 13h ago
         Docs: https://www.v2fly.org/
     Main PID: 27085 (v2ray)
        Tasks: 10 (limit: 26213)
       Memory: 14.4M
       CGroup: /system.slice/v2ray.service
               └─27085 /usr/local/bin/v2ray -config /usr/local/etc/v2ray/config.json
    ...
    

其他一些常用命令:

// 显示某个 Unit 是否正在运行
$ systemctl is-active nginx.service
// 显示某个 Unit 是否处于启动失败状态
$ systemctl is-failed nginx.service
// 显示某个 Unit 服务是否建立了启动链接
$ systemctl is-enabled nginx.service
// 立即启动一个服务
$ systemctl start nginx.service
// 立即停止一个服务
$ systemctl stop nginx.service
// 重启一个服务
$ systemctl restart nginx.service
// 杀死一个服务的所有子进程
$ systemctl kill nginx.service
// 重新加载一个服务的配置文件
$ systemctl reload nginx.service
// 重载所有修改过的配置文件, **每次修改过unit文件必须执行,否则不生效**
$ systemctl daemon-reload
// 显示某个 Unit 的所有底层参数
$ systemctl show nginx.service
// 显示某个 Unit 的指定属性的值
$ systemctl show -p CPUShares nginx.service
// 设置某个 Unit 的指定属性
$ systemctl set-property nginx.service CPUShares=500
// 列出一个 Unit 的所有依赖。
$ systemctl list-dependencies nginx.service
// 上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如果要展开 Target,就需要使用--all参数。
$ systemctl list-dependencies --all nginx.service

Unit的日志管理

Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf。journalctl功能强大,用法非常多。

// 查看所有日志(默认情况下 ,只保存本次启动的日志)
$ journalctl
// 查看内核日志(不显示应用日志)
$ journalctl -k
// 查看系统本次启动的日志
$ journalctl -b
$ journalctl -b -0
// 查看上一次启动的日志(需更改设置)
$ journalctl -b -1
// 查看指定时间的日志
$ journalctl --since="2012-10-30 18:17:16"
$ journalctl --since "20 min ago"
$ journalctl --since yesterday
$ journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ journalctl --since 09:00 --until "1 hour ago"
// 显示尾部的最新10行日志
$ journalctl -n
// 显示尾部指定行数的日志
$ journalctl -n 20
// 实时滚动显示最新日志
$ journalctl -f
// 查看指定服务的日志
$ journalctl /usr/lib/systemd/systemd
// 查看指定进程的日志
$ journalctl _PID=1
// 查看某个路径的脚本的日志
$ journalctl /usr/bin/bash
// 查看指定用户的日志
$ journalctl _UID=33 --since today
// 查看某个 Unit 的日志
$ journalctl -u nginx.service
$ journalctl -u nginx.service --since today
// 实时滚动显示某个 Unit 的最新日志
$ journalctl -u nginx.service -f
// 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today
// 查看指定优先级(及其以上级别)的日志,共有8级
// 0: emerg
// 1: alert
// 2: crit
// 3: err
// 4: warning
// 5: notice
// 6: info
// 7: debug
$ journalctl -p err -b
// 日志默认分页输出,--no-pager 改为正常的标准输出
$ journalctl --no-pager
// 以 JSON 格式(单行)输出
$ journalctl -b -u nginx.service -o json
// 以 JSON 格式(多行)输出,可读性更好
$ journalctl -b -u nginx.serviceqq -o json-pretty
// 显示日志占据的硬盘空间
$ journalctl --disk-usage
// 指定日志文件占据的最大空间
$ journalctl --vacuum-size=1G
// 指定日志文件保存多久
$ journalctl --vacuum-time=1years

v2ray client 的unit案例

安装客户端

  1. 下载、解压v2ray-core:

    $ wget https://github.com/v2ray/v2ray-core/releases/download/v4.28.2/v2ray-linux-64.zip
    $ unzip v2ray-linux-64.zip
    
  2. 将执行文件及配置文件挪到/usr/local/目录

    // 创建配置目录
    $ mkdir -p /usr/local/etc/v2ray/
    // 挪配置文件
    $ mv config.json /usr/local/etc/v2ray/
    // 挪执行文件
    $ mv v2ray /usr/local/bin/
    $ mv v2ctl /usr/local/bin/
    

配置v2ray client的Systemd unit

  1. /usr/lib/systemd/system/目录下创建一个v2ray.service文件,内容能考:
[Unit]
Description=V2Ray Service
Documentation=https://www.v2fly.org/
After=network.target nss-lookup.target

[Service]
User=nobody
CapabilityBoundingSet=CAP_NET_ADMIN CAP_NET_BIND_SERVICE
AmbientCapabilities=CAP_NET_ADMIN CAP_NET_BIND_SERVICE
NoNewPrivileges=true
ExecStart=/usr/local/bin/v2ray -config /usr/local/etc/v2ray/config.json
Restart=on-failure

[Install]
WantedBy=multi-user.target
  1. 设置系统自启动

    $ systemctl enable v2ray
    
  2. 启动system unit

    $ systemctl start v2ray
    
  3. 查询运行状态

    $ systemctl status v2ray
    

查询v2ray运行日志

$ journalctl -exfu v2ray.service
-- Logs begin at Tue 2020-10-27 20:10:19 CST, end at Thu 2020-10-28 20:36:37 CST. --
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: Started V2Ray Service.
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: v2ray.service: Main process exited, code=exited, s>
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: v2ray.service: Failed with result 'exit-code'.
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: v2ray.service: Service RestartSec=100ms expired, s>
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: v2ray.service: Scheduled restart job, restart coun>
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: Stopped V2Ray Service.
Oct 28 20:36:11 iZwz92jeancylnv2hhaquyZ systemd[1]: Started V2Ray Service.
Oct 28 20:37:00 iZwz92jeancylnv2hhaquyZ v2ray[27085]: 2020/10/28 20:36:00 [Info] [233990051] v2ray.com/core/app/proxyman/outbound: failed to process outbound traffic > v2ray.com/core/proxy/vmess/outbound: connection ends > websocket: close 1000 (normal)
Oct 29 20:37:00 iZwz92jeancylnv2hhaquyZ v2ray[27085]: 2020/10/28 20:36:00 [Info] [233990051] v2ray.com/core/app/proxyman/inbound: connection ends > v2ray.com/core/proxy/http: connection ends > io: read/write on closed pipe
Oct 29 20:37:01 iZwz92jeancylnv2hhaquyZ v2ray[27085]: 2020/10/28 20:36:01 [Info] [2378677143] v2ray.com/core/proxy/vmess/outbound: tunneling request to tcp:mws-eu.amazonservices.com:443 via tcp:els01.kulime.space:10020

尾巴

systemd很方便的解决了go语言或其他语言编译后的系统在linux系统上运行的进程管理的问题,如果使用的是Docker,那这个文字就没什么卵用。

关于systemd更多的介绍可以查看官方信息: https://www.freedesktop.org/software/systemd/man/systemd.unit.html

参考: linux-进程管理工具SystemD

很赞哦! (4)

文章评论

站点信息

  • 微信公众号