💠

1. IO
- 1.1. IO中断
- 1.2. DMA
- 1.3. 零拷贝
1. 文件管理
- 2.1. 查找文件
  - 2.1.1. find
- 2.2. 查看文件
  - 2.2.1. stat
  - 2.2.2. file
  - 2.2.3. tree
  - 2.2.4. ls
  - 2.2.5. wc
  - 2.2.6. cat
  - 2.2.7. less
  - 2.2.8. tail
  - 2.2.9. head
  - 2.2.10. ldd
- 2.3. 比较文件内容
  - 2.3.1. diff
  - 2.3.2. meld
  - 2.3.3. VsCode
- 2.4. 文件变更命令
  - 2.4.1. rename
  - 2.4.2. chown
  - 2.4.3. chgrp
  - 2.4.4. ln
  - 2.4.5. cp
  - 2.4.6. rm
  - 2.4.7. mv
  - 2.4.8. 文件的分割与合并
  - 2.4.9. 监控文件变更
- 2.5. 默认字符编码
1. 磁盘
- 3.1. 文件系统
  - 3.1.1. ext3 ext4
  - 3.1.2. Tmpfs
- 3.2. 安装系统时基本分区
- 3.3. 设备列表
- 3.4. 常用命令
  - 3.4.1. dd
  - 3.4.2. truncate
  - 3.4.3. mount
  - 3.4.4. fdisk
  - 3.4.5. fsck
  - 3.4.6. df
  - 3.4.7. du
1. 日志
- 4.1. Systemd
- 4.2. 应用日志
1. DFS
- 5.1. Samba
  - 5.1.1. 搭建匿名Samba服务器
1. Tips
- 6.1. 善用*shrc文件
- 6.2. 善用alias
- 6.3. desktop文件

💠 2025-03-02 19:53:11

IO

对于一次Network IO (这里我们以read举例)，它会涉及到两个系统对象:

调用这个 IO 的用户线程 (process/thread)
系统内核(kernel)

当一次 read 操作发生时，它会经历两个阶段：

等待数据准备 (Waiting for the data to be ready)
将数据从内核缓存中拷贝到用户缓存(用户进程)中 (Copying the data from the kernel to the process)

记住这两点很重要，因为这些 IO Model 的区别就是在两个阶段上各有不同的情况。对于常见的网络通信场景：网卡复制到内核空间再复制到用户空间

同步和异步的概念描述的是用户线程与内核的交互方式
阻塞和非阻塞的概念描述的是用户线程调用内核IO操作的方式

IO中断

DMA

零拷贝

Wiki

什么是零拷贝？
零拷贝(Zero-copy) 浅析及其应用

用户态IO mmap + write sendfile sendfile + DMA gather copy splice 写时复制缓冲区共享

拷贝方式	CPU拷贝	DMA拷贝	系统调用	上下文切换
传统方式(read + write)	2	2	read / write	4
内存映射(mmap + write)	1	2	mmap / write	4
sendfile	1	2	sendfile	2
sendfile + DMA gather copy	0	2	sendfile	2
splice	0	2	splice	2

文件管理

Linux中认为万物皆文件

cd - 跳转到上一个目录
cd !$ 把上个命令的参数作为cd参数使用。

用文件头标识判断文件类型而不是Windows那样默认以文件后缀来判断

yazi

查找文件

silversearcher-ag 快速搜索文件的内容

find

find . -name "*.txt" 查找当前目录的txt后缀的文件
sudo find / -name a.java 全盘查找
find -type f -name README.md 默认当前目录查找
- d 文件夹 f 普通文件 l 符号链接文件 b 块设备 c 字符设备 p 管道文件 s 套接字
find . -mmin -30 查找最近30分钟修改的文件
exec 嵌入一个命令
1. 找到所有pdf移动到指定目录 find . -name "*.pdf" -exec mv {} /home/test \;
2. 把当前目录下面的file（不包括目录)，移动到/opt/shell
  - find . -type f -exec mv {} /opt/shell \;
  - find . -type f | xargs -I '{}' mv {} /opt/shell
3. 解压目录下所有zip文件 find . -name "*.zip" -exec unzip {} \;

实践

递归删除目录下所有run后缀的文件 find . -name "*.run" | xargs rm -f
- 递归当前文件夹下所有 log 找到 ERROR日志 find -name "*.log" | xargs grep ERROR
查找文件内容 find etc/ |xargs grep -i java

fzf

locate

预先建立数据库，依此查询速度较快，但是有时效问题

Anything

图形化搜索文件工具，也是预先建立数据库

Synapse

搜索文件启动应用等功能

查看文件

stat

查看文件详细信息 stat filename

file

file a.txt 查看文件类型
- -i 输出文件的MIME类型
  - file -b --mime-type filename | sed 's|/.*||' 获取MIME短名称
- -F “#” 修改输出分隔符

tree

展示目录结构
- -p 匹配
- -h 可读的显示文件大小
- -F 和ls一样
- -L 目录深度

ls

参数
- i 详情
- a 全部包含隐藏文件 <> A 不显示当前目录和上级目录 . ..
- l 使用较长格式列出信息详细信息
- h 人类可阅读
- F 标明文件夹,文件,可执行文件
- w 100 限制输出每行的字符长度 0 则是无限制和 l 共用就则无视该限制
- R 递归显示所有子文件夹
- r 逆序
- B 不列出以〜结尾的隐含条目
- t 按修改时间从顶至下,一般不单用,和 g|l 结合一起用
- c 按ctime(创建时间)一般是文件夹,文件则是修改时间排列
  - 和 lt|gt 一起用即 ls -clt 同上的排列顺序
- S 按文件大小逆序展示
执行ls -l 命令后的输出
1. 输出类型：d 目录 l 软链接 b 块设备 c 字符设备 s socket p 管道 - 普通文件
2. 输出权限信息：r 读权限 w 写权限 x 执行权限
  - rwx有三个，是因为 拥有者，所属用户组其他用户 代表的rwx权限
  - chmod 700 文件 就是只设置拥有者具有读写权限
  - 加减权限操作 chmod go-rw 文件 g group o others u user +- 增减权限
3. 硬链接数一般你可以理解成子目录数（对于普通文件，总是1，对于目录来说，为对应目录的 下一级子目录的个数 +2 (+2是由于 . 和 .. 的原因））
4. 最后是归属用户和用户组, 大小, 最后修改日期
ls -lFh 列出所有文件的详细信息, 并且文件大小是人类可阅读的

改进版

wc

wc [-lmw] 参数说明： -l :多少行-m:多少字符 -w:多少字
cat mul.sh | wc -l
wc -l mul.sh

cat

类似的还有 nl more less most(支持多文件)

带行号输出 cat -n file 或者 nl file但是空行不会编号, 除非这样: nl -b a file

改进版

less

该命令的导航是和Vi体系一样的, 建议打开大文件使用less或者more 如果用vim,文件全加载到内存了
诸多软件使用到了分页, 怀疑就是借助less实现的, 因为快捷键一模一样, 例如 man命令, 各个软件的-h, git的log 等等..优点很多
less命令简介
h 查看帮助文档 z/b 上下翻页 g/G 文件首/尾
F 监听文件
当打开多个文件时 :n和:p 表示 next pre　也就是　下一个，上一个文件

syntax-highlighting
Make the less Command More Powerful

install source-highlight

append to *sh.rc

1
2
3


# sh 在不同的系统 路径和名字都有可能不一样
export LESSOPEN="| /usr/bin/source-highlight-esc.sh %s"
export LESS=' -R'

环境变量

存储了less搜索操作的历史 LESSHISTFILE=~/.lesshst

tail

tail命令用于输入文件中的尾部内容。tail命令默认在屏幕上显示指定文件的末尾10行。来自: http://man.linuxde.net/tail
--retry：即是在tail命令启动时，文件不可访问或者文件稍后变得不可访问，都始终尝试打开文件。此选项需要与选项“——follow=name”连用；
-c或——bytes=：输出文件尾部的N（N为整数）个字节内容；
-f或；--follow：显示文件最新追加的内容。“name”表示以文件名的方式监视文件的变化。“-f”与“-fdescriptor”等效；
-F：与选项“-follow=name”和“–retry"连用时功能相同；
-n或——line=：输出文件的尾部N（N位数字）行内容。
--pid=<进程号>：与“-f”选项连用，当指定的进程号的进程终止后，自动退出tail命令；
-q或——quiet或——silent：当有多个文件参数时，不输出各个文件名；
-s<秒数>或——sleep-interal=<秒数>：与“-f”选项连用，指定监视文件变化时间隔的秒数；
-v或——verbose：当有多个文件参数时，总是输出各个文件名；

1
2
3


    tail file （显示文件file的最后10行） 
    tail +20 file （显示文件file的内容，从第20行至文件末尾） 
    tail -c 10 file （显示文件file的最后10个字符）

head

查看文件头部, 默认前十行使用 -n 指定行数

ldd

查看二进制执行文件依赖的动态库

比较文件内容

阮一峰: 读懂diff

diff

参考博客 linux下比较两个文本文件的不同

diff a b 输出的 < 表示a转为b文件时要删除的行 > 表示要增加的行

meld

Github: meld

可用于 git svn 查看差异
选两个或三个文件去查看差异，完成patch补入

VsCode

code –diff

kdiff3 vimdiff

文件变更命令

rename

rename命令的使用(基于perl)

rename "s/.html/.php/" * //把.html 后缀的改成 .php后缀
rename "s/$/.txt/" * //把所有的文件名都以txt结尾
rename "s/.txt//" * //把所有以.txt结尾的文件名的.txt删掉
rename "s/AA/aa/" * //把文件名中的AA替换成aa
rename "s/ - 副本/_bak/" * 将文件-副本结尾改成_bak结尾

chown

chown [-R] 账号名称文件或目录
chown [-R] 账号名称:用户组名称文件或目录

chgrp

更改文件所属用户组 chgrp group file
- -R 递归子目录

ln

ln path path 默认创建硬链接
ln -s 源文件或目录目标绝对路径 生成软链接（快捷方式）

硬链接：只能链接文件，原始路径下文件删除后，能通过硬链接访问到原文件即文件没有真正删除，只是引用数减一
软链接：相当于快捷方式，原始文件或目录删除后，软链接也会失效

cp

cp cp -ri 目录或正则目录 目录所有文件复制过去
- a 该选项通常在拷贝目录时使用。它保留链接、文件属性，并递归地拷贝目录，其作用等于dpR选项的组合。
- d 拷贝时保留链接。
- f 删除已经存在的目标文件而不提示。
- i 和f选项相反，在覆盖目标文件之前将给出提示要求用户确认。回答y时目标文件将被覆盖，是交互式拷贝。
- p 此时cp除复制源文件的内容外，还将把其修改时间和访问权限也复制到新文件中。
- r 若给出的源文件是一目录文件，此时cp将递归复制该目录下所有的子目录和文件。此时目标文件必须为一个目录名。
- l 不作拷贝，只是链接文件。

progresscp mv等命令执行时，输出进度提示,剩余耗时

rm

rm rm -rf 目录 不提示性删除
- f 忽略不存在的文件，从不给出提示。
- r 指示rm将参数中列出的全部目录和子目录均递归地删除。
- i 进行交互式删除(y/n的询问)。

特别注意 rm -rf link 文件时, 如果只是想删除link文件那么就不要在link文件后加上 / 例如:
rm -rf linkDir/ 这个命令是将 link到的目录下的文件全部删除而不是删除link文件本身

mv

mv mv 目录或正则目录 移动
- I 交互方式操作。如果mv操作将导致对已存在的目标文件的覆盖，此时系统询问要求用户回答y或n，这样可以避免误覆盖文件。
- f 禁止交互操作。在mv操作要覆盖某已有的目标文件时不给任何指示，指定此选项后，i选项将不再起作用。

文件的分割与合并

参考: 文件过滤分割与合并

分割

split
1. 指定行数分割 split -l 300 log.txt newfile
2. 指定文件大小 split -b 500m log.txt newfile

合并

最简单就是 cat file1 file2 > result

监控文件变更

原理是通过监听文件变更时发出的 signal

借助 inotify-tool 包更容易使用
- inotifywait
- inotifywatch
持续监听某目录变更 inotifywait -mrq --timefmt '%d/%m/%y %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib /home/kcp/test/git-test

默认字符编码

查看当前编码 locale 或者 echo $LANG

修改编码 /etc/profile

1
2


LC_ALL="zh_CN.UTF-8"
export LANG="zh_CN.UTF-8"

磁盘

Linux系统基本目录结构

参考: 在 Linux 上检测硬盘上的坏道和坏块

bleachbit 应用占用磁盘清理

文件系统

参考: Linux 文件系统剖析参考: 详解NTFS文件系统参考: 使用 FUSE 开发自己的文件系统

spacedrive

ext3 ext4

第 4 章 Linux ext 文件系统

简单来说是依据分区大小得到最大inode数，通常 16k空间一个inode（可通过 mkfs.ext4 -i 参数指定, 默认值在 /etc/mke2fs.conf 有定义），例如 10G空间 640K个inode
inode数量 = 分区大小字节 / inode_ratio
- inode_ratio 默认16K 含义为 bytes/inode 比例
- inode_size ext3 默认128 ext4 默认256 这个值越大，inode占用的空间就越大
大量小文件时，可以考虑降低inode_ratio值，但是会导致实际存放文件的空间减小，反之亦然

Tmpfs

虚拟内存文件系统 wiki

手动创建挂载tmp文件系统： mount -t tmpfs -o size=100m tmpfs /mnt/tmp

/tmp临时目录定期清理机制

安装系统时，如果没有将/tmp指定独立的分区，将会在/分区下建立 tmp 目录，此时会有一个隐患当系统段时间大量创建tmp文件时可能导致 / 分区满掉，从而导致整个系统hang住。
例如Java中使用EasyExcel大量导出Excel时需要临时文件落盘避免内存占用过大的问题, 当并发大量文件导出时容易引起tmp目录占满。

systemd 方式来定期清理tmp Configuration of Temporary Files with systemd-tmpfiles

例如：解决上述Excel临时文件的问题，最好是随用随删，该机制可作为兜底策略

Java应用中指定临时文件目录为 /tmp/excel-tmp
新建配置文件 /etc/tmpfiles.d/excel-tmp.conf

1

    d /tmp/dir_clean 0755 baeldung baeldung 10s

执行 sudo systemd-tmpfiles --clean 将删除最后修改时间超过当前时间10s的文件 可以加入cron
问题：如果文件被打开，持续写入中，时间超过了10s这个时候是否会被删除？
- 如果进程占用在写入，不会被清除, 打开的句柄关掉后就不会修改文件的修改时间了，就会到期删除

安装系统时基本分区

设备列表

/dev/random 产生随机数的设备

常用命令

将虚拟磁盘镜像格式化为指定的文件系统 sudo mkfs.ext4 virtual.img
查看支持的文件系统 ls -l /lib/modules/$(uname -r)/kernel/fs
重命名USB磁盘挂载分区卷标

格式化分区

格式化为ext4 mkfs -t ext4 /dev/sdc1

dd

使用 dd 命令进行硬盘 I/O 性能检测

例如创建一个空4G文件: dd if=/dev/zero of=/testfile bs=1024k count=4096
创建全0填充文件，标准输出后计算MD5 dd if=/dev/zero bs=1M count=1024 | md5sum

truncate

创建一个 5G 全0文件 truncate -s 5G test.file

mount

mount [options] [source] [directory]
mount [-o [操作选项]] [-t 文件系统类型] [-w|--rw|--ro] [文件系统源] [挂载点]
查看已挂载信息 mount
挂载这个镜像到 /mnt ：mount -o loop -t ext4 virtual.img /mnt
只读方式挂载 mount -o loop --ro virtual.img /mnt
卸载挂载的磁盘 sudo umount /mnt

设置自动挂载某分区 (root身份运行命令)

blkid 查看设备详情, 找到要挂载的硬盘的 UUID 以及文件系统类型
vim /etc/fstab 在文件中添加, 记得要先创建该目录 /media/kcp/Data1
- UUID=42168DE83BC5EDAD /media/kcp/Data1 ntfs defaults 0 1 类似配置
- mount -a 切记要先用该命令测试下该文件是否正确, 如果有错误, 系统关机后就开不了机了(但是可以使用U盘进系统修改该文件)

一个分区挂载到多个目录

挂载分区到目录A sudo mount /dev/sda1 /mnt/partition
创建新目录B sudo mkdir /mnt/newdir
绑定分区到目录B sudo mount –bind /mnt/partition /mnt/newdir
结果： /mnt/partition /mnt/newdir 访问的是一个分区

fdisk

查看磁盘分区表信息：sudo fdisk -l

fsck

check and repair a Linux filesystem

当系统突然断电而导致文件系统不一致时, 可使用该命令进行修复, 例如:fsck.ext4 -vy /dev/sdaXX

df

报告文件系统磁盘空间使用情况

-h 可读性 human readable
-i 查看inodes索引情况，大量小文件创建时也会导致inode空间耗尽，可按需使用 xfs jfs 等无限inode文件系统
-T 查看挂载文件系统的类型信息
-a 所有文件系统
-l 只显示本地文件系统

如果留意到 /分区 Avail空间明显小于Size减去Used

是因为 ext2/3/4 文件系统默认预留了5%的空间给root用户，为了防止普通用户写满磁盘后影响到root用户系统级应用数据落盘，从而引发系统故障

所以如果home目录单独分了区，就可以取消改设定，如果只有一个分区 / 就不建议删除保留设置。

1
2
3
4


    # 查看分区的块情况
    sudo tune2fs -l /dev/sda8
    # 设置保留块比例为0%
    sudo tune2fs -m 0 /dev/sda8

duf 现代化 df
pydf

du

du -sh 目录 查看磁盘占用总大小 h 自动搭配单位（human read ）
du --max-depth 一级子目录使用情况
du -sm * | sort -n 统计当前目录大小并按大小(mib)排序 -sk则是换算成kib
du -m | cut -d "/" -f 2 看第二个/字符前的文字
案例：获取当前目录最大的6个目录或文件 du -hsx * | sort -rfh | head -6
- -hsx – （-h）更易读的格式，（-s）汇总输出，（-x）跳过其他文件系统的文件
- sort – 对文本文件按行排序（-r）将比较的结果逆序输出，（-f）忽略大小写 -h 可读
- head – 输出文件的前几行

改进版

日志

基本都在 /var/log 下

last 查看用户最后登录时间
logrotate 日志处理工具（切分，压缩，邮件通知等功能）

Systemd

通常使用 journalctl 查询 Systemd 的日志

查看日志

当次启动日志 journalctl -xe
内核模块的日志 journalctl -u systemd-modules-load.service

-r 滚动到最后的日志
-b -1 查看相对启动次日志 0标识当前
--since "2015-01-10"
--until "2015-01-11 03:00"

清理日志

journalctl --vacuum-time=1w 只保留1周日志
- 路径：/var/log/journal

应用日志

处理Apache日志的Bash脚本

DFS

分布式文件系统（Distributed File System），类似的还有NAS（Network Attached Storage）。

happyfish100/fastdfs

Samba

服务器消息块（Server Message Block）是一种通用的文件共享协议，通常用于Windows系统。

Manjaro使用Samba实现局域网内跨系统文件共享 - 简书

搭建匿名Samba服务器

/etc/samba/smb.conf

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27


    [global]
    workgroup = WORKGROUP       
    #所要加入的工作组或者域
    netbios name = Manjaro      
    #用于在 Windows 网上邻居上显示的主机名
    security = user             
    #定义安全级别
    map to guest = bad user     
    #将所有samba系统主机所不能正确识别的用户都映射成guest用户
    dns proxy = no              
    #是否开启dns代理服务

    [share]                    
    #共享显示的目录名 注意每级目录samba用户都要有权限 最简单就放最高层级的目录上
    path = /share
    #实际共享路径
    browsable = yes             
    #共享的目录是否让所有人可见
    writable = yes              
    #是否可写
    guest ok = yes              
    #是否允许匿名(guest)访问,等同于public
    create mask = 0777          
    #客户端上传文件的默认权限
    directory mask = 0777       
    #客户端创建目录的默认权限
    #注意共享文件在系统本地的权限不能低于以上设置的共享权限。

smbpasswd -a share #共享显示的目录名
pdbedit -L 查看所有Samba用户
chmod 777 -R /share
systemctl restart smb nmb
测试可用性 smbclient //192.168.0.10/share

Tips

清空文件内容 true > a.txt
安装上传下载文件的工具 sudo apt install lrzsz
cat ~/.ssh/id_rsa.pub | xsel -b 将文件复制到剪贴板

善用*shrc文件

注意加载顺序 /etc/profile -> ~/.*shrc 各种sh的rc文件 bash zsh ash

善用alias

1
2
3


    if [ -f ~/.bash_aliases ]; then
        . ~/.bash_aliases
    fi

在~/.bashrc添加这段，然后在 .bash_aliases 文件中设置别名
- 例如： alias Kg.notes='cd ~/Documents/Notes/Code_Notes/'
- 更改文件后，想当前终端就生效就 source ~/.bashrc 不执行命令就重启终端即可

注意_ 你会发现当前用户下 Kg.notes 是正常运行的, 但是 sudo Kg.note 就会报错说找不到命令
神奇的是配置一个别名 alias sudo='sudo ' 就可以解决这个问题了 stackoverflow 官方说明如下_

1
2
3
4
5
6


    The first word of each simple command, if unquoted, is checked to see if it has an alias. If so, that word is replaced by the text of the alias. 
    The characters ‘/’, ‘$’, ‘`’, ‘=’ and any of the shell metacharacters or quoting characters listed above may not appear in an alias name. 
    The replacement text may contain any valid shell input, including shell metacharacters. The first word of the replacement text is tested for aliases, 
    but a word that is identical to an alias being expanded is not expanded a second time. This means that one may alias ls to "ls -F", for instance, 
    and Bash does not try to recursively expand the replacement text. If the last character of the alias value is a space or tab character, 
    then the next command word following the alias is also checked for alias expansion. 

如我的配置文件 将配置文件分类放
- K.h就能显示出每个命令的说明其实现脚本： python3脚本
- 在别名文件目录时, 建立链接就可以用了 ln -s pwd/.bash_aliases ~/.bash_aliases

desktop文件

freedesktop

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


	[Desktop Entry] #每个desktop文件都以这个标签开始，说明这是一个Desktop Entry文件
	Version = 1.0 #标明Desktop Entry的版本（可选）
	Name = Firefox #程序名称（必须），这里以创建一个Firefox的快捷方式为例
	GenericName = Web Browser #程序通用名称（可选）
	Comment = A Web Browser #程序描述（可选）
	Exec = firefox %u #程序的启动命令（必选），可以带参数运行,当下面的Type为Application，此项有效
	Icon = firefox #设置快捷方式的图标 svg(更好) png
	Terminal = false #是否在终端中运行（可选），当Type为Application，此项有效
	Type = Application #desktop的类型（必选），常见值有“Application”和“Link”
	Categories = GNOME;Application;Network; #注明在菜单栏中显示的类别（可选）

如要将快捷方式放在启动菜单内只需将 desktop 文件复制到 /usr/share/applications/(全局) 或者 ~/.local/share/applications(单个用户) 目录下
- 注意：目录不能有空格等特殊字符
重点在于 Exec 和 Icon 的值，Exec 仅相当于当前用户执行 Exec的命令，如果发现应用启动异常只能去脚本或二进制文件调试，通常是环境变量差别

Contents

IO