Linux 中的 comm
命令是一个功能强大但未被重视的实用程序,专门用于逐行比较两个排序的文件。它旨在输出三种类型的行:第一个文件独有的行、第二个文件独有的行以及两者共有的行。此功能使 comm
成为执行各种任务的宝贵工具,例如识别数据集中的唯一或共享条目、简化数据分析以及帮助文件管理。
先决条件
在使用 comm
命令之前,请确保:
- 对要比较的文件进行排序。如果没有,请使用
sort
命令事先对它们进行排序。 - 排序顺序(排序顺序)在两个文件中是一致的。
语法和选项
comm
命令的基本语法 是:
comm [OPTION]... FILE1 FILE2
标准输出由三列组成:
- FILE1 独有的行
- FILE2 独有的行
- 两个文件共有的行
自定义输出的选项包括
comm
命令附带了几个选项,允许您自定义其行为:
-1
:禁止显示第一列(第一个文件独有的行)。-2
:禁止显示第二列(第二文件独有的行)。-3
:禁止显示第三列(两个文件共有的行)。--check-order
:检查输入是否正确排序。--nocheck-order
:不检查输入是否排序。--output-delimiter=STR:
使用字符串 STR 分隔列。--version
:输出版本信息。
例如,如果要禁止显示第一列(第一个文件独有的行),则可以使用 -1
选项:
comm -1 file1.txt file2.txt
这将输出两列。第一列包含 file2 独有的行。TXT公司
,第二列包含两个文件共有的行。
基本用法
要比较两个不带任何选项的排序文件:
comm file1.txt file2.txt
此命令将显示三列,如上所述。
高级用法和示例
隐含列
若要仅查看两个文件之间的公共行,请使用:
comm -12 file1.txt file2.txt
这将禁止显示前两列,仅显示第三列。
比较未排序的文件
对于未排序的文件, 使用进程替换将 comm
与排序
组合在一起:
comm -12 <(sort file1.txt) <(sort file2.txt)
自定义输出分隔符
若要提高可读性,请指定自定义分隔符:
comm --output-delimiter=" | " file1.txt file2.txt
疑难解答提示
- 如果
comm
报告文件未排序,请重新检查排序顺序。 - 确保文件编码不会影响排序。
- 使用
LC_COLLATE=C 排序文件。TXT公司
用于在不同环境中进行一致的排序。 - 有关
comm
命令的更多详细信息 ,可以浏览手册页:
man comm
结论
comm
命令证明了 Linux 命令行工具的多功能性和强大功能。它能够有效地比较排序的文件,使其成为数据分析、系统管理等方面必不可少的实用程序。通过掌握通信
,用户可以简化他们的工作流程,从数据集中发现见解,并轻松执行复杂的文件比较。 本文简明扼要地概述了 comm
命令,专为 SEO 友好且可供广大受众使用而量身定制。为了更深入地了解,我们鼓励读者浏览 comm
手册页并尝试使用该命令以充分掌握其功能和应用。