Linux 上的 Comm 命令及其示例

Linux 中的 comm 命令是一个功能强大但未被重视的实用程序,专门用于逐行比较两个排序的文件。它旨在输出三种类型的行:第一个文件独有的行、第二个文件独有的行以及两者共有的行。此功能使 comm 成为执行各种任务的宝贵工具,例如识别数据集中的唯一或共享条目、简化数据分析以及帮助文件管理。

terminal-linux-logo

先决条件

在使用 comm 命令之前,请确保:

  • 对要比较的文件进行排序。如果没有,请使用 sort 命令事先对它们进行排序。
  • 排序顺序(排序顺序)在两个文件中是一致的。

语法和选项

comm 命令的基本语法 是:

comm [OPTION]... FILE1 FILE2

标准输出由三列组成:

  1. FILE1 独有的行
  2. FILE2 独有的行
  3. 两个文件共有的行

自定义输出的选项包括

comm 命令附带了几个选项,允许您自定义其行为:

  • -1:禁止显示第一列(第一个文件独有的行)。
  • -2:禁止显示第二列(第二文件独有的行)。
  • -3:禁止显示第三列(两个文件共有的行)。
  • --check-order:检查输入是否正确排序
  • --nocheck-order:不检查输入是否排序
  • --output-delimiter=STR:使用字符串 STR 分隔列
  • --version:输出版本信息

例如,如果要禁止显示第一列(第一个文件独有的行),则可以使用 -1 选项:

comm -1 file1.txt file2.txt

这将输出两列。第一列包含 file2 独有的行TXT公司,第二列包含两个文件共有的行。

基本用法

要比较两个不带任何选项的排序文件:

comm file1.txt file2.txt

此命令将显示三列,如上所述。

高级用法和示例

隐含列

若要仅查看两个文件之间的公共行,请使用:

comm -12 file1.txt file2.txt

这将禁止显示前两列,仅显示第三列。

比较未排序的文件

对于未排序的文件, 使用进程替换将 comm 与排序组合在一起:

comm -12 <(sort file1.txt) <(sort file2.txt)

自定义输出分隔符

若要提高可读性,请指定自定义分隔符:

comm --output-delimiter=" | " file1.txt file2.txt

疑难解答提示

  • 如果 comm 报告文件未排序,请重新检查排序顺序。
  • 确保文件编码不会影响排序。
  • 使用 LC_COLLATE=C 排序文件TXT公司 用于在不同环境中进行一致的排序。
  • 有关 comm 命令的更多详细信息 ,可以浏览手册页:
man comm

结论

comm 命令证明了 Linux 命令行工具的多功能性和强大功能。它能够有效地比较排序的文件,使其成为数据分析、系统管理等方面必不可少的实用程序。通过掌握通信,用户可以简化他们的工作流程,从数据集中发现见解,并轻松执行复杂的文件比较。 本文简明扼要地概述了 comm 命令,专为 SEO 友好且可供广大受众使用而量身定制。为了更深入地了解,我们鼓励读者浏览 comm 手册页并尝试使用该命令以充分掌握其功能和应用。

未经允许不得转载:统信UOS之家 » Linux 上的 Comm 命令及其示例

相关文章