使用grep进行原地处理

Question

14 浏览2023年1月3日

匿名的 2023年1月3日

0 Comments

我有一个脚本，调用grep来处理文本文件。目前我是这样做的。

$ grep 'SomeRegEx' myfile.txt > myfile.txt.temp
$ mv myfile.txt.temp myfile.txt

我想知道是否有办法进行原地处理，即将结果存储到同一个原始文件中，而不需要创建临时文件，然后在处理完成后用临时文件替换原始文件。

当然，我欢迎关于为什么应该或不应该这样做的评论，但我主要想知道是否可以这样做。在这个例子中我使用了grep，但我对Unix工具一般感兴趣。谢谢！

0

3 答案

匿名的 · Answer 1 · 2023-09-04T02:57:34+00:00

在Unix系统中，通常不能以这种方式进行原地处理。你只能创建/截断文件（使用>）或追加到文件末尾（使用>>）。一旦截断，旧内容将会丢失。

原因：

- Unix系统中的文件截断操作会导致旧内容的丢失，因此无法直接在原文件上进行处理。

解决方法：

- 为了避免原文件内容的丢失，在进行处理之前需要先备份原文件。

- 使用grep命令可以在Unix系统中进行文本搜索和处理操作。grep命令可以根据正则表达式模式匹配文件中的内容，并输出匹配的行。

- 若要对文件进行原地处理，可以使用重定向符号（>）将grep命令的输出重定向到一个临时文件中，然后再将临时文件覆盖原文件的内容。

代码示例：

# 备份原文件
cp file.txt file_backup.txt
# 使用grep命令处理文件，并将输出重定向到临时文件
grep "pattern" file.txt > temp.txt
# 将临时文件内容覆盖原文件
mv temp.txt file.txt

通过以上步骤，我们可以在Unix系统中实现原地处理文件内容的需求。首先，我们备份原文件以防止数据丢失。然后，使用grep命令匹配文件中的内容，并将输出重定向到一个临时文件中。最后，将临时文件的内容覆盖原文件，完成原地处理操作。

匿名的 · Answer 2 · 2023-03-15T09:20:36+00:00

在上述内容中，提到了使用-i开关的Perl，sed和Ruby命令。这些命令可以在处理文件时进行原地处理。但是需要注意的是，这些命令实际上只是在后台创建了一个你看不到的"temp"文件。除了grep之外，还有其他的方法可以实现类似功能。

其中一种方法是使用awk命令。下面是一个使用awk命令实现原地处理的例子：

awk '/someRegex/' file > t && mv t file

另一种方法是使用bash脚本。下面是一个使用bash脚本实现原地处理的例子：

while read -r line;do case "$line" in *someregex*) echo "$line";;esac;done <file > t && mv t file

这两种方法与原始的grep命令相比，除了使用&&代替;之外，还明确地创建了一个临时文件。

因此，原地处理的问题是在处理文件时会创建临时文件，这可能会导致一些额外的磁盘空间消耗和性能问题。解决这个问题的方法是优化命令，尽量减少对临时文件的创建和使用，以提高处理效率和节省存储空间。

匿名的 · Answer 3 · 2023-02-08T17:22:42+00:00

问题的出现原因：在许多Linux发行版中，默认情况下未安装sponge（在Debian/Ubuntu中的moreutils软件包中）。然而，sponge命令是一个非常实用的工具，它可以读取输入直到EOF，并将其写入文件，因此可以使用grep命令对文件进行搜索，并将搜索结果写回到文件中。

解决方法：要解决这个问题，可以手动安装moreutils软件包，或者尝试使用其他方法来实现在原地处理（in-place processing）的功能。

以下是一种解决方法：

grep 'pattern' file > tmpfile && mv tmpfile file

这个方法使用了一个临时文件tmpfile，首先使用grep命令将匹配'pattern'的行写入tmpfile中，然后使用mv命令将tmpfile重命名为file，从而实现了在原地处理的效果。

虽然这种方法可以达到相同的效果，但是使用sponge命令更加方便和简洁。如果sponge命令没有被默认安装，那么可以考虑手动安装moreutils软件包或者使用其他方法实现类似的功能。