在给定内存限制的情况下,对一个具有大量数据的文件进行排序。

8 浏览
0 Comments

在给定内存限制的情况下,对一个具有大量数据的文件进行排序。

要点:

  • 我们每天同时处理数千个平面文件。
  • 内存限制是一个重大问题。
  • 我们为每个文件处理使用线程。
  • 我们不按照列排序。文件中的每一行(记录)被视为一列。

不能做的事情:

  • 我们不能使用Unix/Linux的排序命令。
  • 无论如何轻量级,我们都不能使用任何数据库系统。

现在,我们不能只加载所有内容到集合中并使用排序机制。这将耗尽所有内存,程序将出现堆错误。

在这种情况下,您将如何对文件中的记录/行进行排序?

0