将一个包含大量数字的 .csv 文件导入 R 中，而不使用科学计数法。

Question

11 浏览2023年1月26日

匿名的 2023年1月27日

0 Comments

我有一个Microsoft Excel (.xlsx)文件，我想要加载到R中。我之前做过这个，使用了read.csv()，一直都很顺利，但是这个文件出现了一些奇怪的问题。似乎在一个包含行名和13位数值的大数值列中出现了问题。无论我如何尝试将文件加载到R中，都会将该列转换为科学计数法。

该问题可以按以下步骤模拟：在Excel中，首先在第一列的第一行输入一个随机的行名。在第一列的第二行输入一个随机的大数值，例如6345157890027。然后将文件保存为.csv格式。假设我想在R中打开这个文件：

TestData <- read.csv(file = "Test.csv", head = TRUE) 然后

View(TestData)

现在，数字6345157890027显示为6.345158e+12，并且在导入过程中丢失了信息。现在，我已经尝试了多种解决方法：

在.xlsx和.csv文件中，将该行转换为数字格式
尝试了Excel允许我保存的所有.csv格式
将整个工作表复制到新的Excel文件中
使用Excel中的导入数据功能
将工作表另存为.txt，并使用文件->导入数据集功能将其导入到R中

然而，这些方法都没有解决问题：该值似乎总是以科学计数法显示。有没有人知道如何确保Excel或R不会将大数值转换为科学计数法？

0

3 答案

匿名的 · Answer 1 · 2023-02-06T07:21:54+00:00

问题的原因是在R中导入包含大数字的.csv文件时，默认情况下会使用科学计数法来显示这些数字。这可能会导致数据显示不准确或不方便阅读。

解决这个问题的方法是使用R中的format函数。这个方法是由Stack Overflow用户rnso在另一个帖子中提出的。具体方法如下：

1. 首先，将csv文件导入R中，并将其中包含的大数字存储在一个变量中。例如：xx = 100000000000。

2. 接下来，使用format函数来格式化这个变量，将科学计数法的显示方式关闭。代码如下：format(xx, scientific=F)。

3. 运行以上代码后，R将以普通数字的形式显示这个变量的值，而不是科学计数法。例如，原来显示为1e+11的数字现在将显示为"100000000000"。

这种方法同样适用于数据框中的列。如果你的数据框中的某一列显示为科学计数法，你可以使用相同的代码来格式化该列的值，使其以普通数字的形式显示。

这种方法的好处是可以确保数字的准确显示，并且更容易阅读。这对于处理大数字的数据分析任务尤为重要。

匿名的 · Answer 2 · 2023-09-10T18:59:45+00:00

当我们将一个包含大数值的.csv文件导入R时，R默认会将大数值转换为科学计数法的形式。这可能会导致数据的精度丢失，影响后续分析和计算的准确性。

要解决这个问题，我们可以使用以下方法：

1. 在导入数据之前，可以通过设置options(scipen = 999)来告诉R不要将大数值转换为科学计数法的形式。这样可以保持数据的原始精度。

以下是一个示例：

options(scipen = 999)
data <- read.csv("file.csv")

通过设置options(scipen = 999)，我们告诉R不要使用科学计数法表示大数值。然后，我们使用read.csv()函数将.csv文件导入R中的数据框。

这样，我们就成功地将包含大数值的.csv文件导入R，而不会出现科学计数法的问题。这样可以保持数据的准确性和精度，方便后续的数据分析和计算。

总结起来，通过设置options(scipen = 999)可以避免R将大数值转换为科学计数法的问题，从而确保数据的准确性和精度。这对于导入包含大数值的.csv文件非常有用。

匿名的 · Answer 3 · 2023-02-15T01:02:17+00:00

在R中导入一个包含大数值的.csv文件时，可能会出现科学计数法的问题。解决这个问题的方法是使用bit64包中的as.bit64函数。只需确保不使用64位数值来引用其他R对象。这个解决方案适用于在+-2^63范围内的数值。如果你没有丢失任何信息，那么这个解决方案对你没有帮助。你的数值不大到需要64位存储的程度。