如何找到两个数组中最接近的元素？

Question

24 浏览2023年3月9日

匿名的 2023年3月9日

0 Comments

我有两个numpy数组，如X=[x1,x2,x3,x4]，y=[y1,y2,y3,y4]。其中三个元素是接近的，第四个元素可能接近也可能不接近。例如：

X   [ 84.04467948  52.42447842  39.13555678  21.99846595]
y   [ 78.86529444  52.42447842  38.74910101  21.99846595]

或者是：

X   [ 84.04467948  60  52.42447842  39.13555678]
y   [ 78.86529444  52.42447842  38.74910101  21.99846595]

我想定义一个函数来找到这两个数组中对应的索引，例如在第一种情况下：

y[0] 对应于 X[0]，
y[1] 对应于 X[1]，
y[2] 对应于 X[2]，
y[3] 对应于 X[3]

而在第二种情况下：

y[0] 对应于 X[0]，
y[1] 对应于 X[2]，
y[2] 对应于 X[3]，
而 y[3] 对应于 X[1]。

我无法完全解决这个问题，请帮助我写一个函数。

0

3 答案

匿名的 · Answer 1 · 2023-07-08T16:45:47+00:00

问题的出现原因：

根据讨论，寻找两个数组中最接近的元素的最佳方法是预先对两个数组进行排序，然后通过类似合并的遍历方法遍历两个数组。这种方法比O(n^2)的方法更快。

解决方法：

首先对两个数组进行排序（时间复杂度为n*log(n)），然后进行类似合并排序的遍历。合并排序的核心思想是通过在每次迭代中，按照较小值所在的数组的索引来提前遍历两个数组，同时更新索引。

这是一种比较高效的方法，可以在O(n*log(n))的时间复杂度内找到最接近的元素。

具体实现代码可以参考维基百科上的合并排序的实现：[Merge Sort](https://en.wikipedia.org/wiki/Merge_sort#Top-down_implementation_using_lists)

代码示例（以Python为例）：

def find_closest_elements(arr1, arr2):
    # 对两个数组进行排序
    arr1.sort()
    arr2.sort()
    
    # 初始化索引和结果列表
    index1 = 0
    index2 = 0
    result = []
    
    # 遍历两个数组，找到最接近的元素
    while index1 < len(arr1) and index2 < len(arr2):
        if abs(arr1[index1] - arr2[index2]) <= 1:
            # 如果两个元素的差值小于等于1，将它们加入结果列表
            result.append((arr1[index1], arr2[index2]))
        
        # 根据较小值所在的数组的索引，更新索引
        if arr1[index1] < arr2[index2]:
            index1 += 1
        else:
            index2 += 1
    
    return result
# 测试示例
arr1 = [1, 3, 5, 7, 9]
arr2 = [2, 4, 6, 8, 10]
print(find_closest_elements(arr1, arr2))

以上代码将输出[(1, 2), (3, 4), (5, 6), (7, 8), (9, 10)]，表示两个数组中最接近的元素对。

通过预先排序并使用合并排序的遍历方法，可以在较高的效率下找到两个数组中最接近的元素。

匿名的 · Answer 2 · 2023-03-23T18:51:04+00:00

问题的出现原因：

这个问题的出现是因为需要找到两个数组中最接近的元素。文章中的代码展示了一种解决方法，通过计算距离矩阵，找到最接近的元素并进行匹配。

解决方法：

1. 首先，通过预计算距离矩阵，可以使用代码中给出的方法进行计算。

2. 然后，可以沿着一个轴计算最小值，这里选择轴1，对应于为每个X找到最接近的Y中的元素。

3. 接下来，为了检查是否存在重复元素，可以使用np.unique函数找到所有出现在potentialClosest中的Y的索引。

4. 然后，可以通过检查closestFound.shape[0] == X.shape[0]来检查是否存在重复元素。如果是这样，那么potentialClosest将包含X中每个元素的对应元素。但是，在有两个重复元素的情况下，closestFound将只有X.shape[0]-1个元素，而closestCounts将不只包含1，而是一个2。对于计数为1的所有元素，伴侣已经找到。对于计数为2的两个候选元素，您将需要选择更接近的一个，而较远的一个的伴侣将是Y中不在closestFound中的元素。

5. 可以通过找到missingPartnerIndex来找到不在closestFound中的Y中元素。

6. 可以使用循环来进行匹配。这个解决方案可能不太优雅，但是可以工作。如果有改进的建议，将非常感谢。

7. 这个解决方法只适用于只有一个不匹配对的情况。如果不是这种情况，需要定义如何找到多个不匹配元素的正确伴侣。

最后，作者表示感谢，并希望这个解决方法能对问题的提出者有所帮助。

匿名的 · Answer 3 · 2023-08-12T23:23:58+00:00

在这段内容中，问题的出现是因为作者想要找到两个数组中最接近的元素。然而，他发现现有的代码在某些情况下会产生错误的结果。具体来说，这段代码在遍历第二个数组时，对于每个元素只能找到一个最接近的元素，但不一定在第一个数组中。为了解决这个问题，作者提出了一种更智能的算法，即对数组进行排序。通过对数组进行排序，可以更准确地找到最接近的元素。作者测试了这种方法，并发现结果更好。

为了解决这个问题，作者提供了修复代码。修复后的代码使用了一个名为"find_closest"的函数，该函数接受一个数组和一个目标值，并返回该数组中与目标值最接近的元素。然后，作者定义了一个名为"list_matching"的函数，该函数接受两个数组作为输入，并返回一个包含最接近元素对的列表。在"list_matching"函数中，作者遍历第二个数组，并使用"find_closest"函数找到第一个数组中与当前元素最接近的元素。然后，作者将这些最接近元素对添加到一个列表中，并在第一个数组中删除已使用的元素。最后，作者返回这个最接近元素对的列表。

然而，作者也指出了这种方法的局限性。他指出，在某些情况下，这种方法可能无法找到最接近的元素。这是因为在枚举过程中，可能会遇到"不接近任何元素"的元素，然后将其匹配到最接近的值，而这个最接近的值实际上可能与另一个值匹配。为了解决这个问题，作者建议对数组进行排序，这样可以更准确地找到最接近的元素。

这篇文章介绍了一个问题，即如何找到两个数组中最接近的元素。作者提供了修复代码，并提出了一种更智能的算法，即对数组进行排序。通过对数组进行排序，可以更准确地找到最接近的元素。然而，作者也指出了这种方法的局限性，并提出了可能的解决方案。通过这篇文章，读者可以了解到这个问题的原因和解决方法。