如何在Scala中同时使用map和接收索引？

Question

14 浏览2023年2月9日

匿名的 2023年2月9日

0 Comments

有没有内置的List/Sequence可以像map一样，并且可以提供元素的索引？

0

3 答案

匿名的 · Answer 1 · 2023-02-12T17:05:48+00:00

最近有人在Scala中使用map函数时，想要同时获得索引。然而，已有的解决方案存在一些问题，比如创建了中间集合或引入了不必要的变量。实际上，我们只需要跟踪迭代的步数，这可以通过记忆化来实现。以下是一个实现这一目的的方式：

首先，我们定义一个工具类TraversableUtil，其中包含一个IndexMemoizingFunction类，该类接受一个函数f和一个索引参数，返回一个包含索引的结果。具体代码如下：

object TraversableUtil {
    class IndexMemoizingFunction[A, B](f: (Int, A) => B) extends Function1[A, B] {
        private var index = 0
        override def apply(a: A): B = {
            val ret = f(index, a)
            index += 1
            ret
        }
    }
    def doIndexed[A, B](f: (Int, A) => B): A => B = {
        new IndexMemoizingFunction(f)
    }
}

然后，我们可以将这个工具类应用于map函数。例如，我们可以在使用map函数时调用doIndexed函数，并传入一个接收索引和元素作为参数的函数。具体代码如下：

import TraversableUtil._
List('a','b','c').map(doIndexed((i, char) => char + i))

运行以上代码，将得到结果List(97, 99, 101)，即字符'a'的ASCII码加上索引0，字符'b'的ASCII码加上索引1，字符'c'的ASCII码加上索引2。

这种解决方案非常优雅，不会创建临时集合。虽然在并行集合中不能使用，但仍然是一个非常好的解决方案。如果不想创建临时集合，可以使用coll.view.zipWithIndex替代coll.zipWithIndex函数。

匿名的 · Answer 2 · 2023-06-13T23:11:48+00:00

在Scala中，有一个问题是如何在使用map函数的同时接收索引。下面是一个使用map和zipWithIndex函数的示例代码：

val myList = List("a", "b", "c")
myList.zipWithIndex.map { case (element, index) =>
   println(element, index)
   s"${element}(${index})"
}

运行结果为：

List("a(0)", "b(1)", "c(2)")

这个例子是我见过的第一个很好的示例，它按照要求使用了map函数，而不仅仅是在foreach中打印。

解决这个问题的关键在于使用zipWithIndex函数将列表中的元素和索引组合成元组，并在map函数中对它们进行处理。zipWithIndex函数返回一个包含元组的新列表，其中每个元组包含原始列表中的元素和对应的索引。

在map函数中，我们使用模式匹配将元组的元素解构为element和index。然后，我们可以对它们进行任何操作，例如打印或者构建新的字符串。最后，map函数将返回一个新的列表，其中包含了处理后的每个元素。

这种方法的好处是我们可以在map函数中使用任何我们想要的操作，而不仅仅是打印。这样我们可以更灵活地处理元素和索引，并返回我们想要的结果。

总结起来，我们可以使用map和zipWithIndex函数来在Scala中同时使用索引和元素。通过使用zipWithIndex函数将元素和索引组合成元组，然后在map函数中对它们进行处理，我们可以灵活地处理每个元素和索引，并返回我们想要的结果。这种方法可以更好地满足我们的需求，并且使我们的代码更加简洁和可读。

匿名的 · Answer 3 · 2023-08-07T02:00:48+00:00

在Scala中，如果想要在使用map函数的同时获得索引，可以使用zipWithIndex方法。以下是使用zipWithIndex的示例代码：

val ls = List("Mary", "had", "a", "little", "lamb")
ls.zipWithIndex.foreach{ case (e, i) => println(i+" "+e) }

以上代码会输出每个元素的索引和对应的值：

0 Mary
1 had
2 a
3 little
4 lamb

除了上述示例代码，还有其他一些变体的写法：

for((e,i) <- List("Mary", "had", "a", "little", "lamb").zipWithIndex) println(i+" "+e)
List("Mary", "had", "a", "little", "lamb").zipWithIndex.foreach( (t) => println(t._2+" "+t._1) )

对于性能要求较高的情况，可以使用while循环和数组，这可能是最快的选项。使用zipWithIndex方法会创建一个新的包含索引-值对的集合。如果在Java中，可以直接使用变量来进行索引的递增操作，而不需要建立新的集合。但是这样的做法不符合函数式编程的风格，所以需要权衡是否真正需要这样的操作。

另外，使用view方法可以避免创建和遍历额外的列表。不过，不推荐使用view方法，而是推荐使用iterator方法。

如果对性能有所关注，可以参考stackoverflow上的这个问题：[how to get the element index when mapping an array in scala](http://stackoverflow.com/questions/9137644)。

至于Spark，使用zipWithIndex可能更高效，因为数据可以分布处理。但是需要注意的是，使用zipWithIndex方法时返回的索引是Long类型的，如果需要得到Int类型的索引，可能需要进一步的映射操作。