在比较带有特殊字符（é，è，...）的单词时忽略变音符号。

Question

12 浏览2023年6月13日

匿名的 2023年6月13日

0 Comments

我有一个列表，其中包含一些带有变音符号的比利时城市：（Liège，Quiévrain，Franière等），我想将这些特殊字符转换为大写形式的列表进行比较，但不带变音符号（LIEGE，QUIEVRAIN，FRANIERE）。

我首先尝试使用大写形式：LIEGE.contentEqual(Liège.toUpperCase())但这不适用，因为Liège的大写形式是LIÈGE而不是LIEGE。

我有一些复杂的想法，比如替换每个字符，但那听起来很愚蠢而且很耗时。

有没有聪明的方法来解决这个问题？

0

3 答案

匿名的 · Answer 1 · 2023-09-25T03:52:37+00:00

在比较包含特殊字符（如é, è等）的单词时，忽略变音字符是一个常见的需求。然而，这会导致一些问题，因为在某些情况下，特殊字符可能会干扰比较的准确性。下面讨论了这个问题的出现原因以及一种解决方法。

问题的出现原因是，当比较包含特殊字符的单词时，特殊字符可能会干扰比较的准确性。这是因为在某些情况下，特殊字符可能被视为独立的字符并与其他字符进行比较，从而导致不正确的结果。例如，单词"café"和"cafe"应该被视为相等，但由于特殊字符的存在，它们可能被视为不同的单词。

为了解决这个问题，可以使用一个简单的解决方案，即忽略变音字符。在Java中，可以使用Normalizer类来实现这一点。下面是一个示例代码：

Normalizer.normalize(string, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "");

这段代码使用了Normalizer类的normalize方法来将字符串规范化为NFD形式，然后使用replaceAll方法去除所有的变音字符。这样可以将包含特殊字符的单词转换为不包含特殊字符的形式，从而实现忽略变音字符的比较。

然而，需要注意的是，Normalizer类可能在Android平台上不可用。根据给出的信息，Android使用的是Java 1.5版本，而Normalizer类可能是在Java 1.6版本引入的。因此，在Android平台上可能需要使用其他方法来实现忽略变音字符的比较。

一个可能的解决方法是使用StringUtils类的stripAccents方法。在Java 6之前的版本中，StringUtils类使用sun.text.Normalizer类来实现忽略变音字符的比较。这个方法可以在Apache Commons Lang库中找到。下面是一个示例代码：

commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/…

使用这个方法，可以将包含特殊字符的单词转换为不包含特殊字符的形式，从而实现忽略变音字符的比较。

忽略变音字符的比较是一个常见的需求，但在比较包含特殊字符的单词时可能会导致一些问题。为了解决这个问题，可以使用Normalizer类或StringUtils类来忽略变音字符。然而，需要注意Normalizer类可能在Android平台上不可用，因此可能需要使用其他方法来实现忽略变音字符的比较。

匿名的 · Answer 2 · 2023-08-10T00:39:37+00:00

忽略特殊字符（é，è，...）时比较单词时的出现问题是，当比较含有特殊字符的单词时，可能会出现不一致的结果。例如，如果要比较单词"café"和"cafe"，由于"é"和"e"被认为是不同的字符，所以它们被视为不相等。这可能会导致在某些情况下出现错误的比较结果。

为了解决这个问题，可以使用Java中的一个方法来移除单词中的重音符号并替换为对应的ASCII字符。下面是一个实现这个方法的Java代码：

private static final String PLAIN_ASCII = "AaEeIiOoUu" // grave
            + "AaEeIiOoUuYy" // acute
            + "AaEeIiOoUuYy" // circumflex
            + "AaOoNn" // tilde
            + "AaEeIiOoUuYy" // umlaut
            + "Aa" // ring
            + "Cc" // cedilla
            + "OoUu"; // double acute
private static final String UNICODE = "\u00C0\u00E0\u00C8\u00E8\u00CC\u00EC\u00D2\u00F2\u00D9\u00F9"
            + "\u00C1\u00E1\u00C9\u00E9\u00CD\u00ED\u00D3\u00F3\u00DA\u00FA\u00DD\u00FD"
            + "\u00C2\u00E2\u00CA\u00EA\u00CE\u00EE\u00D4\u00F4\u00DB\u00FB\u0176\u0177"
            + "\u00C3\u00E3\u00D5\u00F5\u00D1\u00F1"
            + "\u00C4\u00E4\u00CB\u00EB\u00CF\u00EF\u00D6\u00F6\u00DC\u00FC\u0178\u00FF"
            + "\u00C5\u00E5" + "\u00C7\u00E7" + "\u0150\u0151\u0170\u0171";
/**
 * remove accented from a string and replace with ascii equivalent
 */
public static String removeAccents(String s) {
    if (s == null)
        return null;
    StringBuilder sb = new StringBuilder(s.length());
    int n = s.length();
    int pos = -1;
    char c;
    boolean found = false;
    for (int i = 0; i < n; i++) {
        pos = -1;
        c = s.charAt(i);
        pos = (c <= 126) ? -1 : UNICODE.indexOf(c);
        if (pos > -1) {
            found = true;
            sb.append(PLAIN_ASCII.charAt(pos));
        } else {
            sb.append(c);
        }
    }
    if (!found) {
        return s;
    } else {
        return sb.toString();
    }
}

这个方法可能看起来有点长和复杂，但这是我成功使用的唯一一种方法。其他两种方法看起来可能更好，但是实际上并不能正常工作。如果有更好的方法，请提供。确保它能够移除重音符号而不是仅仅比较它们。

另外，还可以使用Apache Commons Lang库中的StringUtils.stripAccents方法来实现相同的功能。具体的代码可以在[这里](http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringUtils.html)找到。

希望这些解决方法能够帮助你解决忽略特殊字符时比较单词的问题。

匿名的 · Answer 3 · 2023-08-04T07:09:22+00:00

问题的原因是在比较带有特殊字符（如é, è）的单词时，忽略重音字符是一个常见的需求。在Java 6及以上的版本中，可以使用java.text.Normalizer来实现这个功能。然而，Android SDK并没有提供最新的Java 6功能，因此无法直接使用java.text.Normalizer。

解决方法是使用Apache Commons Lang库中的stripAccents方法。该方法在Java 6中使用java.text.Normalizer，在早期版本中使用sun.text.Normalizer。然而，不确定sun.text.Normalizer在Android上是否可用。

以下是使用stripAccents方法的示例代码：

import org.apache.commons.lang3.StringUtils;
public String unaccent(String s) {
    return StringUtils.stripAccents(s);
}

上述代码中，通过导入org.apache.commons.lang3.StringUtils类，可以使用其中的stripAccents方法来实现忽略重音字符的功能。