首页 > 文章列表 > 如何在Java中查找流中的重复元素

如何在Java中查找流中的重复元素

java 查找 重复元素
108 2023-09-04

在数据流中查找重复元素是 Java 面试甚至许多学生考试中常见的问题之一。 Java提供了多种查找重复元素的方法,我们主要关注两种方法:第一种是使用Java Collection Framework的Set,另一种是使用流的内置方法Collections.Frequency()。

Java 程序查找流中的重复元素

在讨论从数据集合中获取重复项的不同方法之前,有必要先讨论一下filter()方法。它将是示例程序的重要组成部分。

过滤器()

它允许我们根据指定的条件对流的元素进行过滤。它是高阶函数的一部分,用于对流项应用某种行为。此方法将谓词作为参数并返回与谓词匹配的元素列表。

语法

                
filter(predicate);

Java集合框架的使用

它是Java Collection Interface的子接口,不允许重复值。它与数学集合非常相似。我们可以使用 add() 方法,该方法仅将那些不相似的元素添加到集合中。要使用Set接口的属性,我们需要使用实现该接口的HashSet类。

示例

以下示例说明了如何使用 Set 接口从流中查找重复元素。

方法

  • 使用 Arrays.asList() 方法创建一个列表来存储固定大小的列表。

  • 然后,使用 HashSet 类定义一个 Set,以仅存储不相似的元素。

  • 现在,使用filter()方法以及stream()和forEach()来仅过滤掉重复的项目。这里,stream()以流的形式指定输入,我们将使用forEach()来迭代并打印重复的元素。

import java.util.*;
public class Duplicate {
   public static void main(String []args) {
      // create a list with duplicate items
      List<Integer> itemsList = Arrays.asList(10, 12, 10, 33, 40, 40, 61, 61);
      // declaring a new Set 
      Set<Integer> newitemSet = new HashSet<>();
      System.out.println("The list of duplicate Items: ");
      itemsList.stream() // converting list to stream
         .filter(nums -> !newitemSet.add(nums)) // to filter out the elementsthat are not added to the set
         .forEach(System.out::println); // print the duplicates
   }
}

输出

The list of duplicate Items: 
10
40
61

使用 Collections.Frequency() 方法

从流或集合中过滤重复元素的另一种最简单方法是使用“java.util”包的 Collections.Frequency() 方法,该方法用于返回指定集合中的元素总数。

语法

Collections.frequency(nameOfCollection, obj);

在这里,

nameOfCollection表示流,obj表示需要确定频率的元素。

示例

在下面的示例中,我们将使用 Collections.Frequency() 方法来统计流中每个元素的出现次数,然后返回出现次数超过一次的元素。我们将打印重复元素出现的整个列表以及计数。

import java.util.*;
public class FindDuplicates {
   public static void main(String[] args) {
      // create a list with duplicate items
      List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33, 40, 40, 61, 61);
      System.out.println("The list of duplicate Items with frequency: ");
      itemslist.stream() // converting list to stream 
         .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items
         .forEach(System.out::println); // printing the frequency of duplicate items
      System.out.println("Count of duplicate items: ");    
      // to count the duplicate items    
      System.out.println(itemslist.stream()
       .filter(itr -> Collections.frequency(itemslist, itr) > 1)
       .count());
    }
}

输出

The list of duplicate Items with frequency: 
10
10
10
40
40
61
61
Count of duplicate items: 
7

示例

这是另一个示例,我们将同时使用 Set Interface 和 Collections.Frequency() 方法来仅获取重复元素。 Collections.Frequency() 方法将对流中每个元素的出现次数进行计数,然后将计数大于 1 的元素收集到 Set 中以删除重复项。生成的 Set 将仅包含流中的重复元素。

import java.util.stream.*;
import java.util.*;
public class FindDuplicates {
   public static void main(String[] args) {
      // create a list with duplicate items
      List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33,40, 40, 61, 61);
      // set to store duplicate items
      Set<Integer> duplicates = itemslist.stream()
         .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items
         .collect(Collectors.toSet()); // adding only duplicate items to set
      // printing the duplicate items    
      System.out.println("The list of duplicate Items:" + duplicates); 
   }
}

输出

The list of duplicate Items:[40, 10, 61]

结论

在本节中,我们将以上述示例和概念中的一些要点来结束我们的讨论。我们可以使用filter()方法从数据集合中过滤掉特定类型的元素。它通过对每个元素应用谓词来在后台工作。 Set Interface 能够仅存储不同的元素,这使其成为给定任务的绝佳选择。