杂七杂八——使用LINQ检索重复值

简介:
日常工作的时候,我们经常遇到需要检索一组数据中是否有重复值的情况,再根据具体情况进行相应的操作。如果不使用LINQ,那我们就得使用一层一层的foreach循环来做,不但麻烦、工作效率低(因为你得绕啊~~绕啊~~~),而且容易出bug。使用LINQ就方便得多。
 
举个我前天在工作中遇到的例子吧。当时是这样的——我需要查看一下用户新插入的值是否已经存在于数据库当中,如果有,就提醒客户不能插入这个值(实际上这个值是PK)。因为在进入页面的时候,我已经把目前数据库里所有的值都读出来、放在一个DataTable里了,所以在用户保存的时候,我没必要连接数据库进行查询,只需要检索当前这个DataTable就OK了。
 
假设这个DataTable有3列,分别是ID、Name、Age,ID是PK。使用foreach的笨办法,是这样:
 
  1. foreach (DataRow r1 in table.Rows)
  2. {
  3.     foreach (DataRow r2 in table.Rows)
  4.     {
  5.         if (r2 != r1 && r2["ID"].ToString() == r1["ID"].ToString())
  6.         {
  7.             Console.WriteLine("Warning!");
  8.             return false// 检验失败
  9.         }
  10.     }
  11. }
如果写成这样,需要注意两点:
  • 必需要有r2 != r1这个条件,不然当一个DataRow“自己遇到自己”的时候,无论如何都会return false的
  • 必需把r1["ID"]和r2["ID"]转换成string(如果你确定它是int,那转成int也行)再进行比较,不然r1["ID"]和r2["ID"]是两个object,调用==操作符,比较的是这两个对象是否是同一个对象——当然不是!所以,永远也不会return false
上面这种笨办法适用于两种情况:
  1. 需要比较简单、只要有重复值立刻撤退的情况
  2. 公司把代码行数与程序工资挂钩的情况
使用LINQ可以更简单地完成上面的任务,而且还可以衍生出很多附加功能:
 
我们把需求稍微改动一下,改成检验Age有没有重复的,如果有、每个值有几个重复。如果用foreach循环,那我们就要在循环内部加上一个Dictionay,以Age为Key,并对每个Key进行计数了。
 
使用LINQ中的GroupBy操作,就能轻松解决这个问题。源码如下:
 
  1. // 水之真谛
  2. // [url]http://blog.csdn.net/FantasiaX[/url]
  3. using System;
  4. using System.Collections.Generic;
  5. using System.Linq;
  6. using System.Text;
  7. using System.Data;
  8. namespace ConsoleApplication1
  9. {
  10.     class Program
  11.     {
  12.         static void Main(string[] args)
  13.         {
  14.             DataTable table = new DataTable();
  15.             table.Columns.Add(new DataColumn("ID"typeof(int)));
  16.             table.Columns.Add(new DataColumn("Name"typeof(string)));
  17.             table.Columns.Add(new DataColumn("Age"typeof(int)));
  18.             int[] ids = new int[] { 1, 2, 3, 4, 5, 6 };
  19.             string[] names = new string[] { "Tim""Yan""Xiao Chen""Miao""Big Ma""Little Ma" };
  20.             int[] ages = new int[] { 28, 24, 28, 22, 27, 22 };
  21.             for (int i = 0; i < 6; i++)
  22.             {
  23.                 DataRow row = table.NewRow();
  24.                 row["ID"] = ids[i];
  25.                 row["Name"] = names[i];
  26.                 row["Age"] = ages[i];
  27.                 table.Rows.Add(row);
  28.             }
  29.             // 使用foreach
  30.             Dictionary<intint> dic = new Dictionary<intint>();
  31.             foreach (DataRow row in table.Rows)
  32.             {
  33.                 if (!dic.Keys.Contains(Convert.ToInt32(row["Age"])))
  34.                 {
  35.                     dic.Add(Convert.ToInt32(row["Age"]), 1);
  36.                 }
  37.                 else
  38.                 {
  39.                     dic[Convert.ToInt32(row["Age"])]++;
  40.                 }
  41.             }
  42.             foreach (var item in dic)
  43.             {
  44.                 Console.WriteLine("{0}, {1}", item.Key, item.Value);
  45.             }
  46.             Console.WriteLine("=========================================");
  47.             // 使用LINQ (隐式数据类型)
  48.             var ageGroups = table.Rows.Cast<DataRow>().GroupBy(row => Convert.ToInt32(row["Age"]));
  49.             foreach (var group in ageGroups)
  50.             {
  51.                 Console.WriteLine("{0}, {1}", group.Key.ToString(), group.Count().ToString());
  52.             }
  53.             Console.WriteLine("=========================================");
  54.             // 使用LINQ (显式数据类型)
  55.             IEnumerable<IGrouping<int, DataRow>> ageGroups2 = table.Rows.Cast<DataRow>().GroupBy(row => Convert.ToInt32(row["Age"]));
  56.             foreach (IGrouping<int, DataRow> group in ageGroups2)
  57.             {
  58.                 Console.WriteLine("{0}, {1}", group.Key.ToString(), group.Count().ToString());
  59.             }
  60.             Console.WriteLine("=========================================");
  61.             // 很酷的写法
  62.             var ageGroups3 = from row in table.Rows.Cast<DataRow>() group row by Convert.ToInt32(row["Age"]) into resultCollection select resultCollection;
  63.             foreach (var group in ageGroups3)
  64.             {
  65.                 Console.WriteLine("{0}, {1}", group.Key.ToString(), group.Count().ToString());
  66.             }
  67.             Console.WriteLine("=========================================");
  68.             // 比较BT的写法
  69.             foreach (var group in from row in table.Rows.Cast<DataRow>() group row by Convert.ToInt32(row["Age"]) into resultCollection select resultCollection)
  70.             {
  71.                 Console.WriteLine("{0}, {1}", group.Key.ToString(), group.Count().ToString());
  72.             }
  73.         }
  74.     }
  75. }
其中最核心的一句是:var ageGroups = table.Rows.Cast<DataRow>().GroupBy(row => Convert.ToInt32(row[ "Age" ]));
意思是告诉LINQ解析器说“请以Convert.ToInt32(row["Age"])为Key,对row们进行分组,并把这些组放在名为ageGroups的集合中去”。为了不让程序记忆太多的数据类型,C# 3.0提供了var隐式数据类型语法——程序员可以不知道是什么类型、但编译器对类型却清清楚楚。实际上,GroupBy()操作后的结果是一个以IGrouping<int, DataRow> 为元素的IEnumerable<IGrouping<int, DataRow>> 集合。
 
因为GroupBy()操作正好对应有LINQ关键字,所以才有最近两种改写。并不是每个LINQ操作都有对应的LINQ关键字,不知道C# 4.0会不会有所扩展。
 
BTW,因为LINQ操作只能应用在可枚举的集合类型上,而DataTable.Rows集合是个普通集合、不具有可枚举性,所以需要Cast一下。
 
如果这时候客户的需求再改成:列出Age相同的人的Name,那么使用foreach循环的复杂度就有点儿失控了(估计程序员的情绪也比较失控)……而使用LINQ则只需要对每个group进行一下枚举。
 
LINQ语法适合与以下两种情况:
  • 懒人,就像我一样
  • 工资与效率挂钩
OVER




本文转自 水之真谛 51CTO博客,原文链接:http://blog.51cto.com/liutiemeng/95285,如需转载请自行联系原作者
目录
相关文章
|
1月前
|
算法 搜索推荐 大数据
在C++语言中排序、查找和算法的作用
在C++语言中排序、查找和算法的作用
10 0
|
11月前
|
存储 索引
零基础VB教程054期:随机抽取不重复的值
零基础VB教程054期:随机抽取不重复的值
|
SQL 移动开发 BI
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
怎样对数据组合重新排列并去重的问题、通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。本篇文章主要介绍的两个方面,第一个方面曾经有好几个网友和同事问我,第二个问题真的是很多同行的通病,认为分析函数是万金油,一股脑用。
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
|
SQL 搜索推荐 关系型数据库
B+树索引使用(8)排序使用及其注意事项(二十)
B+树索引使用(8)排序使用及其注意事项(二十)
ORDER BY排序太简单?那是因为你还没用过这四大排序函数!
我们在写SQL代码时,只要有排序,首先想到的肯定是ORDER BY,以至于好多小伙伴觉得排序多简单啊。 今天就给大家介绍四个你不怎么常用排序函数,他们就是SQL Server排序中经常用到的ROW_NUMBER(),RANK(),DENSE_RANK(),NTILE()这四个好兄弟。
ORDER BY排序太简单?那是因为你还没用过这四大排序函数!
|
SQL MySQL 关系型数据库
Java实现获得MySQL数据库中所有表的记录总数可行方法
可以通过SELECT COUNT(*) FROM table_name查询某个表中有多少条记录。本文给出两种可行的Java程序查询所有别的记录方法,感兴趣朋友可以了解下 在MySQL中,可以通过SELECT COUNT(*) FROM table_name查询某个表中有多少条记录。如果想知道某个数据库中所有别的记录总数应该怎么做呢?本文给出两种可行的Java程序,解决该问题。 1. 首
1736 0
|
数据库 索引
存在逻辑删除的表字段上建立唯一索引的巧办法 (逻辑删除与唯一索引)
设计数据库唯一索引时,经常会碰到唯一删除的键值,导致很难处理,这里就简单介绍一种巧办法,帮你快速解决该问题
1737 0
存在逻辑删除的表字段上建立唯一索引的巧办法 (逻辑删除与唯一索引)
|
关系型数据库 MySQL 索引
二十七、冗余和重复索引
二十七、冗余和重复索引
100 0
Python编程语言学习:判断两个列表是否对应完全相等(巧解输出是一摸一样的列表数据,但就是不相等)
Python编程语言学习:判断两个列表是否对应完全相等(巧解输出是一摸一样的列表数据,但就是不相等)
|
SQL Oracle 关系型数据库
Oracle数据库之五 限定查询和排序显示
Oracle数据库之五 限定查询和排序显示五、限定查询和排序显示5.1、限定查询5.1.1 认识限定查询例如:如果一张表中有 100w 条数据,一旦执行了 “ SELECT * FROM 表 ” 语句之后,则将在屏幕上显示表中全部数据行的记录,这样既不方便浏览,也可能造成死机的问题,所以此时就必须对查询的结果进行筛选,只选出对自己有用的数据即可,那么就可以通过 WHERE 指定查询的筛选条件。
983 0