当前位置:首页 > 系统运维 > 正文内容

对SQL Server 表中的重复行的正确删除

a8116255316年前 (2010-06-28)系统运维9

此文主要向大家讲述的是正确删除 SQL Server 表的重复行的实际操作步骤,以及对正确删除 SQL Server 表的重复行的实际操作过程中,值得我们大家注意的相关事项的描述,以下就是文章的主要内容描述。

Microsoft SQL Server 表不应该包含重复行和非唯一主键。为简洁起见,在本文中我们有时称主键为“键”或“PK”,但这始终表示“主键”。重复的 PK 违反了实体完整性,在关系系统中是不允许的。SQL Server 有各种强制执行实体完整性的机制,包括索引、唯一约束、主键约束和触发器。

尽管如此,在某些情况下还可能会出现重复的主键;假如出现此类情况,就必须清除重复主键。出现重复主键的情形之一是,在 SQL Server 外部的非关系数据中存在重复的 PK,在导入这些数据时没有强制执行 PK 唯一性。出现重复主键的另一种情形来自数据库设计错误,如没有对每张表强制执行实体完整性。

通常在尝试创建唯一索引时会发现重复的 PK,因为假如找到重复的键,唯一索引的创建即会中止,并且将显示以下消息:

Msg 1505, Level 16, state 1 Create unique index aborted on duplicate key. 

假如使用的是 SQL Server 2000 或 SQL Server 2005,则会收到以下错误消息:

Msg 1505, Level 16, State 1 CREATE UNIQUE INDEX terminated because a duplicate key was found for object name '%.*ls' and index name '%.*ls'.The duplicate key value is %ls.

本文讨论如何查找和删除表中重复的主键。但是,您应该仔细检查出现重复键的进程以避免重复出现。

更多信息

在该示例中,我们将使用下表,它具有重复的 PK 值。在该SQL Server 表中,主键是两列(col1、col2)。我们无法创建唯一索引或主键约束,因为这两行具有重复的 PK。该过程演示如何识别和删除重复的主键。

create table t1(col1 int, col2 int, col3 char(50))   insert into t1 values (1, 1, 'data value one')   insert into t1 values (1, 1, 'data value one')   insert into t1 values (1, 2, 'data value two') 

之一步是识别哪些行具有重复的主键值:

SELECT col1, col2, count(*)   FROM t1   GROUP BY col1, col2   HAVING count(*) > 1 

这将为SQL Server 表中的每组重复的 PK 值返回一行。此结果中的最后一列是特定 PK 值的重复数。

col1 col2   1 1 2 

假如只有几组重复的 PK 值,则更佳 *** 是手动逐个删除它们。例如:

set rowcount 1   delete from t1   where col1=1 and col2=1 

rowcount 值应该是给定键值的重复数减去 1。在该示例中,有 2 个重复的主键,所以 rowcount 被设置为 1。col1/col2 值来自上面的 GROUP BY 查询结果。假如 GROUP BY 查询返回多行,则“set rowcount”查询将必须为这些行中的每一行各运行一次。每次运行该查询时,将 rowcount 设置为特定 PK 值的重复数减去 1。

在删除行之前,您应该验证是否整行重复。虽然整行重复不太可能发生,但可能 PK 值重复,而整行不重复。例如一个将身份证号码作为主键的表,该表有两个具有相同号码的不同的人(即行),但每个人有唯一的属性。在这种情况下,任何引起重复键的问题可能还引起在行中放入有效的唯一的数据。在删除该数据之前,应该将该数据复制出来并保存下来以进行研究和适当的调整。

假如表中有多组完全不同的重复的 PK 值,则逐个删除它们会很费时间。在这种情况下,可使用下面的 *** : 1.首先,运行上面的 GROUP BY 查询来确定有多少组重复的 PK 值及每组的重复数。

2.选择重复的键值放入临时表中。例如:

SELECT col1, col2, col3=count(*)   INTO holdkey   FROM t1   GROUP BY col1, col2   HAVING count(*) > 1 

3.选择重复的行放入临时表中,以清除进程中的重复值。例如:

SELECT DISTINCT t1.*   INTO holddups   FROM t1, holdkey   WHERE t1.col1 = holdkey.col1   AND t1.col2 = holdkey.col2 

4.此时,holddups 表应有唯一的 PK;但是,假如 t1 有重复的 PK 而行唯一(如上面的 SSN 示例),情况就不是这样了。请验证 holddups 中的各个键是否唯一,是否没有键重复而行唯一的情况。假如是这样,您必须停在该处,确定对于给定重复的键值,您希望保留哪些行。例如,以下查询:

SELECT col1, col2, count(*)   FROM holddups   GROUP BY col1, col2 

应为各行返回计数 1。假如结果是 1,请继续执行下面的步骤 5。假如不是 1,则存在键重复而行唯一的情况,且需要您决定要保存哪些行。通常,这将需要舍弃行或为此行创建新的唯一的键值。为 holddups 表中每个此种重复 PK 执行这两个步骤之一。

5.从原始SQL Server 表中删除重复的行。例如:

DELETE t1   FROM t1, holdkey   WHERE t1.col1 = holdkey.col1   AND t1.col2 = holdkey.col2 

6.将唯一行放回原始表中。例如:

INSERT t1 SELECT * FROM holddups 

以上的相关内容就是对如何删除 SQL Server 表中的重复行的介绍,望你能有所收获。

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://2345hao.cn/blog/index.php/post/21293.html

分享给朋友:

“对SQL Server 表中的重复行的正确删除” 的相关文章

windows 7鼠标停顿怎么办?windows 7 usb鼠标停顿的原因以及解决

windows 7鼠标停顿怎么办?windows 7 usb鼠标停顿的原因以及解决

很多使用Windows 7系统的朋友都想小编反应,假如暂停使用电脑,鼠标会出现停顿现象,这是怎么回事呢 该怎么解决呢 下面就和小编一起去看下Windows 7 usb鼠标停顿的解决方法吧。 由于Windows 7系统中有一项USB选择性暂停造成的。这项设置主要为了节电,当他检测到用户没有对系统进行...

windows 7/8.1正在启动windows时间长的解决方法

windows 7/8.1正在启动windows时间长的解决方法

正在启动windows时间长怎么办 小编带来了Windows 7/8.1正在启动windows时间长解决方法,假如有朋友在安装完Windows系统之后一直停留在“正在启动windows”的话,不妨试一试下文的方法哦~ 原因:Windows 7/8.1不完全支持UEFI,需要CSM(Comp...

windows 7系统开机提示press any key to restart的故障分析及解

windows 7系统开机提示press any key to restart的故障分析及解

Windows 7 64位系统开机后提示"press any key to restart",无法进入系统了,具体现象如下所示: 故障分析: 故障的主要原因还是硬盘的问题,可以先检查是不是接触不良或坏了,进行修复或更换即可。 解决方法: 1、开机按F8不动到高级选项出现在松手,选“...

windows 7系统件夹和文件都不显示名字如何解决

windows 7系统件夹和文件都不显示名字如何解决

假如碰到电脑里的文件夹和文件全都不显示名字了(如下图),是不是电脑中毒了呢 请教下笔者有没好的解决方法!下面是笔者给出的答案,希望能够帮助到大家! 首先打开你用来装图片的文件夹(缩略图下面的文字不显示的文件夹),然后但击工具栏上的“查看”选择“平铺”, 下面就是关键:要按住SHIFT键不...

Windows7截图出现黑屏导致截的图黑呼呼一片

Windows7截图出现黑屏导致截的图黑呼呼一片

最近一些Windows 7用户反馈说,自己在截屏的时候出现黑屏,导致自己截的图黑呼呼一片。这个问题该怎么解决?今天小编就为大家提供一个解决的方法。 步骤 1 在windows xp时代,很多用户都曾被视频截图后的“全黑图片”困扰。对此,在解决本地播放时出现的截图变黑问题,一般有两个方法可以用来解...

windows 7旗舰版系统提示应用程序错误代码0xc0000409的故障原因

windows 7旗舰版系统提示应用程序错误代码0xc0000409的故障原因

问题现象,具体如下所示:  故障分析: 一般来说,出现这种情况是因为电脑误删系统文件或者是系统文件被顽固木马破坏。       解决方法: 1、下载360安全卫士,找到里面的急救箱开始急救,然后进行修复,完成后重新启动; 2、下载瑞...