Зараз ви перебуваєте в автономному режимі; очікується повторне підключення до Інтернету

Làm thế nào để loại bỏ trùng lặp hàng từ một bàn trong SQL Server

QUAN TRỌNG: Bài viết này được dịch bằng phần mềm dịch máy của Microsoft chứ không phải do con người dịch. Microsoft cung cấp các bài viết do con người dịch và cả các bài viết do máy dịch để bạn có thể truy cập vào tất cả các bài viết trong Cơ sở Kiến thức của chúng tôi bằng ngôn ngữ của bạn. Tuy nhiên, bài viết do máy dịch không phải lúc nào cũng hoàn hảo. Loại bài viết này có thể chứa các sai sót về từ vựng, cú pháp hoặc ngữ pháp, giống như một người nước ngoài có thể mắc sai sót khi nói ngôn ngữ của bạn. Microsoft không chịu trách nhiệm về bất kỳ sự thiếu chính xác, sai sót hoặc thiệt hại nào do việc dịch sai nội dung hoặc do hoạt động sử dụng của khách hàng gây ra. Microsoft cũng thường xuyên cập nhật phần mềm dịch máy này.

Nhấp chuột vào đây để xem bản tiếng Anh của bài viết này:139444
TÓM TẮT
Microsoft SQL Server bảng không bao giờ nên chứa hàng trùng lặp, cũng khôngkhông duy nhất phím chính. Cho ngắn gọn, đôi khi chúng tôi sẽ đề cập đến chínhphím như "khóa" hoặc "PK" trong bài này, nhưng điều này sẽ luôn luôn biểu thị "chínhbaám giöõ phím." Trùng lặp PKs là một sự vi phạm của toàn vẹn thực thể, và nênkhông được phep trong một quan hệ thống. SQL Server có cơ chế khác nhau chothực thi toàn vẹn thực thể, trong đó có chỉ số, những hạn chế duy nhất,KHÓA chính khó khăn, và gây nên.

Mặc dù vậy, trong trường hợp bất thường trùng lặp phím chính có thể tồn tại,và nếu như vậy họ phải được loại bỏ. Có một cách họ thể xảy ra là nếu trùng lặpPKs tồn tại trong dữ liệu không quan hệ bên ngoài SQL Server, và dữ liệu lànhập khẩu trong khi tính độc đáo PK không được thi hành. Một cách khác để họ có thểxảy ra là thông qua một lỗi thiết kế cơ sở dữ liệu, chẳng hạn như là không thực thi thực thểtoàn vẹn trên mỗi bảng.

Thường trùng lặp PKs được nhận thấy khi bạn cố gắng tạo ra một chỉ số duy nhất,mà sẽ hủy bỏ nếu trùng lặp phím được tìm thấy. Thư này là:
Msg 1505, cấp 16, bang 1Tạo chỉ mục duy nhất bị bỏ dở trùng lặp phím.
Nếu bạn đang sử dụng SQL Server 2000 hoặc SQL Server 2005, bạn có thể nhận được thông báo lỗi sau:
Msg 1505, cấp 16, bang 1 tạo độc đáo INDEX chấm dứt vì một trùng lặp phím được tìm thấy cho tên đối tượng ' %. * ls' và chỉ số tên ' %. * ls'. Giá trị key trùng lặp là % ls.
Bài viết này thảo luận về làm thế nào để xác định vị trí và loại bỏ trùng lặp phím chính từmột bảng. Tuy nhiên, bạn nên kiểm tra chặt chẽ quá trình mà cho phép cácliệu xảy ra để ngăn ngừa tái phát.

THÔNG TIN THÊM
Ví dụ này, chúng tôi sẽ sử dụng bảng sau đây với giá trị PK trùng lặp.Trong bảng này chính là hai cột (col1, col2). Chúng tôi không thểtạo ra một chỉ mục duy nhất hoặc hạn chế khóa chính kể từ khi hai hàng cóPKs trùng lặp. Thủ tục này minh hoạ cách nhận biết và loại bỏ cácbản sao.
create table t1(col1 int, col2 int, col3 char(50))insert into t1 values (1, 1, 'data value one')insert into t1 values (1, 1, 'data value one')insert into t1 values (1, 2, 'data value two')				
Bước đầu tiên là để xác định đó hàng có trùng lặp giá trị chính chủ chốt:
SELECT col1, col2, count(*)FROM t1GROUP BY col1, col2HAVING count(*) > 1				
Điều này sẽ trả về một hàng cho mỗi bộ trùng lặp PK giá trị trong bảng.Các cột qua theo kết quả này là số lượng bản sao cho cáccụ thể PK giá trị.

col1col2
112


Nếu có chỉ một vài bộ của trùng lặp PK giá trị, các thủ tục tốt nhất làđể xóa này bằng tay trên cơ sở cá nhân. Ví dụ:
set rowcount 1delete from t1where col1=1 and col2=1				
Giá trị rowcount nên là n-1 số liệu cho một giá trị quan trọng nhất định. Trong ví dụ này, có 2 bản sao như vậy rowcount được thiết lập để 1. Các giá trị col1/col2 được lấy từ ở trên nhóm bởi truy vấn quả. Nếu truy vấn nhóm bởi trả về nhiều hàng, "thiết lập rowcount" truy vấn sẽ phải được chạy một lần cho mỗi của các hàng. Mỗi khi nó được điều hành, đặt rowcount n-1 số liệu của giá trị PK cụ thể.

Trước khi xóa các hàng, bạn nên chắc chắn rằng toàn bộ hàng cólặp lại. Trong khi không, nó có thể là giá trị PK là trùng lặp,Tuy nhiên, không phải là hàng như một toàn thể. Một ví dụ về điều này sẽ là một bảng vớiSố an sinh xã hội như khóa chính, và có hai người khác nhau(hoặc hàng) với cùng một số, mỗi có thuộc tính duy nhất. Trong đómột trường hợp bất kỳ sự cố gây ra chìa khóa trùng lặp có thể đã gây ra cũngdữ liệu duy nhất hợp lệ phải được đặt trong hàng. Dữ liệu này nên sao chép vàbảo quản cho nghiên cứu và có thể hòa giải trước khi để xóa dữ liệu.

Nếu không có nhiều khác biệt tập hợp các giá trị PK trùng lặp trong bảng, nó có thểđược quá tốn thời gian để loại bỏ chúng riêng rẽ. Trong trường hợp này cáctheo thủ tục có thể được sử dụng:
 1. Trước tiên, chạy truy trên nhóm bởi vấn để xác định có bao nhiêu bộ trùng lặp PK giá trị tồn tại, và số đếm bản sao cho mỗi tập.
 2. Chọn các giá trị quan trọng trùng lặp vào một bảng đang nắm giữ. Ví dụ:
  SELECT col1, col2, col3=count(*)INTO holdkeyFROM t1GROUP BY col1, col2HAVING count(*) > 1					
 3. Chọn các hàng trùng lặp vào một bảng đang nắm giữ, loại bỏ bản sao trong quá trình. Ví dụ:
  SELECT DISTINCT t1.*INTO holddupsFROM t1, holdkeyWHERE t1.col1 = holdkey.col1AND t1.col2 = holdkey.col2					
 4. Tại thời điểm này, bảng holddups nên có duy nhất PKs, tuy nhiên, điều này sẽ không là các trường hợp nếu t1 có trùng lặp PKs, nhưng độc đáo hàng (như trong ví dụ SSN trên). Kiểm chứng rằng mỗi chính trong holddups là duy nhất, và bạn không có chìa khóa trùng lặp, nhưng độc đáo hàng. Nếu như vậy, bạn phải dừng lại ở đây và tiến hành hoà giải mà hàng bạn muốn giữ một giá trị nhất định key trùng lặp. Ví dụ, truy vấn:
  SELECT col1, col2, count(*)FROM holddupsGROUP BY col1, col2						
  nên trở về một số 1 cho mỗi dòng. Nếu có, tiến hành bước 5 dưới đây. Nếu không, bạn có trùng lặp phím, nhưng độc đáo hàng và cần phải quyết định mà hàng để tiết kiệm. Điều này thường sẽ gây discarding liên tiếp, hoặc tạo một giá trị duy nhất quan trọng mới cho dòng này. Mất một trong những bước hai cho mỗi như vậy PK trùng lặp trong bảng holddups.
 5. Xóa các hàng trùng lặp từ ban đầu bảng. Ví dụ:
  DELETE t1FROM t1, holdkeyWHERE t1.col1 = holdkey.col1AND t1.col2 = holdkey.col2					
 6. Đặt hàng duy nhất lại trong bảng gốc. Ví dụ:
  INSERT t1 SELECT * FROM holddups					
sql6 dedupe thực thể intg

Cảnh báo: Bài viết này được dịch tự động

Властивості

Ідентифікатор статті: 139444 – останній перегляд: 09/17/2011 22:40:00 – виправлення: 3.0

Microsoft SQL Server 6.0 Standard Edition, Microsoft SQL Server 6.5 Standard Edition, Microsoft SQL Server 7.0 Standard Edition, Microsoft SQL Server 2000 Standard Edition, Microsoft SQL Server 2005 Standard Edition, Microsoft SQL Server 2005 Express Edition, Microsoft SQL Server 2005 Developer Edition, Microsoft SQL Server 2005 Enterprise Edition, Microsoft SQL Server 2005 Workgroup Edition

 • kbsqlsetup kbinfo kbusage kbmt KB139444 KbMtvi
Зворотний зв’язок