日期:2014-05-16  浏览次数:20384 次

关于Oracle去除重复的问题

1):Oracle的row_number() over函数消除重复的记录

例子:

1.select d.id,d.outer_code from dict_depts_source d order by outer_code(查看重复数据)

2.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(标识重复数据)

3.delete from dict_depts_source where id in(
select id from(select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d)t
where t.row_flag > 1)(删除重复数据)

3.select d.id,d.outer_code,row_number() over(partition by outer_code order by outer_code) row_flag from dict_depts_source d(检查删除效果)

?row_number() over ([partition by col1] order by col2) ) as 别名
表示根据col1分组,在分组内部根据 col2排序
而这个“别名”的值就表示每组内部排序后的顺序编号(组内连续的唯一的),[partition by col1] 可省略。

2)

distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用 它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。

下面先来看看例子:

table表

字段1 字段2
id name
1 a
2 b
3 c
4 c
5 b

库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。

比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。

select distinct name from table
得到的结果是:

?

----------

name
a
b
c

好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:

select distinct name, id from table

?结果会是:

----------

id name
1 a
2 b
3 c
4 c
5 b

distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。

我们再改改查询语句:

select id, distinct name from table

?

很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。

------------------------------------------------------------------------

下面方法可行:

select *, count(distinct name) from table group by name

?结果:

id name count(distinct name)
1 a 1
2 b 1
3 c 1

最后一项是多余的,不用管就行了,目的达到。。。。。

group by 必须放在 order by 和 limit之前,不然会报错

?

?项目中实际用到的? 例如从重复记录里面只取一条记录

1.SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS
2.SELECT * FROM (SELECT PACTGOODID,PACTID,ORDERCODE,ORDERID,GOODNAME,ROW_NUMBER() OVER(PARTITION BY PACTID ORDER BY PACTID) ROW_FLAG FROM ENTRUST_PACT_GOODS GOODS) WHERE ROW_FLAG = 1

??