获取具有列的最大值的行-Java 学习之路

516

表：

UserId, Value, Date.

我想得到UserId，每个UserId的max（Date）值 . 也就是说，具有最新日期的每个UserId的值 . 有没有办法在SQL中简单地执行此操作？（最好是Oracle）

Update: 对于任何含糊不清的道歉：我需要获取所有UserIds . 但对于每个UserId，只有该用户具有最新日期的那一行 .

30 回答

0
只需要在工作中写一个“实时”的例子:)

这个在 same 日期支持UserId的多个值 .

列：UserId，Value，日期
```
SELECT
   DISTINCT UserId,
   MAX(Date) OVER (PARTITION BY UserId ORDER BY Date DESC),
   MAX(Values) OVER (PARTITION BY UserId ORDER BY Date DESC)
FROM
(
   SELECT UserId, Date, SUM(Value) As Values
   FROM <<table_name>>
   GROUP BY UserId, Date
)
```
您可以使用FIRST_VALUE而不是MAX，并在解释计划中查找它 . 我没有时间玩它 .

当然，如果在巨大的表中搜索，如果在查询中使用FULL提示可能会更好 .
回复于 2024-05-04T01:09:27+08:00
360
我已经迟到了，但是下面的黑客将胜过相关的子查询和任何分析功能但有一个限制：值必须转换为字符串 . 所以它适用于日期，数字和其他字符串 . 代码看起来不太好但执行配置文件很棒 .
```
select
    userid,
    to_number(substr(max(to_char(date,'yyyymmdd') || to_char(value)), 9)) as value,
    max(date) as date
from 
    users
group by
    userid
```
这段代码运行良好的原因是它只需要扫描一次表 . 它不需要任何索引，最重要的是它不需要对表进行排序，这是大多数分析功能所做的 . 如果您需要过滤单个用户标识的结果，索引将有所帮助 .
回复于 2024-05-04T01:09:27+08:00

首先尝试我误解了问题，按照最佳答案，这是一个完整的例子，结果正确：

CREATE TABLE table_name (id int, the_value varchar(2), the_date datetime);

INSERT INTO table_name (id,the_value,the_date) VALUES(1 ,'a','1/1/2000');
INSERT INTO table_name (id,the_value,the_date) VALUES(1 ,'b','2/2/2002');
INSERT INTO table_name (id,the_value,the_date) VALUES(2 ,'c','1/1/2000');
INSERT INTO table_name (id,the_value,the_date) VALUES(2 ,'d','3/3/2003');
INSERT INTO table_name (id,the_value,the_date) VALUES(2 ,'e','3/3/2003');

select id, the_value
      from table_name u1
      where the_date = (select max(the_date)
                     from table_name u2
                     where u1.id = u2.id)

id          the_value
----------- ---------
2           d
2           e
1           b

(3 row(s) affected)

回复于 2024-05-04T01:09:27+08:00

我shuold你做这个变种以前的查询：

SELECT UserId, Value FROM Users U1 WHERE 
Date = ( SELECT MAX(Date)    FROM Users where UserId = U1.UserId)

回复于 2024-05-04T01:09:27+08:00

3
我觉得这样的事情 . （请原谅我任何语法错误;此时我习惯使用HQL！）

编辑：也误读了这个问题！更正了查询...
```
SELECT UserId, Value
FROM Users AS user
WHERE Date = (
    SELECT MAX(Date)
    FROM Users AS maxtest
    WHERE maxtest.UserId = user.UserId
)
```
回复于 2024-05-04T01:09:27+08:00

411

我认为这应该有用吗？

Select
T1.UserId,
(Select Top 1 T2.Value From Table T2 Where T2.UserId = T1.UserId Order By Date Desc) As 'Value'
From
Table T1
Group By
T1.UserId
Order By
T1.UserId

回复于 2024-05-04T01:09:27+08:00

我知道你要求Oracle，但在SQL 2005中我们现在使用它：

-- Single Value
;WITH ByDate
AS (
SELECT UserId, Value, ROW_NUMBER() OVER (PARTITION BY UserId ORDER BY Date DESC) RowNum
FROM UserDates
)
SELECT UserId, Value
FROM ByDate
WHERE RowNum = 1

-- Multiple values where dates match
;WITH ByDate
AS (
SELECT UserId, Value, RANK() OVER (PARTITION BY UserId ORDER BY Date DESC) Rnk
FROM UserDates
)
SELECT UserId, Value
FROM ByDate
WHERE Rnk = 1

回复于 2024-05-04T01:09:27+08:00

没有分区KEEP，DENSE_RANK概念的MySQL解决方案 .

select userid,
       my_date,
       ...
from
(
select @sno:= case when @pid<>userid then 0
                    else @sno+1
    end as serialnumber, 
    @pid:=userid,
       my_Date,
       ...
from   users order by userid, my_date
) a
where a.serialnumber=0

参考：http://benincampus.blogspot.com/2013/08/select-rows-which-have-maxmin-value-in.html

回复于 2024-05-04T01:09:27+08:00

使用PostgreSQL 8.4或更高版本，您可以使用：

select user_id, user_value_1, user_value_2
  from (select user_id, user_value_1, user_value_2, row_number()
          over (partition by user_id order by user_date desc) 
        from users) as r
  where r.row_number=1

回复于 2024-05-04T01:09:27+08:00

没有工作，我没有掌握Oracle，但我似乎记得Oracle允许在IN子句中匹配多个列，这至少应该避免使用相关子查询的选项，这很少是一个好的理念 .

也许这样的事情（不记得列列表是否应该括号括起来）：

SELECT * 
FROM MyTable
WHERE (User, Date) IN
  ( SELECT User, MAX(Date) FROM MyTable GROUP BY User)

编辑：刚尝试真实：

SQL> create table MyTable (usr char(1), dt date);
SQL> insert into mytable values ('A','01-JAN-2009');
SQL> insert into mytable values ('B','01-JAN-2009');
SQL> insert into mytable values ('A', '31-DEC-2008');
SQL> insert into mytable values ('B', '31-DEC-2008');
SQL> select usr, dt from mytable
  2  where (usr, dt) in 
  3  ( select usr, max(dt) from mytable group by usr)
  4  /

U DT
- ---------
A 01-JAN-09
B 01-JAN-09

所以它有效，尽管其他地方提到的一些新东西可能更具性能 .

回复于 2024-05-04T01:09:27+08:00

select userid, value, date
  from thetable t1 ,
       ( select t2.userid, max(t2.date) date2 
           from thetable t2 
          group by t2.userid ) t3
 where t3.userid t1.userid and
       t3.date2 = t1.date

恕我直言这个工作 . HTH

回复于 2024-05-04T01:09:27+08:00

Select  
   UserID,  
   Value,  
   Date  
From  
   Table,  
   (  
      Select  
          UserID,  
          Max(Date) as MDate  
      From  
          Table  
      Group by  
          UserID  
    ) as subQuery  
Where  
   Table.UserID = subQuery.UserID and  
   Table.Date = subQuery.mDate

回复于 2024-05-04T01:09:27+08:00

（T-SQL）首先获取所有用户及其maxdate . 加入表以查找maxdates上用户的相应值 .

create table users (userid int , value int , date datetime)
insert into users values (1, 1, '20010101')
insert into users values (1, 2, '20020101')
insert into users values (2, 1, '20010101')
insert into users values (2, 3, '20030101')

select T1.userid, T1.value, T1.date 
    from users T1,
    (select max(date) as maxdate, userid from users group by userid) T2    
    where T1.userid= T2.userid and T1.date = T2.maxdate

结果：

userid      value       date                                    
----------- ----------- -------------------------- 
2           3           2003-01-01 00:00:00.000
1           2           2002-01-01 00:00:00.000

回复于 2024-05-04T01:09:27+08:00

假设Date对于给定的UserID是唯一的，这里有一些TSQL：

SELECT 
    UserTest.UserID, UserTest.Value
FROM UserTest
INNER JOIN
(
    SELECT UserID, MAX(Date) MaxDate
    FROM UserTest
    GROUP BY UserID
) Dates
ON UserTest.UserID = Dates.UserID
AND UserTest.Date = Dates.MaxDate

回复于 2024-05-04T01:09:27+08:00

2
QUALIFY条款不是最简单也最好的吗？
```
select userid, my_date, ...
from users
qualify rank() over (partition by userid order by my_date desc) = 1
```
对于上下文，在Teradata上这里有一个不错的尺寸测试，在17秒内运行此QUALIFY版本，在23秒内运行'内联视图'/ Aldridge解决方案＃1 .
回复于 2024-05-04T01:09:27+08:00

如果你正在使用Postgres，你可以使用 array_agg 之类的

SELECT userid,MAX(adate),(array_agg(value ORDER BY adate DESC))[1] as value
FROM YOURTABLE
GROUP BY userid

我不熟悉Oracle . 这就是我提出的

SELECT 
  userid,
  MAX(adate),
  SUBSTR(
    (LISTAGG(value, ',') WITHIN GROUP (ORDER BY adate DESC)),
    0,
    INSTR((LISTAGG(value, ',') WITHIN GROUP (ORDER BY adate DESC)), ',')-1
  ) as value 
FROM YOURTABLE
GROUP BY userid

两个查询都返回与接受的答案相同的结果 . 请参阅SQLFiddles：

回复于 2024-05-04T01:09:27+08:00

1
刚刚测试了它，它似乎在日志表上工作
```
select ColumnNames, max(DateColumn) from log  group by ColumnNames order by 1 desc
```
回复于 2024-05-04T01:09:27+08:00

我不知道你确切的列名，但它会是这样的：

select userid, value
      from users u1
     where date = (select max(date)
                     from users u2
                    where u1.userid = u2.userid)

回复于 2024-05-04T01:09:27+08:00

1
我没有Oracle来测试它，但最有效的解决方案是使用分析查询 . 它应该看起来像这样：
```
SELECT DISTINCT
    UserId
  , MaxValue
FROM (
    SELECT UserId
      , FIRST (Value) Over (
          PARTITION BY UserId
          ORDER BY Date DESC
        ) MaxValue
    FROM SomeTable
  )
```
我怀疑你可以摆脱外部查询，并在内部区分，但我不确定 . 与此同时，我知道这个有效 .

如果您想了解分析查询，我建议您阅读http://www.orafaq.com/node/55和http://www.akadia.com/services/ora_analytic_functions.html . 这是简短的总结 .

在引擎盖下，分析查询对整个数据集进行排序，然后按顺序处理它 . 在处理它时，您根据特定条件对数据集进行分区，然后为每一行查看某个窗口（默认为分区中第一个到当前行的值 - 默认值也是最有效的）并且可以使用分析函数的数量（其列表与聚合函数非常相似） .

在这种情况下，这是内部查询的作用 . 整个数据集按UserId排序，然后按Date DESC排序 . 然后它一次处理它 . 对于每一行，您返回UserId和该UserId看到的第一个日期（因为日期是DESC排序的，即最大日期） . 这为您提供了重复行的答案 . 然后外部DISTINCT压缩重复 .

这不是分析查询的一个特别壮观的例子 . 要获得更大的胜利，请考虑为每个用户和收据计算一份财务收据表，并计算他们支付的总额 . 分析查询可以有效地解决问题 . 其他解决方案效率较低 . 这就是为什么它们是2003 SQL标准的一部分 . （不幸的是Postgres还没有它们.Grrr ......）
回复于 2024-05-04T01:09:27+08:00
2
这将检索my_date列值等于该userid的my_date的最大值的所有行 . 这可以检索用户ID的多行，其中最大日期在多行上 .
```
select userid,
       my_date,
       ...
from
(
select userid,
       my_Date,
       ...
       max(my_date) over (partition by userid) max_my_date
from   users
)
where my_date = max_my_date
```
“分析功能摇滚”

编辑：关于第一条评论......

“使用分析查询和自连接会破坏分析查询的目的”

此代码中没有自联接 . 而是在内联视图的结果上放置了一个谓词，其中包含分析函数 - 一个非常不同的问题，以及完全标准的实践 .

“Oracle中的默认窗口是从分区的第一行到当前的一行”

windowing子句仅适用于order by子句的存在 . 如果没有order by子句，则默认情况下不应用windowing子句，并且不能显式指定任何窗口子句 .

代码有效 .
回复于 2024-05-04T01:09:27+08:00
5
使用ROW_NUMBER()为每个 UserId 降序 Date 分配一个唯一的排名，然后过滤到每个 UserId 的第一行（即 ROW_NUMBER = 1） .
```
SELECT UserId, Value, Date
FROM (SELECT UserId, Value, Date,
        ROW_NUMBER() OVER (PARTITION BY UserId ORDER BY Date DESC) rn
      FROM users) u
WHERE rn = 1;
```
回复于 2024-05-04T01:09:27+08:00

这应该很简单：

SELECT UserId, Value
FROM Users u
WHERE Date = (SELECT MAX(Date) FROM Users WHERE UserID = u.UserID)

回复于 2024-05-04T01:09:27+08:00

这也将处理重复（为每个user_id返回一行）：

SELECT *
FROM (
  SELECT u.*, FIRST_VALUE(u.rowid) OVER(PARTITION BY u.user_id ORDER BY u.date DESC) AS last_rowid
  FROM users u
) u2
WHERE u2.rowid = u2.last_rowid

回复于 2024-05-04T01:09:27+08:00

SELECT userid, MAX(value) KEEP (DENSE_RANK FIRST ORDER BY date DESC)
  FROM table
  GROUP BY userid

回复于 2024-05-04T01:09:27+08:00

149
在 Oracle 12c+ 中，您可以使用前n个查询以及分析函数 rank 来实现这一点，而不需要子查询：
```
select *
from your_table
order by rank() over (partition by user_id order by my_date desc)
fetch first 1 row with ties;
```
以上内容返回每个用户最大my_date的所有行 .

如果只想要一行具有最大日期，则将 rank 替换为 row_number ：
```
select *
from your_table
order by row_number() over (partition by user_id order by my_date desc)
fetch first 1 row with ties;
```
回复于 2024-05-04T01:09:27+08:00

select   UserId,max(Date) over (partition by UserId) value from users;

回复于 2024-05-04T01:09:27+08:00

如果（UserID，Date）是唯一的，即同一用户没有出现两次日期，则：

select TheTable.UserID, TheTable.Value
from TheTable inner join (select UserID, max([Date]) MaxDate
                          from TheTable
                          group by UserID) UserMaxDate
     on TheTable.UserID = UserMaxDate.UserID
        TheTable.[Date] = UserMaxDate.MaxDate;

回复于 2024-05-04T01:09:27+08:00

47
我看到很多人使用子查询或特定于供应商的功能来执行此操作，但我经常以下列方式执行此类查询而不使用子查询 . 它使用普通的标准SQL，因此它应该适用于任何品牌的RDBMS .
```
SELECT t1.*
FROM mytable t1
  LEFT OUTER JOIN mytable t2
    ON (t1.UserId = t2.UserId AND t1."Date" < t2."Date")
WHERE t2.UserId IS NULL;
```
换句话说：从 t1 获取行，其中不存在具有相同 UserId 和更大日期的其他行 .

（我将标识符“Date”放在分隔符中，因为它是一个SQL保留字 . ）

如果 t1."Date" = t2."Date" ，则出现加倍 . 通常表具有 auto_inc(seq) 键，例如 id . 为避免加倍可以使用如下：
```
SELECT t1.*
FROM mytable t1
  LEFT OUTER JOIN mytable t2
    ON t1.UserId = t2.UserId AND ((t1."Date" < t2."Date") 
         OR (t1."Date" = t2."Date" AND t1.id < t2.id))
WHERE t2.UserId IS NULL;
```
来自@Farhan的评论：

这是一个更详细的解释：

外连接尝试将 t1 与 t2 连接 . 默认情况下，返回 t1 的所有结果，如果 t2 中存在匹配项，则还会返回该结果 . 如果 t2 中 t1 的给定行没有匹配项，则查询仍会返回 t1 行，并使用 NULL 作为所有 t2 's columns. That'的占位符，一般外部联接的工作方式 .

此查询中的技巧是设计连接的匹配条件，使 t2 必须匹配相同的 userid ，以及更大的 date . 这个想法是，如果 t2 中有一行有更大的 date ，那么 t1 中它与之比较的行不能是 userid 的最大 date . 但是如果没有匹配 - 即如果 t2 中没有行 date 比 t1 中的行更大 - 我们知道 t1 中的行是给定 userid 的 date 最大的行 .

在这些情况下（当没有匹配时）， t2 的列将是 NULL - 甚至是连接条件中指定的列 . 这就是为什么我们使用 WHERE t2.UserId IS NULL ，因为我们正在搜索没有找到行的情况，给定 userid 的 date 更大 .
回复于 2024-05-04T01:09:27+08:00

select VALUE from TABLE1 where TIME = 
   (select max(TIME) from TABLE1 where DATE= 
   (select max(DATE) from TABLE1 where CRITERIA=CRITERIA))

回复于 2024-05-04T01:09:27+08:00

这里的答案只是Oracle . 这是所有SQL中更复杂的答案：

谁拥有最佳的整体作业成绩（最多家庭作业总数）？

SELECT FIRST, LAST, SUM(POINTS) AS TOTAL
FROM STUDENTS S, RESULTS R
WHERE S.SID = R.SID AND R.CAT = 'H'
GROUP BY S.SID, FIRST, LAST
HAVING SUM(POINTS) >= ALL (SELECT SUM (POINTS)
FROM RESULTS
WHERE CAT = 'H'
GROUP BY SID)

还有一个更难的例子，需要一些解释，我没有时间atm：

提供2008年最受欢迎的书籍（ISBN和书名），即2008年最常借用的书籍 .

SELECT X.ISBN, X.title, X.loans
FROM (SELECT Book.ISBN, Book.title, count(Loan.dateTimeOut) AS loans
FROM CatalogEntry Book
LEFT JOIN BookOnShelf Copy
ON Book.bookId = Copy.bookId
LEFT JOIN (SELECT * FROM Loan WHERE YEAR(Loan.dateTimeOut) = 2008) Loan 
ON Copy.copyId = Loan.copyId
GROUP BY Book.title) X
HAVING loans >= ALL (SELECT count(Loan.dateTimeOut) AS loans
FROM CatalogEntry Book
LEFT JOIN BookOnShelf Copy
ON Book.bookId = Copy.bookId
LEFT JOIN (SELECT * FROM Loan WHERE YEAR(Loan.dateTimeOut) = 2008) Loan 
ON Copy.copyId = Loan.copyId
GROUP BY Book.title);

希望这有助于（任何人）.. :)

问候，Guus

回复于 2024-05-04T01:09:27+08:00

获取具有列的最大值的行

30 回答

相关问题