从不同用户会话列表中选择最早的日期和时间-Java 学习之路

我有一个用户访问会话表，记录网站访问者活动：

accessid, userid, date, time, url

我正在尝试检索用户ID 1234的所有不同会话，以及每个不同会话的最早日期和时间 .

SELECT 
    DISTINCT accessid, 
    date, 
    time 
FROM 
    accesslog 
WHERE userid = '1234' 
GROUP BY accessid

这给了我每个不同的accessid中随机行的日期和时间 . 我已经阅读了一些推荐使用min（）和max（）的帖子，所以我尝试了：

SELECT DISTINCT accessid, MIN(DATE) AS date, MIN(TIME) AS time FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC

... 乃至...

SELECT DISTINCT accessid, MIN(CONCAT(DATE, ' ', TIME)) AS datetime FROM accesslog WHERE userid = '1234' GROUP BY accessid ORDER BY date DESC, time DESC

...但我从来没有得到最早的日期和时间的正确结果 .

订购此类查询的诀窍是什么？

编辑 -

Something weird is happening....

Bill Karwin在下面发布的代码正确地检索了2009-09开始的会话的最早日期和时间 . 但是，对于在2009-08某天开始的 Session ，当前月份发生的第一次点击的时间和日期是返回的 . 换句话说， query does not appear to be spanning months!

示例数据集：

accessid    | userid    | date          | time
1           | 1234      | 2009-08-15    | 01:01:01
1           | 1234      | 2009-09-01    | 12:01:01
1           | 1234      | 2009-09-15    | 13:01:01
2           | 1234      | 2009-09-01    | 14:01:01
2           | 1234      | 2009-09-15    | 15:01:01

至少在我的实际数据表中，下面发布的查询找到了两个accessid中每个的最早的日期和时间：

accessid    | userid    | date          | time
1           | 1234      | 2009-09-01    | 12:01:01
2           | 1234      | 2009-09-01    | 14:01:01

...我猜想accessid 2的结果看起来正确的唯一原因是因为它在前一个月没有命中 .

我疯了吗？

编辑2 -

答案是肯定的，我疯了 . 当放置在具有重复结构的表中时，该查询对上述样本数据起作用 .

这是（截断的）原始数据 . 我包括了第一次打击，同月的另一次打击，下个月的第一次打击，然后是本月的最后一次打击 . 原始数据集在这些点之间有更多的匹配，总共462行 .

accessid                            | date          | time
cbb82c08d3103e721a1cf0c3f765a842    | 2009-08-18    | 04:01:42
cbb82c08d3103e721a1cf0c3f765a842    | 2009-08-23    | 23:18:52
cbb82c08d3103e721a1cf0c3f765a842    | 2009-09-17    | 05:12:16
cbb82c08d3103e721a1cf0c3f765a842    | 2009-09-18    | 06:29:59

...查询返回2009-09-17值作为查询原始表时的最早值 . 但是，当我复制........哦，球 .

It's because the hits from 2009-08% have an empty userid field.

2 回答

这是StackOverflow每周多次出现的“每组最大n”问题的变体 .

SELECT 
        a1.accessid, 
        a1.date, 
        a1.time 
FROM 
        accesslog a1
LEFT OUTER JOIN
        accesslog a2
  ON (a1.accessid = a2.accessid AND a1.userid = a2.userid
    AND (a1.date > a2.date OR a1.date = a2.date AND a1.time > a2.time))
WHERE a1.userid = '1234'
  AND a2.accessid IS NULL;

这种方式的工作方式是我们尝试找到一个具有相同accessid和userid的行（a2），以及比行a1更早的日期或时间 . 当我们找不到更早的行时，a1必须是最早的行 .

重新评论，我只是尝试了你提供的示例数据 . 这是我得到的：

+----------+------------+----------+
| accessid | date       | time     |
+----------+------------+----------+
|        1 | 2009-08-15 | 01:01:01 | 
|        2 | 2009-09-01 | 14:01:01 | 
+----------+------------+----------+

我在Mac OS X上使用MySQL 5.0.75 .

回复于 2024-05-06T01:23:39+08:00

试试这个

SELECT 
    accessid, 
    date, 
    time 
FROM 
    accesslog 
WHERE userid = '1234' 
GROUP BY accessid
HAVING MIN(date)

对于userid ='1234'，它将以最小的时间返回所有唯一访问 .

回复于 2024-05-06T01:23:39+08:00

从不同用户会话列表中选择最早的日期和时间

2 回答

相关问题