这是一个创建于 941 天前的主题,其中的信息可能已经有所发展或是发生改变。
需求是这样的,有一张表(如下,均为模拟数据),数据量百万+,按照时间排列,如何才能得出大部分用户有效开关( true or false ),数据都在一张表中。
!可变参数为用户基数
一、如果是统计所有用户:当第 7 条数据进入时,获取到 true 的结果,因为 id(3 、6 、7)都为 true 。
二、如果是统计 2 位用户:
- 第 4 条数据进入时,为 false,因为 id(2 、4)。
- 第 5 条依旧 false 不变。
- 第 6 条为 true,因为 id(3 、6)。
- 第 7 条为 true 不变。
在程序中实时数据进来好判断,但是存量数据该如何筛选呢。用 SQL 实现应该是最好的吧,但是写不来,通过程序的话也没个好的思路。希望大佬们给点意见,谢谢!
ID |
用户 |
开关 |
创建时间 |
1 |
A |
true |
2021-01-01 20:00:00 |
2 |
B |
false |
2021-01-01 20:01:00 |
3 |
A |
true |
2021-01-01 20:02:00 |
4 |
C |
false |
2021-01-01 20:03:00 |
5 |
B |
false |
2021-01-01 20:04:00 |
6 |
C |
true |
2021-01-01 20:05:00 |
7 |
B |
true |
2021-01-01 20:06:00 |
|
|
1
wshhfy 2021-09-29 11:34:31 +08:00
大佬们给点思路吧😂
|