Collector count query needs optimizing #5

ross-spencer · 2025-02-11T08:52:19Z

The following:

SELECT address, COUNT(*) AS total_count, SUM(CASE WHEN datetime(date_time) >= datetime('now', '-1 day') THEN 1 ELSE 0 END) AS count_24hr FROM data_points GROUP BY address ORDER BY total_count DESC;

Was introduced to include daily counts. It is taking a lot longer than the previous call, and for every connection to the database this is adding up.

We can:

either optimize the query,
optimize the python.

ross-spencer · 2025-02-11T08:58:00Z

A complexity here is there does seem to be some caching going on when testing locally.

We can get some timings through (.timer on), e.g. orig:

Run Time: real 0.018 user 0.014927 sys 0.002855

new:

Run Time: real 0.394 user 0.142779 sys 0.250545

Size of local DB:

180356
Run Time: real 0.002 user 0.000993 sys 0.000984

ross-spencer · 2025-02-11T09:11:01Z

Current server timings:

Run Time: real 248.644 user 9.503630 sys 46.506179

ross-spencer · 2025-02-11T09:23:43Z

Looks like an index might help, adding:

CREATE INDEX data_points_dt_addr on data_points(address, date_time);

ross-spencer mentioned this issue Feb 11, 2025

Kupo use needs optimizing #6

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Collector count query needs optimizing #5

Collector count query needs optimizing #5

ross-spencer commented Feb 11, 2025 •

edited

Loading

ross-spencer commented Feb 11, 2025

ross-spencer commented Feb 11, 2025

ross-spencer commented Feb 11, 2025

Collector count query needs optimizing #5

Collector count query needs optimizing #5

Comments

ross-spencer commented Feb 11, 2025 • edited Loading

ross-spencer commented Feb 11, 2025

ross-spencer commented Feb 11, 2025

ross-spencer commented Feb 11, 2025

ross-spencer commented Feb 11, 2025 •

edited

Loading