Pi-hole Logs auswerten - Top 500 Toplevel Domains für Fritzbox

Ich würde gern meine Fritzbox Liste aktualisieren. Ist es möglich die Top 500 Toplevel Domains aus den Langzeit Statistiken von Pi-Hole abzufragen?

Nicht über das Web Interface, aber über SQL.

Welche Top 500 willst du denn? Alle angefragten Domains oder nur die geblockten?

Dir Top 500 der geblockten Domains - also nicht xyz.adserver.de - sondern nur adserver.de.

Wenn ich aber richtig mitdenke gehen wahrscheinlich nur die kompletten Domainnamen?

sqlite3 /etc/pihole/pihole-FTL.db "select domain, count (domain) from queries where status In (1,4,5,6,7,8,9,10,11) group by domain order by count (domain) desc limit 500;"

Danke dir =) perfekt, noch nachbearbeiten und dann die neue Blockliste für die Fritzbox erstellen.

Bei der Nachbearbeitung und der Auswahl von Domänen für die auf 500 Einträge beschränkte Liste der FritzBox würde ich vielleicht nicht zwingend nach der Gesamthäufigkeit der Aufrufe gehen.
Diese kann über die Zeit schwanken, wie vielleicht ein Abgleich der Ergebnisse aus SQL und API schon zeigt.

Um auszuschliessen, dass eventuell ein einzelner Gast an einem Tag vor Weihnachten 2019 mit Kaufsuchtsanfällen durch tausende Abfragen Am*zon und Eb*y in der Liste weit nach oben geschoben hat, würde ich vielleicht Datumsintervalle überprüfen.
Ob das in Deinem Fall Sinn macht, müsstest Du natürlich selbst entscheiden.

Du bräuchtest dazu yubiusers SQL nur leicht zu erweitern, z.B. für die Werte aus August 2020:

sqlite3 /etc/pihole/pihole-FTL.db \
"SELECT domain, count(domain) FROM queries \
WHERE status IN (1,4,5,6,7,8,9,10,11) \
AND (timestamp BETWEEN strftime('%s','2020-08-01') AND strftime('%s','2020-08-31')) \
GROUP by domain ORDER BY count(domain) DESC LIMIT 500;"

Die Datumsangaben müsstest Du entsprechend anpassen.

Und der Vollständigkeit halber noch der eben erwähnte API-Abruf:
Über Pi-holes API lassen sich die häufigsten 500 geblockten Domänen der letzten 24 Stunden wie folgt ermitteln.

echo ">top-ads (500) >quit" | nc 127.0.0.1 4711
1 Like

@Bucking_Horn - Ich nehme nur die häufigsten Werbeanbieter und Tracking Anbieter, die kenne ich schon fast auswendig. Die Fritzbox Liste ist über meine Webseite abrufbar, hauptsächlich verwendet wird sie bei unseren Bekannten =)

Nachtrag: Klar, ich könnte mit beiden Listen zu Github gehen, aber dann ist das MiMiMiMi wieder groß, weil Domain A oder B fehlt. So hoste ich es lieber selber, und wer was möchte, kann mich anmailen =)