Fehler in Blockliste nach Update

peneu76 · January 18, 2023, 2:47am

Guten Morgen,

nach dem Update auf die aktuellste Version bekomme ich beim einlesen der Filter bei meiner Liste folgende Fehler:

  [i] Target: https://fussle.de/block.txt
  [✓] Status: Retrieval successful
  [i] Analyzed 108542 domains, 25 domains invalid!
      Sample of invalid domains:
      - 1
      - 2
      - 3
      - 4
  [i] List has been updated

Wie finde ich die entsprechenden fehlerhaften Einträge (ich benutze Notepad++)?

Vielen Dank für eure Hilfe

Bucking_Horn · January 18, 2023, 1:48pm

Ich kann in fussle.de/block.txt keine Einträge finden, die zu den beispielhaft genannten passen.

Möglicherweise handelt es sich also um falsche Meldungen oder sogar um einen echten Fehler beim Analysieren der Domänen.

Wir werden uns das mal genauer anschauen.

peneu76 · January 18, 2023, 2:27pm

OK, dann hatte ich keine Tomaten auf den Augen. Ich hab nach fehlerhaften Einträgen gesucht, konnte aber nichts finden...

yubiuser · January 21, 2023, 5:53am

Line 22505 cmp.computerbild.de 1
Line 25890 data-19e0ce8844.computerbild.de 1
Line 82032 ssl.3.damoh.computerbild.de 1

I'm sure it's the same pattern for the other numbers. Pi-hole parses files in HOSTS format. If there are more than one column, we omit the first and expect the domain at the second column.

yubiuser · January 21, 2023, 5:55am

#!/usr/bin/env bash

src="${1}" destination="${2}"

  # Remove comments and print only the domain name
  # Most of the lists downloaded are already in hosts file format but the spacing/formatting is not contiguous
  # This helps with that and makes it easier to read
  # It also helps with debugging so each stage of the script can be researched more in depth
  # 1) Remove carriage returns
  # 2) Convert all characters to lowercase
  # 3) Remove comments (text starting with "#", include possible spaces before the hash sign)
  # 4) Remove lines containing "/"
  # 5) Remove leading tabs, spaces, etc.
  # 6) Remove empty lines
  < "${src}" tr -d '\r' | \
  tr '[:upper:]' '[:lower:]' | \
  sed 's/\s*#.*//g' | \
  sed -r '/(\/).*$/d' | \
  sed -r 's/^.*\s+//g' | \
  sed '/^$/d'>  "${destination}"

Packe dass in ein Script und lass rufe es mit ./script.sh input output auf. Mit cat output.txt | grep -E '^2' -n bekommst du eine Liste mit Zeilennummern. Dann musst du händisch danach suchen.

peneu76 · January 21, 2023, 8:51am

Irgendwie bekomme ich das nicht hin und ich weiß nicht warum. Einige Fehler hat das Script gefunden, 6 fehlerhafte Domains sind es noch =(

  [i] Target: https://fussle.de/block.txt
  [✓] Status: Retrieval successful
  [i] Analyzed 108587 domains, 6 domains invalid!
      Sample of invalid domains:
      - 2
      - 3
      - 4
  [i] List has been updated

Bucking_Horn · January 21, 2023, 9:07am

Aktuell finde ich in fussle.de/block.txt noch folgende Einträge:

18405: c.oracleinfinity.io 2
23542: consent.trustarc.com 2
41557: init.grizzlyapps.com 2
67240: oracle.112.2o7.net 3
76096: s.go-mpulse.net 4
80759: smoton.com 2

Wenn Du zwischenzeitlich weiter bereinigt hast, weichen die Zeilennummern eventuell ab.
Über die Domänen sollten die fehlerhaften Zeilen aber trotzdem zu finden sein.

peneu76 · January 21, 2023, 9:56am

Fehlerfrei durchgelaufen, alle 3 Listen. Besten Dank

peneu76 · February 2, 2023, 5:15am

Guten Morgen, aktuell habe ich wieder einen Fehler (der an mir liegt) - aber ich finde ihn nicht. Könntest du bitte nochmal das Script laufen lassen?

yubiuser · February 5, 2023, 7:52am

L65213 northeurope-0.in.applicationinsights.azure.com 3

peneu76 · February 5, 2023, 3:48pm

Super, dankesehr für deine Bemühungen.

Meine Listen (Listen) sind jetzt wieder fehlerfrei =)

system · February 26, 2023, 3:48pm

This topic was automatically closed 21 days after the last reply. New replies are no longer allowed.