searx-Instanz: Nachtrag zu www.kuketz-suche.de

In den letzten zwei bis drei Wochen habe ich viel Zeit mit der Optimierung und Verbesserung der searx-Instanz www.kuketz-suche.de verbracht. Dabei stieß ich regelmäßig auf ein Problem, das die Benutzung der searx-Instanz praktisch unmöglich macht – im Beitrag »searx-Instanz: Einstellungen, Hintergründe und Infos zu www.kuketz-suche.de« hatte ich es unter Ziffer »3.2 Vergabe von mehreren IP-Adressen« bereits angeschnitten:

[…] Mit steigender Anzahl von Benutzern lieferten einige Suchmaschinen allerdings keine Ergebnisse an die searx-Instanz zurück. Auch hier war die Ursache, dass zu viele Suchanfragen, in einem kurzen Zeitfenster, an die Suchmaschine(n) gestellt wurden. Im Gegensatz zu Google blendet Bing und Co. keine CAPTCHAs ein, sondern liefert einfach keine Ergebnisse mehr zurück bzw. sperrt die anfragende IP-Adresse der searx-Instanz temporär. Daher habe ich die searx-Instanz mit zwei weiteren IPv4-Adressen ausgestattet, die Suchanfragen an die Suchmaschinen weiterreichen.

Allerdings hat sich nun gezeigt, dass die zusätzlichen IP-Adressen nicht die erhoffte Lösung ist. Auch die zusätzlichen IP-Adressen kamen letztendlich auf eine Art »Blacklist« und Suchmaschinen wie Startpage lieferten keine Ergebnisse mehr. Zeitweise bin ich daher auf das Tor-Netzwerk ausgewichen bzw. alle Suchanfragen wurden über das Tor-Netzwerk gestellt – die anfragende IP-Adresse bei den Suchmaschinen hat sich dauerhaft verändert bzw. war die eines Tor-Exit-Nodes. Allerdings war die Geschwindigkeit deutlich langsamer.

Die letzten Tage habe ich dann an einer Lösung gearbeitet, die bisher vielversprechend zu sein scheint. Ob es allerdings so bleibt muss ein Langzeittest zeigen. Mit Details halte ich mich an dieser Stelle bewusst zurück und warte mal die nächsten Wochen ab.

Hilf mit die Spendenziele zu erreichen! Mitmachen ➡