Suchmaschine, die sich nicht an Metatags und robots.txt hält
Hallo
kennt jemand eine Suchmaschine, die wirklich alle Seiten indexiert, die ihr unter den Nagel kommen? Quasi auch, wenn diese in der robots.txt oder in den Metatags sagen, dass die Seite nicht indexiert werden soll?
bzw. gibt es eine andere Möglichekeit, den Inhalt einer Seite zu durchsuchen?
wäre toll, wenn jemand so etwas kennt und es mir mitteilen könnte.
mfg Schmiedl
Also eine Suchmaschine die alle Seiten indexiert wirst Du nicht finden, das schafft selbst Google nicht (liegt wohl daran dass Google beim Indexieren in letzter Zeit etwas schläft, sollten mal ihre Serverfarmen ausbauen) - und bestimmte Seiten können sich auch dagegen schützen, so findet man z. B. ein anderes Forum in dem ich aktiv bin über keine einzige Suchmaschine . Aber die wollen auch nicht so bzw. überhaupt gefunden werden.
Ansonsten kannst Du alternativ zu Google auf Webcrawler und WebSpider oder auch nur Crawler und Spider ausweichen, die aber oft genug auch von Google selbst benutzt werden. Nur die bauen auch auf der robots.txt und Meta Tags auf. Aber nicht alle Crawler halten sich an dieses Protokoll . Es gibt noch fokussierte Crawler, welche aber jede Menge Kinderkrankheiten haben und nicht wirklich zufriedenstellende Ergebnisse liefern.
Ansonsten könnte man solche Seiten nur noch über Harvester, Wrapper oder Software Agents finden. Oder auch MetaSuchmachinen, wie MetaGer.de, MetaGer2.de, Metacrawler.com oder Metacrawler.de finden - die kombinieren einfach alle anderen Suchmaschinen und Suchmethoden, jedoch kommt da auch viel Müll.
der Zusatz "die ihr unter den Nagel kommen" ist durchaus mit Hintergrund geschrieben worden
danke für die Antwort schonmal.
Dann präzisieren wir das ganze ein bischen: wie kann ich eine Seite durchsuchen, die nicht in Suchmaschinen indexiert wurde? gibt es da möglichkeiten? z.B: auf dem Server erstellte Verzeichnisse und Datein herauszufinden, auf die auf der Hauptseite nicht gelinkt wird.
mfg Schmiedl
Wenn Du die Seite weißt, dann über den Index (der Seite) bzw. den Pfad, kann man auch erzwingen, diesen aufzurufen - wenn nicht, wird es sehr schwer, bzw. mit gängigen Suchmaschinen fast unmöglich, da es sich wie bei Rapid share verhält. Hier haben dann nur Leute Zutritt, die Kenntnis haben.
Und das was ich noch an Möglichkeiten kenne, bewegt sich außerhalb des legalen Rahmens, da man hier mehr oder weniger "in fremde Netzte eindringen" muss, was illegal ist.
Dachte ich mir schon, dass man da schnell in die nicht mehr legalen Bereiche abschweift.
Wie kann man diesen Pfad erzwingen? Das ganze kann man warscheinlich nicht machen, wenn Verzeichnisse auf dem Server nicht öffentlich zugänglich sind oder?
mfg Schmiedl
Link dieser Seite https://www.talkteria.de/forum/topic-7898.html
Ähnliche Themen
Weitere interessante Themen
- Notebook von Plus 3291mal aufgerufen · 3 Antworten · Autor: Simone1987 · Letzter Beitrag von Entenhausen
Forum: Hardware
- Notebook von Plus
- Lohnen sich Asien Fonds? 4350mal aufgerufen · 4 Antworten · Autor: Balthasar · Letzter Beitrag von FinanzScout
Forum: Geldanlage
- Lohnen sich Asien Fonds?
- Überweisung rückgängig machen 5793mal aufgerufen · 5 Antworten · Autor: Player · Letzter Beitrag von Wibbeldribbel
Forum: Geld & Finanzen
- Überweisung rückgängig machen
- Geld verdienen mit medzinischen Studien - was meint Ihr? 17327mal aufgerufen · 16 Antworten · Autor: Midgaardslang · Letzter Beitrag von winny2311
Forum: Geld & Finanzen
- Geld verdienen mit medzinischen Studien - was meint Ihr?
- Lohnende Anlage: Energiespar Aktien 4000mal aufgerufen · 3 Antworten · Autor: vonZitzebitz · Letzter Beitrag von FinanzScout
Forum: Geldanlage
- Lohnende Anlage: Energiespar Aktien