ergebnisse

Google Indexierungsstatus überprüfen: Warum ist das wichtig?

Wie viele meiner Unterseiten hat Google eigentlich indexiert? Dieser Frage konnte man bis zur Ankündigung „Geheimnisse des Google-Index enthüllt“ aus dem Juli diesen Jahres nur mit der bekannten site:-Abfrage auf den Grund gehen. Während man seit der Ankündigung innerhalb der Webmaster Tools den genauen Indexierungsstatus der eigenen Webseiten einsehen kann (zu finden unter „Status“ -> „Indexierungsstatus“, mehr dazu in meinem E-Book), hat sich der Blick von außen auf eine Domain doch stark eingeschränkt. Noch vor wenigen Monaten konnte man – eine nicht restriktive Suchanfrage und entsprechend große Seite vorausgesetzt – noch problemlos die Ergebnisse 1 bis 1.000 zu einer Domain über die site:-Abfrage einsehen. Doch wie sieht es heute aus?

Wer sich die Mühe macht und z.B. nach site:wikipedia.org oder site:bild.de sucht, wird feststellen, dass bereits weit vor der 1.000er-Grenze Schluss ist. In der Regel wird bereits nach knapp 700 Ergebnissen der Hinweis auf den Supplemental Index gegeben: 700 relevante Ergebnisse, wer mehr sehen will, kann die Suche ohne Filterung wiederholen. Doch selbst dann ist unter 1.000 Seiten Schluss.

Haben die beiden oben genannten Domains nicht mehr so viel qualitativ hochwertigen Content zu bieten? Das wäre beim Hinweis „Seite 8 von ungefähr 5.890.000 Ergebnissen (0,54 Sekunden)“ doch arg dürftig. Man wird das Gefühl nicht los, dass Google hier bewusst die Anzeige einschränkt – denn die Angabe von knapp 5,9 Millionen Seiten dürfte doch relativ grob sein und vom „Realwert“ in den Webmaster Tools abweichen. So zumindest meine Erfahrung.

Warum es wichtig ist, den Indexierungsstatus der eigenen Webseite zu kennen

Für die meisten Webmaster ist der genaue Indexierungsstatus fremder Webseiten nicht sonderlich interessant, aber für die eigene Webseite möchte man diese Information dann doch gerne haben. In den Google Webmaster Tools kann man diesen Wert finden. Um Probleme bei der URL-Struktur der eigenen Webseite zu erkennen, lohnt sich ein regelmäßiger Blick auf die dort angezeigte Anzahl. Wenn die Anzahl an indexierten URLs weit über den Wert liegt, welchen man erwarten würde, so sollte man sich auf die Suche nach der Ursache machen. Doch auch das Gegenteil muss nicht positiv sein.

Eine Beispielrechnung für die Gesamtanzahl an URLs eines Online-Shops könnte wie folgt aussehen:

Anzahl an Produkten in einem Online-Shop
+ Anzahl an Kategorien
+ Anzahl an paginierten Seiten
+ Anzahl an Filterseiten (z.B. Marke + Kategorie)
+ Anzahl an Marken
+ Anzahl an Webseiten wie „Über uns“ oder Impressum
+ Anzahl der Artikel im Blog
+ Anzahl an URLs, die über die robots.txt blockiert sind
– Seiten, die über Robots „Noindex“ geblockt sind
– Seiten, die nur von URLs verlinkt werden, die über robots.txt blockiert sind
——————————————————————————-
Gesamtanzahl der URLs, die man sich erklären kann

URLs, die über die robots.txt blockiert sind, sollten nicht abgezogen, sondern addiert werden. Denn die robots.txt blockiert nicht die Indexierung von Seiten, sondern nur deren Crawling – und nicht selten entscheidet sich Google dazu, die entsprechenden URLs trotzdem zu indexieren. Durch das Crawling-Verbot sind Seiten, die nur von einer per robots.txt blockierten URL angelinkt werden, für Suchmaschinenrobots hingegen nicht erreichbar und sollten deshalb abgezogen werden.

Sofern sich die ermittelte Gesamtanzahl an URLs von dem in Google Webmaster Tools angezeigten Wert unterscheidet – sowohl positiv als auch negativ – sollte die Webseite genauer untersucht werden. Beispielhaft dazu ein Chart einer Webseite. Auffällig ist, dass die Anzahl indexierter URLs sprunghaft und signifikant nach oben geschnellt ist. Wir sprechen hier nicht von 1.000 Seiten, sondern von über 500.000 neuen URLs. Bereits der Anstieg von August zu September ist auffällig: Hier hat bereits eine Verdoppelung der Anzahl an indexierten Seiten stattgefunden.

Wie viele Seiten hat Google indexiert?

Was können Gründe für „zu viele“ indexierte URLs sein?

Mehr indexierte URLs als erwartet zu haben, muss bei der Suchmaschinenoptimierung nicht zwangsläufig besser sein. Eigentlich gilt hier die Devise: so viele URLs wie nötig, so wenige URLs wie möglich.

Gründe, weshalb der Indexierungsstatus aus dem Ruder läuft, gibt es viele. Die Liste stellt einen Auszug dar:

  • Der Server gibt auch bei „invaliden“ URLs den HTTP-Statuscode 200 aus.
  • Der Content ist über klein- und großgeschriebene URLs erreichbar.
  • Jeder Hostname wird vom Server akzeptiert, z.B. auch http://w.meinedomain.de/.
  • Session-IDs in den URLs.
  • Unnötige Parameter werden nicht von der Indexierung ausgeschlossen.
  • Die Seite ist unter http und https indexiert.

Was können Gründe für „zu wenig“ indexierte URLs sein?

Wenn weit weniger URLs im Google Index vertreten sind als erwartet, kann auch das ein Hinweis auf ein Problem sein.

  • Wurde die Angabe „Noindex“ unbewusst zu häufig eingesetzt?
  • Gibt es Probleme mit dem Canonical-Tag?
  • Sind Verteiler-Seiten der Domain per robots.txt blockiert?
  • Werden alle URLs mindestens 1x angelinkt?
  • Wurden zu restriktive Einstellungen in Google Webmaster Tools für Parameter gewählt?
  • Hat die Domain ein zu niedriges Verhältnis an Backlinks zu Content?
  • Stellt mein Content keinen Mehrwert dar? Ist der Content eventuell kopiert worden?
  • Wurde die Domain erst vor kurzem online gestellt?

Wie geht man vor, wenn der Indexierungsstatus aus dem Ruder läuft?

Bei einigen der Problem helfen die Google Webmaster Tools weiter. Unter dem Punkt „HTML-Verbesserungen“, zu finden unter „Optimierung“ listet Google beispielsweise Seiten auf, die sich dieselben Meta-Informationen teilen. Auch über Parameter und deren Crawling kann unter „Konfiguration“ -> „URL-Parameter“ eine Liste von URLs mit Parametern angesehen werden. Dazu müssen die Beispiel-URLs zu einem der gelisteten Parameter aufgerufen werden. Um zu kontrollieren, ob eine Seite auch unter https:// indexiert wurde, kann der Suchbefehl „site:meinewebseite.de inurl:https“ verwendet werden.

Über die Google Webmaster Tools lassen sich bereits einige Problemfelder identifizieren. Weiteren Aufschluss über Probleme kann ein Crawlvorgang der Webseite liefern. Empfehlenswerte Tools sind dabei unter anderem der Screaming Frog und das SEO-Toolkit von Microsoft.

So einfach findest du Dateien bei Filehostern wie Mega oder Rapidshare

Filehoster, wie zum Beispiel Rapidshare, speichern viele Dateien, die von Nutzern heruntergeladen werden können. Die Crux dabei ist aber das Fehlen einer Suchfunktion. Das Durchstöbern der endlosen Dateilisten dauert dann eine Ewigkeit und treibt den Einen oder Anderen schon mal in den Wahnsinn. Auf dieses Problem haben sich einige Such-Dienste spezialisiert.

DDLSEARCH

Auf der Webseite von DDLSearch kannst du in gut 200 Filhostern deine benötigten Dateien finden. Gib in das Textfeld den gesuchten Dateinamen ein, dann legst du über das Aufklappmenü von Search Engine die Suchmaschine fest (z. B. IxQuick), und abschließend stellst du bei Site To Search den Filehoster fest, auf dem du die Datei(en) vermutest.

suchmaschine-dienst-ddlsearch-filehoster-datei-finden

Der Button Search oder I am lucky öffnet das Suchergebnis in einem neuen Browser-Tab.

RAPID SEARCH ENGINE

Der Suchdienst Rapid-Search-Engine.com unterstützt die Suche auf circa 42 Filehostern. Über die Option Advanced lässt sich zudem nach bestimmten Datei-Arten (z. B. Videos) suchen.

rapid-search-engine-suchdienst-direkter-download-von-dateien-werbefrei

In der Liste der Suchergebnisse lässt sich dann auch die gewünschte Datei direkt herunterladen. Dieser Suchdienst ist übrigens werbefrei.

RAPID4ME

Rapid4me.com ist optisch nicht besonders ansprechend, hat es aber trotzdem faustdick hinter den Ohren. Die Ergebnisse der derzeit54 Filehoster kannst du nach Herzenslust sortieren und filtern, Filehoster aus- oder abwählen und die Dateien direkt über denDownload-Button herunterladen.

rapid4me-minimalistisch-file-seach-machine-filehoster-dateien-finden-optisch-sehr-einfach

DOWNLOAD URHEBERRECHTLICH GESCHÜTZER INHALTE

Eins sei aber noch zu der Dateisuche bei Filehostern gesagt. Eine Menge Dateien, die über die Filehoster geteilt werden sind in Deutschland illegal und können beim Herunterladen strafrechtliche Konsequenzen haben. Dies betrifft insbesondere Filme und Musik-Dateien.

Der für diesen Artikel verwendete Suchbegriff James Bond diente nur der Veranschaulichung der Funktionsweise der beschriebenen Suchdienste. Wir warnen an dieser Stelle ausdrücklich vor dem Download urheberrechtlich geschützter Inhalte!

OpenOffice Calc: Richtige Ergebnisse beim Rechnen mit Uhrzeiten

Als Nutzer des Tabellenkalkulationsprogramm “Calc” lässt sich, wie bei Microsoft Excel auch, mit Uhrzeiten rechnen. Allerdings weisen bei “Calc” die Ergebnisse manchmal Fehler auf. Um eine fehlerfreie Uhrzeitenberechnung durchführen zu können, sollte man zu einem einfachen Trick greifen: Alle benötigten Uhrzeiten vor dem Rechenvorgang in Dezimalzahlen umrechnen!

Zwar ist das ein Rechenschritt mehr, stellt aber sicher, dass das Ergebnis richtig ist. Um eine Uhrzeit in eine Dezimalzahl umzurechnen, multiplizieren Sie die Uhrzeit mit “24″. Führen Sie diesen Rechenprozess mit allen benötigten Uhrzeiten durch.

Die Aufgabenstellung:

Folgende Uhrzeitenberechnung  soll gelöst werden: 4:30:00 abzüglich 00:42:33.

Schritt eins: Errechnung aller Dezimalzahlen

  • 04:30:00 x 24 = 4,5
  • 00:42:33 x 24 = 0,7091666667

bild-1-calc-open-office-tabellenkalkulation-excel-alternativ-dezimalzahl-umrechnen-genau-ergebnis-fehler

Die Subtraktion

Dann führen Sie die Subtraktion durch:

4,5 –  0,7091666667 =3,790833333

bild-2-berechnung-calc-libre-office-open-tabellenkalkulation-subtraktion-dezimalzahl-uhrzeit-genau-berechnen-fehlerhaft

Dividieren des Ergebnisses

Das Ergebnis der Subtraktion dividieren Sie dann durch “24″ um diese Dezimalzahl wieder in das Uhrzeit-Format umrechnen zu können.

bild-3-zeitrechnung-calc-openoffice-libreoffice-formatieren-zeit-dezimalzahl-umwandeln-umrechnen

Umwandlung des Ergebnisses ins Uhrzeit-Format

Zunächst ist das Ergebnis natürlich wieder eine Dezimalzahl, die Sie abschließend als Uhrzeit formatieren müssen.

Danach wird die richtige Uhrzeit wieder angezeigt.

bild-4-umformatieren-in-uhrzeit-zeit-format-wieder-anzeigen-dezimal-zahl-wert-zelle-formel-genau-berechnung-abzüglich-multiplizieren-subtrahieren-dividieren