Künstliche Intelligenz hat die Art und Weise, wie Inhalte im Internet entstehen, grundlegend verändert. Seit dem Launch von ChatGPT Ende 2022 ist der Anteil KI-generierter oder KI-gestützter Texte auf Websites rasant gestiegen. Eine aktuelle Studie von Forschern des Imperial College London, des Internet Archive und der Stanford University hat diesen Trend erstmals systematisch untersucht und kommt zu Ergebnissen, die teilweise überraschen. Für alle, die Websites betreiben, Inhalte erstellen oder sich professionell im Web positionieren wollen, sind diese Erkenntnisse hochrelevant.
Inhaltsverzeichnis
Deine Website, dein Design – fertig in wenigen Klicks
Erstelle deine eigene Website mit easyname: Wähle aus verschiedenen Designs, gestalte deine Seiten per Drag-and-Drop und verkaufe mit dem integrierten Webshop direkt online. Kein technisches Vorwissen nötig – einfach loslegen, ab 4,90 € im Monat.
35 Prozent aller neuen Websites sind KI-generiert
Die Studie hat über das Wayback Machine des Internet Archive eine repräsentative Stichprobe von Websites aus dem Zeitraum 2022 bis 2025 gezogen. Die methodische Herausforderung dabei ist beträchtlich: Es gibt kein zentrales Verzeichnis aller Websites, populäre Domains sind in den meisten Crawls massiv überrepräsentiert und die Abdeckung von Webarchiven verändert sich laufend. Die Forscher haben deshalb einen mehrdimensionalen, stratifizierten Stichprobenansatz gewählt, um eine möglichst gleichmäßige Zufallsauswahl aus öffentlich zugänglichen Webseiten zu erhalten.
Für die Erkennung von KI-generierten Texten wurden vier etablierte Detektionsverfahren evaluiert, darunter Binoculars, Desklib, DivEye und Pangram v3. Nach umfangreichen Robustheitstests über verschiedene Textlängen, Dateiformate, Modellfamilien und Sprachen hinweg erwies sich Pangram v3 als zuverlässigster Detektor. Das zentrale Ergebnis: Bis Mitte 2025 wurden rund 35 Prozent aller neu veröffentlichten Websites als KI-generiert oder KI-gestützt klassifiziert. Vor dem Launch von ChatGPT Ende 2022 lag dieser Anteil praktisch bei null.
Diese Zahl verdeutlicht, wie schnell sich KI-Tools in der Content-Produktion durchgesetzt haben. Für Website-Betreiber bedeutet das: Du bewegst dich in einem Umfeld, in dem mehr als ein Drittel der neu entstehenden Konkurrenzinhalte maschinell erstellt wird.
Welche Auswirkungen hat KI-Text tatsächlich auf das Internet?
Die Studie hat sechs konkrete Hypothesen zu negativen Auswirkungen von KI-generiertem Text auf das Internet quantitativ überprüft. Parallel dazu wurde eine repräsentative Umfrage unter 853 Erwachsenen in den USA durchgeführt, um die öffentliche Wahrnehmung mit den tatsächlichen Daten abzugleichen. Die Ergebnisse zeigen eine bemerkenswerte Diskrepanz zwischen Wahrnehmung und Realität.
Bestätigt: Semantische Verengung
Die Hypothese, dass mit zunehmendem KI-Anteil die Vielfalt an Ideen und Perspektiven im Internet abnimmt, wurde statistisch bestätigt. Die durchschnittliche paarweise Kosinus-Ähnlichkeit semantischer Embeddings korreliert signifikant mit dem KI-Anteil (Korrelationskoeffizient ρ = 0,47, p = 0,004). Konkret zeigten KI-generierte Websites eine um 33 Prozent höhere semantische Ähnlichkeit als menschlich verfasste Seiten (0,0701 gegenüber 0,0526).
Das bedeutet in der Praxis: KI-generierte Inhalte tendieren dazu, sich thematisch und inhaltlich stärker zu ähneln als menschlich erstellte Texte. Wenn du dich mit deiner Website differenzieren willst, reicht es nicht aus, einfach KI-generierte Standardtexte zu veröffentlichen. Eigenständige Perspektiven, Fachwissen und persönliche Erfahrung werden als Differenzierungsmerkmale immer wertvoller.
Bestätigt: Positivity Shift
Ebenfalls bestätigt wurde die Hypothese, dass KI-generierte Inhalte eine unnatürlich positive Tonalität aufweisen. Die Korrelation zwischen dem Anteil positiver Dokumente und der KI-Verbreitung ist mit ρ = 0,56 (p = 0,0003) die stärkste in der gesamten Studie. KI-generierte Websites hatten einen um 107 Prozent höheren Positive-Sentiment-Score als nicht-KI-generierte Seiten (0,7042 gegenüber 0,3400).
Dieser Befund ist relevant für alle, die Content-Marketing betreiben oder informative Websites pflegen. Die typische KI-Neigung zu übertrieben positivem, geglättetem Text kann dazu führen, dass Inhalte weniger authentisch und glaubwürdig wirken. Kritische Einordnung, differenzierte Bewertungen und auch das Benennen von Nachteilen oder Einschränkungen können deine Inhalte von der KI-generierten Masse abheben.
Nicht bestätigt: Zunahme von Falschinformationen
Überraschenderweise konnte die Studie keinen statistisch signifikanten Zusammenhang zwischen dem KI-Anteil und einer Zunahme faktisch falscher Informationen feststellen (ρ = −0,19, p = 0,27). Das steht im deutlichen Widerspruch zur öffentlichen Wahrnehmung: 75,1 Prozent der Befragten gaben an, dass sie glauben, durch KI-Inhalte häufiger mit Fehlinformationen konfrontiert zu werden.
Das heißt nicht, dass KI-Halluzinationen kein Problem sind. Auf der Ebene einzelner Texte können KI-Modelle nach wie vor falsche Behauptungen generieren. Aber auf der Makroebene des gesamten Internets lässt sich dieser Effekt bislang nicht statistisch nachweisen. Mögliche Erklärungen: Viele KI-generierte Texte behandeln unkritische Themen, oder menschliche Redaktionsprozesse fangen einen Teil der Fehler ab.
Nicht bestätigt: Verlust externer Verlinkung
Die Hypothese, dass KI-generierte Inhalte seltener auf externe Quellen verlinken und dadurch sogenannte epistemische Inseln entstehen, wurde ebenfalls nicht bestätigt (ρ = −0,12, p = 0,48). Die Outbound-Link-Dichte zeigt keinen signifikanten Zusammenhang mit dem KI-Anteil.
Nicht bestätigt: Aufgeblähte Texte mit geringer Informationsdichte
Auch die Annahme, dass KI-Texte zwar länger werden, aber weniger Informationsdichte aufweisen, ließ sich nicht belegen. Die Gzip-Kompressionsrate als Proxy für die Informationsdichte zeigte keinerlei Korrelation mit dem KI-Anteil (ρ = −0,02, p = 0,89).
Nicht bestätigt: Stilistische Monokultur
Besonders bemerkenswert ist, dass die Hypothese einer stilistischen Vereinheitlichung nicht bestätigt wurde (ρ = 0,24, p = 0,17), obwohl 83 Prozent der Befragten davon überzeugt waren. Die durchschnittliche paarweise Jaccard-Ähnlichkeit von Character-3-Grammen zeigt keinen signifikanten Anstieg mit dem KI-Anteil. Individuelle Schreibstile verschwinden also zumindest auf der Ebene der Gesamtbetrachtung nicht so stark, wie viele annehmen.
Die Kluft zwischen Wahrnehmung und Daten
Ein zentrales Ergebnis der Studie ist die erhebliche Diskrepanz zwischen dem, was Menschen glauben, und dem, was die Daten zeigen. Die Mehrheit der Befragten war von allen sechs negativen Auswirkungen überzeugt. Tatsächlich ließen sich aber nur zwei davon statistisch belegen. Die folgende Tabelle fasst diesen Vergleich zusammen:
| Hypothese | Korrelation (ρ) | Statistisch signifikant | Zustimmung in der Umfrage |
|---|---|---|---|
| Semantische Verengung | 0,47 | Ja (p = 0,004) | Mehrheit stimmt zu |
| Zunahme von Falschinformationen | −0,19 | Nein (p = 0,27) | 75,1 % stimmen zu |
| Positivity Shift | 0,56 | Ja (p = 0,0003) | Mehrheit stimmt zu |
| Epistemische Inseln | −0,12 | Nein (p = 0,48) | Mehrheit stimmt zu |
| Aufgeblähte Texte | −0,02 | Nein (p = 0,89) | Mehrheit stimmt zu |
| Stilistische Monokultur | 0,24 | Nein (p = 0,17) | 83 % stimmen zu |
Die Wahrnehmung ist also deutlich pessimistischer als die aktuelle Datenlage. Das bedeutet allerdings nicht, dass Entwarnung gegeben werden kann. Die Studie bildet einen Zeitraum von nur rund zweieinhalb Jahren ab, und die Entwicklung ist dynamisch. Was sich heute noch nicht statistisch niederschlägt, kann bei weiter steigendem KI-Anteil durchaus relevant werden.
Was bedeutet das für dich als Website-Betreiber?
Aus den Studienergebnissen lassen sich konkrete Schlüsse für die eigene Web-Strategie ziehen. Die beiden bestätigten Effekte, semantische Verengung und künstliche Positivität, sind direkt handlungsrelevant.
Wenn du Inhalte für deine Website erstellst, solltest du bewusst auf inhaltliche Differenzierung achten. KI-Tools können den Schreibprozess unterstützen, aber der entscheidende Mehrwert entsteht durch eigenständige Analyse, Branchenwissen und authentische Perspektiven. Texte, die sich inhaltlich von der KI-generierten Masse abheben, haben bessere Chancen, von Suchmaschinen als wertvoll eingestuft zu werden und bei Lesern tatsächlich Vertrauen aufzubauen.
Gleichzeitig lohnt es sich, die Tonalität deiner Inhalte kritisch zu überprüfen. Wenn alles nur positiv und glatt formuliert ist, verliert es an Glaubwürdigkeit. Differenzierte, ehrliche Texte, die auch Einschränkungen oder Alternativen benennen, wirken kompetenter und werden von einer zunehmend KI-bewussten Leserschaft besser angenommen.
Die technische Basis für deine Online-Präsenz
Unabhängig davon, ob du KI als Hilfsmittel einsetzt oder komplett auf manuell erstellte Inhalte setzt: Die technische Grundlage deiner Website muss stimmen. Schnelle Ladezeiten, hohe Verfügbarkeit und eine professionelle Domain sind Faktoren, die sowohl für die User Experience als auch für Suchmaschinen-Rankings entscheidend sind.
Mit den Webhosting-Paketen von easyname bekommst du eine zuverlässige Infrastruktur, auf der du deine Inhalte performant ausliefern kannst. Wenn du eine neue Website starten oder eine bestehende Präsenz professionell aufstellen willst, ist die passende Domain über die Domain-Registrierung von easyname der erste Schritt. Für WordPress-basierte Projekte bietet das WordPress Hosting von easyname eine optimierte Umgebung, in der du dich auf die Inhaltserstellung konzentrieren kannst, statt dich mit Serverkonfigurationen auseinanderzusetzen.
Wenn du mehr Kontrolle über deine Hosting-Umgebung benötigst, etwa weil du eigene KI-gestützte Tools für die Content-Erstellung oder Analyse betreiben willst, ist ein VPS Server von easyname die richtige Wahl. Damit hast du volle Root-Zugriffsrechte und kannst deine Serverumgebung exakt nach deinen Anforderungen konfigurieren.
Für den schnellen Einstieg ohne Programmierkenntnisse eignet sich der Website-Baukasten von easyname, mit dem du eine professionelle Website aufsetzen und regelmäßig mit eigenen, hochwertigen Inhalten aktualisieren kannst. In Kombination mit einer professionellen E-Mail-Adresse über easyname präsentierst du dich gegenüber Kunden und Partnern von Anfang an seriös.
In einer Zeit, in der über ein Drittel aller neuen Webinhalte maschinell generiert wird, macht authentischer, fachlich fundierter Content den Unterschied. Die technische Basis dafür sollte diesem Anspruch gerecht werden.
Quelle: https://ai-on-the-internet.github.io/
E-Mail-Login leicht gemacht: Unsere meistgesuchten Anleitungen
Der Weg ins Postfach sollte schnell und unkompliziert sein – doch manchmal hakt es beim Login. In unseren Schritt-für-Schritt-Guides erfährst du, wie du dich zuverlässig beim GMX Login anmeldest, den A1 Webmail-Zugang nutzt oder Probleme beim Hotmail Login löst – inklusive Hilfe bei Störungen, vergessenen Passwörtern und Kontoeinstellungen.
Auch für alle, die Microsoft-Dienste nutzen, haben wir die passende Anleitung: Unser Ratgeber zum Office 365 Login zeigt dir, wie du dich schnell bei Microsoft 365 anmeldest und typische Login-Probleme behebst.