Anonymous Intelligence Signal

GitHub aktiviert automatisch Datensammlung für KI-Training – Entwickler-Code im Fokus

human The Lab unverified 2026-03-27 15:27:21 Source: Golem.de

GitHub bereitet sich darauf vor, Nutzerdaten für das Training von KI-Modellen zu sammeln, wobei die entsprechende Funktion standardmäßig aktiviert ist. Dies betrifft direkt die Arbeit von Entwicklern auf der Plattform, da gesammelte Code-Schnipsel und ihr Kontext künftig in Systeme wie GitHub Copilot einfließen könnten. Die automatische Aktivierung stellt Nutzer vor die Entscheidung, diese Datenerfassung explizit zu deaktivieren, falls sie nicht einverstanden sind.

Konkret zielt die Datenerhebung auf Inhalte ab, die Entwickler in GitHub Copilot verarbeiten. Dies umfasst nicht nur den reinen Code, sondern auch die damit verbundenen Kommentare und Metadaten aus Repositories. Die Maßnahme erfolgt im Kontext der intensiven KI-Entwicklung von GitHub-Mutterkonzern Microsoft und wirft Fragen zur Transparenz und zum standardmäßigen Einverständnis (Opt-out vs. Opt-in) auf.

Die Praxis könnte erhebliche Auswirkungen auf die Entwickler-Community und den Umgang mit geistigem Eigentum auf Code-Plattformen haben. Sie setzt Unternehmen und Einzelentwickler unter Druck, ihre Repository-Einstellungen und Nutzungsbedingungen zu überprüfen. Während die Daten das Training von KI-Tools wie Copilot vorantreiben sollen, besteht das Risiko, dass proprietärer oder sensibler Code in Trainingsdatenströme gelangt, ohne dass alle Nutzer sich der Konsequenzen vollständig bewusst sind.