Der Softwarekonzern Microsoft hat ohne große Ankündigung die weltweit größte Datenbank an Bilddaten für das Training von Software für Gesichtserkennung gelöscht. Das Unternehmen begründete den Schritt damit, dass der zuständige Mitarbeiter nicht mehr bei Microsoft tätig ist.
Wie die Financial Times berichtet, wurde die bereits 2016 erstmals veröffentlichte Datenbank mit dem Namen MS Celeb überraschend gelöscht. Die Datenbank, welche rund 10 Millionen Bilder von gut 100.000 Menschen enthielt, war ausdrücklich für Forschungszwecke vorgesehen und sollte dazu dienen, Microsoft und externen Forschern und Entwicklern die Arbeit an Software aus dem Bereich der künstlichen Intelligenz zu erleichtern.
Die MS Celeb Datenbank war ursprünglich im Jahr 2016 veröffentlicht worden und wurde damals als weltweit größte Datensammlung für Informationen zur Gesichtserkennung bezeichnet. Sie wurde von dem Konzern selbst und diversen externen Firmen und Forschern sowie militärischen Einrichtungen verwendet, um Systeme zur Gesichtserkennung damit "zu trainieren".
Problematisch war an der Datenbank vor allem eines: Die darin abgebildeten Personen wurden zuvor nicht um die Zustimmung zur Verwendung ihrer Bilder gebeten. Stattdessen hatte Microsoft die Datenbank einfach mit Bildern gefüllt, die im Internet unter einer Creative Commons Lizens verfügbar waren. Ein Journalist hatte die Existenz der Datenbank vor einiger Zeit öffentlich gemacht und kritisierte nun, dass sich auch nach der jetzt erfolgten Löschung noch diverse Kopien der Daten im Umlauf befinden.
Microsoft erklärte unterdessen, dass die Löschung schlichtweg aus protokollarischen Gründen erfolgte. So wurde die Datenbank von einem Mitarbeiter betreut, der inzwischen nicht mehr für das Unternehmen tätig ist. Die Löschung sei also einfach damit zu begründen, dass die Datenbank mittlerweile nicht mehr gepflegt und ihrer eigentlichen akademischen Verwendung entsprechend betrieben werden kann. Microsoft hatte bereits mehrfach betont, dass Gesichtsdaten und ähnliche Informationen zur Identifikation von Einzelpersonen nicht einfach jedermann zur Verfügung stehen dürften.