X

Wenn Excel "mitdenkt": 20% aller Genetik-Forschungen fehlerhaft

Microsofts Office-Software ist weit verbreitet und ermöglicht in vielen Situationen auch ein recht bequemes Arbeiten. Die Eigenarten der Software führt aber auch immer wieder zu Problemen - so sorgt etwa Excel dafür, dass sehr viele wissenschaftliche Veröffentlichungen fehlerhaft sind.
24.08.2016  14:12 Uhr
Aktuell rückt hier aufgrund einer neuen Untersuchung die Arbeit der Genetik in den Mittelpunkt. Immerhin, so könnte man sagen, sind hier diesmal nicht Bugs in der Tabellenkalkulation verantwortlich, die in anderen Fällen bereits zu problematischen Rechenergebnissen führten. Trotzdem kam man zu dem Schluss, dass rund 20 Prozent aller Veröffentlichungen aus der Gen-Forschung in der vorliegenden Form fehlerhaft sind. Die Ursache sind hier automatische Formatierungen, die von Excel vorgenommen werden, wenn der Nutzer die Standard-Einstellungen nicht ändert. Die meist automatisiert aus anderen Datenquellen übertragenen offiziellen Bezeichnungen von Genen werden durch die Microsoft-Software falsch interpretiert und in andere Schreibweisen umgewandelt.

Das Gen "Septin 2" wird in der formalen Schreibweise der Wissenschaft als SEPT2 vermerkt. Excel meint darin allerdings ein Datum zu erkennen und baut den Eintrag in "2-Sep", also den 2. September, um - zumindest in der englischen Sprachversion, die in der international organisierten Wissenschafts-Community aber ohnehin meist zum Einsatz kommt. In der Durchsicht zahlreicher Paper wurde aber auch eine automatische Umformatierung in "2006/09/02" gefunden.

Erste Schritte in Excel für Android-Tablets
videoplayer02:14
Ähnlich sieht es bei einer anderen Gensequenz aus, die mit vollem Namen "Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase" heißt. Die offizielle Kurzform lautet hier MARCH1, was Excel zu 1-Mar ändert, also ebenfalls in eine voreingestellte Datum-Schreibweise. Nicht besser wird es, wenn die RIKEN-Schreibweise zum Einsatz kommt. Hier lautet beispielsweise eine Gen-Kennung "2310009E13", was Excel dann als Fließkommazahl identifiziert und in "2.31E+13" umwandelt.

Anders als falsche Berechnungen, die in der Vergangenheit auch schon auftauchten, führt dieses Problem nicht direkt zu falschen Schlussfolgerungen der Forscher. Schwierig wird es allerdings, wenn nun andere Wissenschaftler auf den Arbeiten ihrer Kollegen aufbauen und mit den bereits vorhandenen Daten weiterarbeiten wollen - und das ist immerhin eine der grundlegenden Funktionsweisen der Forschung. Das ist dann nicht oder nur mit großem Aufwand möglich.

Mit ihrer Untersuchung wollen die Autoren der Studie in erster Linie darauf aufmerksam machen, dass dieses Problem vorhanden ist. Im Grunde gibt es zwei Lösungsmöglichkeiten: Entweder die Genetiker eignen sich bessere Kenntnisse über den Umgang mit Excel an, um vor der Übertragung von Daten erst einmal alle Autokorrekturen abzuschalten - oder aber man greift dann doch besser auf geeignetere, wenn vielleicht auch weniger bequeme Werkzeuge zurück.

☀ Tag- / 🌙 Nacht-Modus
Desktop-Version anzeigen
Impressum
Datenschutz
Cookies
© 2024 WinFuture