Ein Forscher in weißem Schutzanzug und blauen Handschuhen tippt auf der Tastatur eines Computers
REC Stock Footage – stock.adobe.com
REC Stock Footage – stock.adobe.com
Genetik

Autokorrektur sorgt für 30-Prozent-Fehlerquote

Die Autokorrektur von Computerprogrammen sollte eigentlich den Alltag erleichtern. In der Genetik erreicht sie aber laut einer neuen Studie genau das Gegenteil. Sie wandelt abgekürzte Namen von Genen und Proteinen oft falsch um – rund 30 Prozent aller Studien enthalten deshalb fehlerhafte Angaben.

Ein Beispiel aus dem Alltag: Die Autokorrektur in einem üblichen Textverarbeitungsprogramm macht aus „DNA“ gerne „DANN“. In der Genetik mit ihren zahlreichen Abkürzungen können derlei Kaprizen ziemlich unangenehm sein. Die Autokorrektur des englischsprachigen Tabellenkalkulationsprogramms Excel etwa wandelt Gene, die abgekürzt „MARCH3“ heißen (nicht abgekürzt „membrane associated ring-CH-type finger“) oder „DEC1“, regelmäßig in Kalenderangaben um – „3-Mar“ oder „1-Dec“. Da dieses Programm speziell im Begleitmaterial von Studien sehr verbreitet ist, sind seine Fehler höchst relevant.

Tendenz steigend

Ein Team um den Bioinformatiker Mark Ziemann von der Deakin University in Australien hat das Ausmaß der Malaise nun untersucht. Die Forscherinnen und Forscher durchforsteten die begleitenden Excel-Dateien von 11.000 genetischen Studien, die zwischen 2014 und 2020 erschienen sind. Über 30 Prozent von ihnen enthielten Fehler aufgrund von Autokorrekturen, berichten sie in der Fachzeitschrift „Plos Computational Biology“. Das sind noch einmal zehn Prozent mehr als vor fünf Jahren, damals war Ziemann in einer Studie auf eine Fehlerquote von 20 Prozent gekommen.

Was man dagegen tun kann? Zum Teil hat die Wissenschaftsgemeinde bereits reagiert. So änderte die Behörde, die für die Namensgebung menschlicher Gene zuständig ist, im Jahr 2017 knapp 30 „fehleranfällige“ Namen. So wurde etwa aus „MARCH3“ nunmehr „MARCHF3“ – für die Autokorrektur eine leichtere Angelegenheit. Wenn immer möglich, so der Expertentipp von Ziemann, sollten Genetikerinnen und Genetiker auf fehleranfällige Tabellenprogramme verzichten und spezielle Skriptsprachen verwenden. Die Genetik-Gemeinde sei jedenfalls zu klein, um die Autokorrektur großer Computerprogramme zu ändern. Auf die vermutlich einfachste Lösung hat ein science.ORF.at-Leser aufmerksam gemacht: die Autokorrektur in Excel einfach ausschalten.