Oft denken wir, dass Telefonate die sicherste Art der Kommunikation sind, da sie uns das Gefühl von absoluter Privatsphäre und Unhackbarkeit vermitteln, was bei unseren Nachrichten in WhatsApp oder anderen Instant-Messaging-Apps meistens der Fall ist. Kürzlich haben Forscher der Pennsylvania State University jedoch bewiesen, dass dies nicht der Fall ist, indem sie zeigten, dass unsere Gespräche aus der Ferne abgehört werden können, dank eines Details, das nur wenige kennen und das von unserem eigenen Gerät stammt.

Es handelt sich dabei um nichts anderes als Mikrovibrationen, die bei der Übertragung der Stimme entstehen und mit Hilfe einer Technologie, die sie mit künstlicher Intelligenz kombiniert, die Wiederherstellung von Wörtern und Sätzen ohne Wissen des Benutzers ermöglichen, was eine echte Bedrohung für unsere Privatsphäre darstellt.
Das bedeutet, dass ein Angreifer keinen physischen Zugriff auf das Telefon haben muss, sondern lediglich über die entsprechende Ausrüstung verfügen muss, um diese Vibrationen aus einer Entfernung von mehreren Metern zu erfassen und in verständlichen Text umzuwandeln. Obwohl hierfür noch immer fortgeschrittene technische Kenntnisse und spezielle Geräte erforderlich sind, beweist diese Entdeckung, dass kein Telefongespräch völlig sicher ist, und lässt ein Szenario erwarten, in dem unsere Telefongespräche früher als wir uns vorstellen können, nicht mehr privat sein werden.
Wie Telefonate mithilfe von Mikrovibrationen abgehört werden können
Tatsächlich ist der Prozess, durch den ein Gespräch abgehört werden kann, ziemlich subtil, da während eines Telefonats der Lautsprecher und das Mikrofon Mikrovibrationen erzeugen, die sich über das Gehäuse des Mobiltelefons ausbreiten und mit Millimeterwellen erfasst werden können, obwohl sie für uns praktisch nicht wahrnehmbar sind. In Experimenten, die von der Pennsylvania State University durchgeführt wurden, installierten die Forscher Sensoren in einigen Metern Entfernung vom verwendeten Telefon und konnten mithilfe künstlicher Intelligenz Teile des gerade geführten Gesprächs entschlüsseln.

Für diese Analyse wurde eine modifizierte Version von „Whisper” verwendet, einem Open-Source-Modell zur Spracherkennung. Obwohl die anfängliche Genauigkeit bei 60 % lag, weisen Experten darauf hin, dass sie erheblich verbessert werden kann, wenn die Daten mit dem vorherigen Kontext oder Teilinformationen des Gesprächs kombiniert werden. Das bedeutet, dass ein Cyberkrimineller auch ohne direkten Zugriff auf das Telefon einen Teil der Telefonate rekonstruieren und vertrauliche Informationen wie Bankdaten, Passwörter oder persönliche Daten extrahieren kann.
Wachsende Risiken und Schutzmaßnahmen für Ihre Telefonate
Diese Studie wurde auf der Cybersicherheitskonferenz ACM WiSec 2025 vorgestellt. Auch wenn diese Technik derzeit noch nicht für jedermann zugänglich ist, zeigt sie doch, dass die für das Abhören von Telefonaten erforderliche Technologie bereits verfügbar ist und dank künftiger Fortschritte in diesen Bereichen wahrscheinlich in einigen Jahren noch leichter zugänglich sein wird. Das ist ziemlich beunruhigend, vor allem wenn man bedenkt, dass wir eine große Menge an Daten über Sprachnachrichten oder Anrufe austauschen, was eine sehr reale und greifbare Bedrohung für unsere Sicherheit und Privatsphäre darstellt.
Der Hauptautor der Studie, Suryday Basak, vergleicht diese Technologie mit dem Lippenlesen, bei dem es oft nicht möglich ist, eine genaue Transkription zu erhalten, aber in Kombination mit einigen Ausschnitten aus dem Gespräch und dessen Kontext ermöglicht es, einen Großteil davon wiederherzustellen und zu verstehen, worum es geht. In dieser Frage kommt uns künstliche Intelligenz zu Hilfe, was zu einem Paradoxon führt: In vielen Fällen wird sie in der Cybersicherheit eingesetzt, kann aber auch dazu beitragen, bestimmte Spionagemethoden zu verbessern.
Das Problem mit Telefonanrufen ist offensichtlich, aber die Forscher haben auch einige Empfehlungen zu seiner Lösung gegeben, darunter die Neukonstruktion von Geräten zur Verringerung externer Vibrationen, die Verwendung von End-to-End-Verschlüsselung mit Signalredundanz und die Entwicklung kontrollierter Störungen, die die Erfassung von Daten durch Radar verhindern.