Machine Learning kann Coder enttarnen
Wie mehrere Forscher der Drexel University auf der DefCon-Konferenz demonstriert haben, kann maschinelles Lernen herausfinden, wer einen bestimmten Programmcode angefertigt hat.
Dazu werden erst einmal alle in einem bestimmten Code-Segment genutzten Features identifiziert. In einem zweiten Schritt versucht der Algorithmus, die dem Programmcode zugrundeliegende Struktur zu durchschauen, was in etwa der Satzstruktur in herkömmlicher Kommunikation entspricht.
Dabei muss der Algorithmus freilich erst einmal angelernt werden, wozu mehrere von einem Entwickler angefertigte Code(fragmente) nötig sind. Dabei sollen bereits von einem Entwickler veröffentlichte kurze Code-Schnipsel etwa auf GitHub ausreichen, um Code von diesem Entwickler zu identifizieren - theoretisch könnte sich ein Hacker so verraten.
Der Ansatz könnte etwa im Falle von Cyberangriffen wertvolle Hinweise auf die Urheberschaft geben, selbiges gilt etwa bei einem Streit um die Rechte an einem speziellen Programms oder Features.