Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

DaSKITA - short proposal #1

Open
eliasgruenewald opened this issue Jan 8, 2021 · 0 comments
Open

DaSKITA - short proposal #1

eliasgruenewald opened this issue Jan 8, 2021 · 0 comments
Labels

Comments

@eliasgruenewald
Copy link
Member

Transparenz ist zur Realisierung von digitaler Selbstbestimmung und Datensouveränität unverzichtbar. Die Erfüllung rechtlicher Transparenzpflichten insbesondere aus der DSGVO geschieht derzeit jedoch meist in einer Art und Weise – etwa in Form von langen, für Verbraucher*innen nur schwer verständlichen Datenschutzerklärungen – die das Ziel der tatsächlichen Informiertheit nicht (mehr) erfüllt. Im Projekt werden daher KI-basierte Ansätze für die technische Umsetzung datenschutzrechtlicher Transparenz evaluiert und prototypisch umgesetzt. Hierzu gehören insbesondere:

  • Visuelle Aufbereitung und Nutzungsinterfaces: Für eine bestmögliche Verstehbarkeit müssen komplexe Informationen in einer Form aufbereitet und dargestellt werden, die sich dynamisch an individuelle Präferenzen und Kompetenzen von Verbraucherinnen sowie an den jeweiligen Nutzungskontext anpasst. Hierzu sollen lernende Verfahren – etwa aus den Feldern Adaptive Hypermedia und Adaptive User Interfaces – im Kontext realer Anwendungsszenarien für Verbraucherinnen praktisch nutzbar gemacht werden. Auch neue KI-basierte, digitale Assistenten (mittels Conversational AI) zur Ausübung der Betroffenenrechte sollen entwickelt werden.

  • Identifikation und Analyse von Austausch- und Weiterleitungsnetzwerken: Weiterleitungen personenbezogener Daten zwischen unterschiedlichen Anbietern – etwa zu Werbezwecken oder zur Prüfung der Kreditwürdigkeit – gehören zu den für Verbraucherinnen am schwierigsten durchschaubaren Aspekten des digitalen Alltags. Viele Dienste leiten personenbezogene Daten ihrer Nutzerinnen zu unterschiedlichen Zwecken an hunderte weitere Akteure weiter, die diese Daten ihrerseits wiederum weitergeben können. Verbraucher*innen können diese Praxis derzeit nicht mehr nachvollziehen. Etablierte KI-basierte Verfahren der Netzwerkanalyse und der Mustererkennung (etwa Clustering- und Klassifikationsalgorithmen) sollen hier Abhilfe schaffen und erstmalig im Kontext datenschutzrechtlicher Transparenzherausforderungen zum Einsatz kommen, indem z.B. Akteure, die personenbezogene Daten aus besonders vielen Quellen empfangen, automatisiert identifiziert und miteinander in Beziehung gesetzt werden. Hierbei werden auch Übermittlungen abgedeckt, die sich von außen zwar nicht beobachten lassen, in Datenschutzerklärungen aber explizit annonciert sein müssen.

  • Extraktion und maschinenlesbare Repräsentation von Transparenzinformationen: Für die praktische Umsetzung der o.g. Funktionalitäten ist es unverzichtbar, die zugrunde liegenden Transparenzinformationen maschinenlesbar zu strukturieren. Im Projekt wurde deshalb zuerst ein alle relevanten rechtlichen Anforderungen der DSGVO abdeckendes Repräsentationsformat entwickelt, auf das entsprechende Abschnitte traditioneller Datenschutzerklärungen abzubilden sind. Hierfür werden unterschiedliche KI-basierte Ansätze des Natural Language Processing / Understanding (insbesondere Named-Entity Recognition, Part-of-speech tagging) genutzt. Besondere Herausforderungen ergeben sich dabei aus der spezifisch juristischen Sprache, die sich signifikant von anderen NLP-/NLU-Anwendungen unterscheidet..

Darüber hinaus werden im Projekt auch für den Bereich der Auskunft – also für das individuelle Recht, die über einen selbst bei einem Anbieter gespeicherten Inhaltsdaten zu erhalten – verschiedene KI-basierte Verfahren erforscht. Diese reichen von Assistenten zur Datenanforderung (auf Basis von Topic Modelling; bspw. Latent Dirichlet allocation) bis zur Verdeutlichung von Risiken im Zusammenhang mit anbieterübergreifend vorliegenden Daten (z.B. mittels automatisiertem Schema-Matching und Relationship Extraction).

Das Projekt bringt damit etablierte KI-Verfahren in einem vollkommen neuen Kontext - der datenschutzrechtlichen Transparenz und Auskunft - zur konkreten Anwendung und leistet so maßgebliche Beiträge zur Lösung einer hochaktuellen gesellschaftlichen Herausforderung. Es ist dabei in mehrerlei Hinsicht innovativ:

  • Textuelle Datenschutzerklärungen werden unter Zuhilfenahme von KI-Verfahren um eine maschinenlesbare Repräsentation ergänzt, die eine Vielzahl neuer, verbraucher*innenfreundlicher Funktionalitäten überhaupt erst ermöglicht

  • Austausch- und Weiterleitungsnetzwerke werden auch über clientseitig beobachtbare Aktivitäten hinaus erfasst und mit KI-Methoden analysiert – auch zur Erkennung zweifelhafter Geschäftspraktiken

  • In der verbraucher*innenseitigen Darstellung geht das Projekt mit kompetenz-, kontext- und interessensadaptiven Aufbereitungen weit über derzeit diskutierte, weitgehend statische und in ihrer Ausdrucksmächtigkeit eingeschränkte Ansätze – etwa zur Repräsentation durch Icons – hinaus.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant