Bewertungskriterien für den Digitalen Souveränitätsscore für KI-Systeme
Der Souveränitätsscore für KI-Systeme (SC-KI) wird aus unterschiedlichen Kriterien berechnet. Diese wurden im Rahmen einer Masterarbeit am Institut für Informatik an der Universität Würzburg erarbeitet und werden hier kurz aufgeschlüsselt. Kriterien gelten in der vorliegenden Fassung des SC-KI als Erfüllt, wenn eine bestimmte Bedingung vorhanden ist. Kriterien werden in der Regele binär (Erfüllt/Nicht Erfüllt) bewertet. Ausnahme bildet das Kriterium Offenheit, das erfüllt, zum Teil erfüllt oder nicht erfüllt sein kann.
Eine Übersicht zur Berechnung des SC-KI finden Sie hier.
Im Folgenden werden die einzelnen Kriterien kurz erläutert:
Monopole am digitalen Markt stellen eine Gefahr für die digitale Souveränität dar. Durch eine solche Monopolstellung besitzen Anbieter eine immense Marktmacht und haben die volle Kontrolle über Preise.
Ein Lock-In-Effekt entsteht und Nutzer machen sich durch fehlende Alternativen von einem Anbieter abhängig. Diese Gefahr besteht auch bei der Nutzung von KI-Systemen, wenn diese von einem Monopolisten angeboten werden.
Das Kriterium ist besonders wichtig bei der Betrachtung der digitalen Souveränität eines KI-Systems, da bei Nicht-Erfüllung Wettbewerbsfähigkeit sowie Innovationskraft leiden.
Aus diesem Grund gehört es zu den KO-Kriterien.
Ein wichtiges Kriterium für Digitale Souveränität ist die On-Premise-Unterstützung eines KI-System. Ist das KI-System bzw. etwaige Modelle, wie GPT-3.5 von OpenAI, nur in der Cloud des Anbieters verfügbar, sind Abhängigkeiten und Verlust von Digitaler Souveränität vorprogrammiert.
Grundsätzlich ist es möglich komplette KI-Systeme sowohl via Cloud Computing als auch on-premises zu betreiben. Cloud Computing wird definiert als "Modell, das bei Bedarf - meist über das Internet und geräteunabängig - zeitnah und mit wenig Aufwand geteilte Computerressourcen als Dienstleistung, etwa in Form von Servern, Datenspeicher oder Applikationen, bereitstellt und nach Nutzung abrechnet".
Neben dem Speichern auf externen Servern gibt es allerdings auch die Möglichkeit, Server mit eigener Hardware zu betreiben. Dieses Vorgehen wird als "On-Premises" ("In eigener Umgebung") bezeichnet. Software zum Serverbetrieb wird entweder auf eigener Hardware oder angemieteter Fremdhardware installiert und wird vom Betreiber selbst verwaltet, betreut und aktualisiert. Für Anwender hat es meist keine oder nur zweitrangige Bedeutung, ob ein KI-System On-Premise oder durch die Cloud bereitgestellt wird.
Im Kontext der Digitalen Souveränität ist diese Unterscheidung allerdings von zentraler Bedeutung:
Werden die eingegeben Daten zur Weiterverarbeitung durch ein KI-System nicht auf eigener Hardware gespeichert bzw. weiterverarbeitet, besteht die Gefahr eines Datenabflusses. Darüber hinaus werden übermittelte Anfragen an KI-Systeme oft zum weiteren Training der jeweilgen Modelle genutzt, sodass potenziell sensible Daten andern Nutzern der KI vorgeschlagen werden. Durch einen On-Premises-Betrieb eines KI-Systems kann dieser Abfluss verhindert werden, da Anfragen (wenn sie zum Training genutzt werden sollen) stets im eigenen System verbleiben.
Bei der Nutzung von KI-Systemen hat das Kriterium des Rechtsstandortes und der Datensouveränität eine besonders hohe Relevanz, da viele Daten — unter anderem auch sensible Daten — bedenkenlos den KI-Systemen zur Verfügung gestellt werden. Der Datenschutz und die daraus resultierende Datensouveränität spielen also eine erhebliche Rolle bei der Nutzung dieser Systeme.
Dabei gilt zu beachten, dass nur wenn der juristische Hauptstandort des Anbieters des KI-Systems in der EU liegt eine DSGVO-Konformität garantiert ist. Darüber hinaus haben Anwender die rechtliche Schritte nach europäischem Recht einzuleiten, wenn Verstöße bzgl. Datenschutz oder sonstigen Rechten von EU-Bürgern vorliegen.
Standardisierte Schnittstellen bieten Entwicklern von Software die Möglichkeit, ihre Software mit anderer Software zu verbinden. Dadurch ist ein Datenaustausch möglich. Eine solche Schnittstelle nennt man Application Programming Interface (API).
APIs, die im Zusammenhang mit KI genutzt werden, nennt man auch AI APIs. Diese heben die traditionellen und etablierten Schnittstellen auf eine neue Stufe, da sie nicht nur einfache Daten zurückliefern. Sie sind dazu in der Lage, natürliche Sprache zu „verstehen“ und darauf basierend Texte, als auch Empfehlungen, zu generieren und einer Software zu liefern.
Wie bei traditionellen APIs gibt es auch hier offene und geschlossene bzw. proprietäre Schnittstellen. Während eine offene Schnittstelle i.d.R. komplett bzw. bis zu einem gewissen Threshold kostenlos genutzt werden kann, muss für die Nutzung einer proprietären API bezahlt werden.
Beim Kriterium der Offenheit müssen einige Anpassungen gegenüber dem Kriterium Quelloffenheit für Software vorgenommen werden, um die digitale Souveränität einer KI zu gewährleisten bzw. zu wahren. Anders als OSS ist der Begriff „Open AI“ nicht klar definiert und wird verschieden interpretiert. Dabei gilt es unterschiedliche Faktoren zu beachten:
- Freie Datensätze: Sind die verwendeten Daten frei und kostenlos verfügbar?
- Offene Parameter: Sind die verwendeten Parameter, die zum Training der KI genutzt wurden, veröffentlicht?
- Offene Gewichte: Sind die zum Training der KI verwendeten Gewichte einsehbar?
- Quellcode: Ist der Quellcode Open Source?
Diese vier Faktoren werden in der Berechnung des Souveränitätsscores für KI-Systeme (SC-KI) als Unterkriterien betrachtet, die unabhängig vom Rest wie folgt berechnet werden:
- e(OS) stellt die Erfüllungsfunktion dar, die angibt welchen Wert das Kriterium Offenheit erhält
- Die Menge K_OS stellt die vier eben genannten Faktoren einer "offenen KI" dar, wobei diese jeweils erfüllt oder nicht erfüllt sein können.
Dadurch ist es möglich, dass das Kriterium Offenheit einen Wert zwischen 0 (nicht erfüllt) und 1 (erfüllt) annehmen kann.
Dieses Kriterium für ein KI-System ist von signifikanter Relevanz für die Nutzung im Sinne der digitalen Souveränität. Es stellt sicher, dass bei der Wahl eines Hosting-Providers mit Monopolstellung am digitalen Markt — also großem Einfluss und daraus resultierendem Risiko für die digitale Souveränität — das komplette KI-System mit 0 bewertet wird.
Eine solche Wahl muss sich im SC-KI widerspiegeln, selbst bei Erfüllung der restlichen Kriterien. Durch die Nutzung eines digitalen Produktes oder einer Dienstleistung eines Monopolisten am digitalen Markt wird dessen Monopol- stellung verstärkt, die digitale Abhängigkeit von diesem Unternehmen erhöht und gleichzeitig die digitale Souveränität geschwächt.
Somit ist dieses Kriterium ein KO-Kriterium.
Der juristische Hauptsitz des Hosting-Providers ist ein weiteres sehr wichtiges Kriterium, das sich auf die Infrastruktur zum Hosting eines KI-Systems bezieht.
Aufgrund abweichender Datenschutzgesetze in anderen Staaten kann nur innerhalb der EU pauschal von einer Erfüllung des Kriteriums im Sinne der digitalen Souveränität gesprochen werden. Ein Beispiel hierfür ist der „CLOUD Act“ in den USA. Dieser ermöglicht es US-Behörden die Offenlegung von Daten zu fordern, wenn der juristische Hauptsitz des Unternehmens in den USA ist. Dadurch ist die Wahl eines Anbieters aus den Vereinigten Staaten zum Hosting eines KI-Systems nicht mit der DSGVO und folglich nicht mit der digitalen Souveränität vereinbar.
Eine solche Wahl der zugrundeliegenden Infrastruktur muss sich in der Bewertung der digitalen Souveränität widerspiegeln und führt zu einem SC-KI von 0 für das komplette KI-System.
Somit ist dieses Kriterium ein KO-Kriterium.
Eine genauso wichtige Rolle, wie der juristische Hauptsitz und die Monopolstellung eines Anbieters, spielt der Serverstandort. Die zum Hosting verwendeten Server müssen stets physisch in der EU betrieben werden. Ein besonders besorgniserregendes, wenn auch sehr fernes, Beispiel ist die Offenlegung und Sicherung personenbezogener Daten auf Servern, die sich physisch in Indien befinden. Obgleich Indien weit entfernt ist, spiegeln solche Gesetze bzw. Gesetzesänderungen Risiken für die digitale Souveränität wider, wenn der Serverstandort nicht in der EU und Anbieter somit nicht an die DSGVO, sondern andere Gesetzgebungen, gebunden sind.
Somit stellt auch dieses Kriterium eine hohe Relevanz für die Bewertung der digitalen Souveränität eines KI-Systems dar und muss bei Nichterfüllung dazu führen, dass das komplette System mit einem SC-KI von 0 bewertet wird.
Somit ist dieses Kriterium ein KO-Kriterium.