OpenAI's Kehrtwende: GPT-4 wird nicht mit den Daten von API-Kunden trainiert

openai-datenschutzänderungen-6457d3fd3d25f-sej-760x400.png

In einer bedeutenden Abkehr von bisherigen Praktiken hat OpenAI angekündigt, dass es keine Kundendaten mehr verwendet, die über seine APIs gesendet werden, um seine umfangreichen Sprachmodelle wie GPT-4 zu trainieren.

Die Änderung wurde vom CEO von OpenAI, Sam Altman, in einem kürzlichen Interview mit CNBC bestätigt.

OpenAI's neuer Ansatz für Benutzerdaten

OpenAI hat seine Richtlinie am 1. März 2023 umgesetzt, indem das Unternehmen stillschweigend seine Nutzungsbedingungen aktualisiert hat, um dieses neue Bekenntnis zum Schutz der Privatsphäre der Benutzer widerzuspiegeln.

Altman klärte auf: "Kunden möchten eindeutig nicht, dass wir ihre Daten trainieren, daher haben wir unsere Pläne geändert: Wir werden das nicht tun."

APIs, oder Application Programming Interfaces, sind technologische Frameworks, die es Kunden ermöglichen, direkt auf die Software von OpenAI zuzugreifen.

Altman erklärte, dass OpenAI seit geraumer Zeit nicht mehr die API-Daten für das Modelltraining verwendet hat. Dieser offizielle Ankündigung gibt also einer bereits bestehenden Praxis eine förmliche Form.

Auswirkungen für Geschäftskunden

Die Entscheidung von OpenAI hat weitreichende Auswirkungen, insbesondere für seine Geschäftskunden, zu denen Giganten wie Microsoft, Salesforce und Snapchat gehören.

Diese Unternehmen sind eher dazu geneigt, die API-Fähigkeiten von OpenAI für ihre Geschäftstätigkeiten zu nutzen, daher ist der Datenschutz- und Datenschutzwechsel für sie besonders relevant.

Allerdings gelten die neuen Datenschutzbestimmungen ausschließlich für Kunden, die die API-Dienste des Unternehmens nutzen. Die aktualisierten Allgemeinen Geschäftsbedingungen von OpenAI vermerken: "Wir können Inhalte von Diensten außerhalb unserer API verwenden".

Andere Arten der Dateneingabe, wie z.B. Text, der in den beliebten Chatbot ChatGPT eingegeben wird, können von OpenAI weiterhin genutzt werden, sofern die Daten nicht über die API geteilt werden.

Umfassender Brancheneinfluss

OpenAI hat seine Politik geändert, während Branchen mit den möglichen Auswirkungen von großen Sprachmodellen, wie OpenAI's ChatGPT, kämpfen, die traditionell von Menschen erstelltes Material ersetzen könnten.

Zum Beispiel hat die Writers Guild of America kürzlich mit einem Streik begonnen, nachdem die Verhandlungen zwischen der Gewerkschaft und den Filmstudios gescheitert sind. Die Gewerkschaft hatte sich dafür eingesetzt, Einschränkungen beim Einsatz von OpenAI's ChatGPT für die Generierung oder Überarbeitung von Drehbüchern durchzusetzen.

OpenAI’s Entscheidung, Kundendaten nicht für das Training zu verwenden, markiert einen Wendepunkt in der laufenden Debatte über Datenschutz und KI. Während Unternehmen weiterhin die Möglichkeiten der KI-Technologie erkunden und vorantreiben, wird die Gewährleistung der Nutzerdaten-Privatsphäre und das Aufrechterhalten des Vertrauens voraussichtlich weiterhin zentral für diese Diskussionen sein.

Die Entwicklung von ChatGPT: GPT-3 zu GPT-4

Es ist wichtig zu beachten, dass OpenAIs Verpflichtung, Kunden daten nicht für das Training zu verwenden, auf sein neuestes Sprachmodell, GPT-4, das am 14. März 2023 veröffentlicht wurde, anwendbar ist.

GPT-4 führte mehrere Verbesserungen gegenüber seinem Vorgänger, GPT-3, ein, darunter eine signifikante Erhöhung der Wortlimitgröße (25.000 im Vergleich zum 3.000-Wortlimit von ChatGPT), eine größere Kontextfenstergröße und verbesserte Argumentations- und Verständnisfähigkeiten.

Ein weiteres bemerkenswertes Merkmal von GPT-4 ist seine Multimodalität, also die Fähigkeit, neben Text auch Informationen aus Bildern zu verstehen und abzuleiten. Dieses neueste Modell generiert humanere Texte und verwendet dabei Funktionen wie Emojis für ein persönlicheres Erlebnis.

Die genaue Größe und Architektur von GPT-4 bleiben jedoch geheim, was zu Spekulationen über die Details des Modells führt.

Trotz dieser Gerüchte hat der CEO von OpenAI spezifische Behauptungen über die Größe des Modells verneint.

In Bezug auf Leistung hat GPT-4 stärken bei der Texterzeugung gezeigt, aber auch einige Einschränkungen. Zum Beispiel erreichte es im 54. Perzentil in der Schreibaufgabe der Graduate Record Examination (GRE) und erzielte Ergebnisse zwischen dem 43. und 59. Perzentil in der AP Calculus BC Prüfung.

Darüber hinaus hat es bei einfachen Leetcode-Codierungsaufgaben gute Ergebnisse erzielt, aber seine Leistung hat sich bei zunehmender Aufgabenschwierigkeit verschlechtert.

Obwohl die genauen Einzelheiten des Schulungsprozesses von GPT-4 nicht offiziell dokumentiert sind, ist bekannt, dass GPT-Modelle im Allgemeinen ein maschinelles Lernen im großen Maßstab mit einer vielfältigen Palette an Internettexten beinhalten.

Ausblick

Aufgrund von Änderungen an OpenAIs Datenverwendungsrichtlinie umfasst die für das Training der Sprachmodelle verwendeten Daten keine Informationen, die über die API geteilt werden, es sei denn, die Nutzer erklären sich ausdrücklich damit einverstanden, diese für diesen Zweck beizutragen.

Während diese Technologie sich verbessert und eine immer bedeutendere Rolle in unserem Leben spielt, ist es interessant zu sehen, wie Unternehmen auf Bedenken bezüglich des Schutzes von Daten und dem Gewinnen des Vertrauens der Menschen reagieren und ihre Strategien ändern.

Zugehörige Artikel

Mehr anzeigen >>

Nutzen Sie die Kraft der KI mit HIX.AI!