Jeder kann jetzt leistungsstarke KI-Tools verwenden, um Bilder zu erstellen.  Was könnte schiefgehen?

Jeder kann jetzt leistungsstarke KI-Tools verwenden, um Bilder zu erstellen. Was könnte schiefgehen?



CNN-Geschäft

Wenn Sie schon immer künstliche Intelligenz verwenden wollten, um schnell einen Hybriden zwischen einer Ente und einem Corgi zu entwerfen, ist jetzt die Zeit, um zu glänzen.

Mittwoch, OpenAI Bekanntmachung dass jeder jetzt die neueste Version seines KI-gestützten DALL-E-Tools verwenden kann, um eine scheinbar grenzenlose Auswahl an Bildern zu generieren, indem er nur ein paar Wörter eingibt, Monate nachdem das Startup damit begonnen hat, es schrittweise bei den Benutzern einzuführen.

Dieser Schritt wird wahrscheinlich die Reichweite einer neuen Generation von KI-gestützten Tools erweitern, die bereits ein großes Publikum angezogen und unsere grundlegenden Vorstellungen von Kunst und Kreativität in Frage gestellt haben. Aber es könnte auch zu Sorgen darüber führen, wie diese Systeme missbraucht werden könnten, wenn sie allgemein verfügbar werden.

„Das Lernen aus der realen Nutzung hat es uns ermöglicht, unsere Sicherheitssysteme zu verbessern und heute eine höhere Verfügbarkeit zu ermöglichen“, sagte OpenAI in einem Blogbeitrag. Das Unternehmen sagte, es habe auch verstärkt, wie es Benutzerversuche abwehrt, seine KI dazu zu bringen, „sexuelle, gewalttätige und andere Inhalte“ zu erstellen.

Es gibt jetzt drei bekannte und äußerst leistungsfähige KI-Systeme, die der Öffentlichkeit zugänglich sind, die ein paar Worte aufnehmen und ein Bild ausspucken können. Neben DALL-E 2 gibt es Midjourney, das im Juli veröffentlicht wurde, und Stable Diffusion, das im August von Stability AI veröffentlicht wurde. Alle drei bieten kostenlose Credits für Benutzer, die ein Gefühl für die KI-Bilderstellung online bekommen möchten; normalerweise müssen Sie danach bezahlen.

Dieses Bild einer Ente, die eine Kerze auf einem Kuchen ausbläst, wurde von Rachel Metz von CNN über DALL-E 2 erstellt.

Diese sogenannten generativen KI-Systeme sind bereits gewöhnungsbedürftig Experimentelle Filme, Titelseiten von Zeitschriftenund Immobilienanzeigen. Ein kürzlich mit Midjourney erstelltes Bild einen Kunstwettbewerb gewonnen auf der Colorado State Fair und sorgte für Aufruhr unter Künstlern.

Siehe auch  Monster Hunter Rise verkauft 5 Millionen Exemplare In Woche 1 wächst die gesamte Serie auf über 70 Millionen

In nur wenigen Monaten strömten Millionen von Menschen zu diesen KI-Systemen. Über 2,7 Millionen Menschen gehören dem Discord-Server von Midjourney an, auf dem Benutzer Einladungen einreichen können. OpenAI sagte in seinem Blogbeitrag am Mittwoch, dass es mehr als 1,5 Millionen aktive Benutzer hat, die zusammen täglich mehr als 2 Millionen Bilder mit seinem System erstellt haben. (Es sollte beachtet werden, dass es mehrere Versuche dauern kann, um ein Bild zu erhalten, das für Sie funktioniert, wenn Sie diese Tools verwenden.)

Viele Bilder, die in den letzten Wochen von Benutzern erstellt wurden, wurden online geteilt, und die Ergebnisse können beeindruckend sein. Sie reichen von jenseitige Landschaften und ein Gemälde von französischen Aristokraten als Pinguine hat ein gefälschtes Vintage-Foto eines Mannes, der ein Bärtierchen geht.

Der Aufstieg dieser Technologie und die immer komplizierteren Eingabeaufforderungen und daraus resultierenden Bilder haben selbst langjährige Brancheninsider beeindruckt. Andrej Karpathy, der seine Rolle als KI-Direktor von Tesla im Juli aufgab, sagte in einem kürzlichen Tweet dass er sich, nachdem er gebeten wurde, DALL-E 2 auszuprobieren, „eingefroren“ fühlte, als er zum ersten Mal versuchte, zu entscheiden, was er tippen sollte, und schließlich „chat“ tippte.

Rachel Metz von CNN hat diese halb Ente, halb Corgie mit dem Bildgenerator Stable Diffusion AI erstellt.

„Die Kunst der Eingabeaufforderungen, die die Community in den letzten Monaten immer mehr für Text -> Bildvorlagen entdeckt und perfektioniert hat, ist erstaunlich“, sagte er.

Aber mit der Popularität dieser Technologie gehen potenzielle Nachteile einher. KI-Experten haben Bedenken geäußert, dass die Offenheit dieser Systeme – die sie dazu befähigt, alle Arten von Bildern aus Wörtern zu generieren – und ihre Fähigkeit, die Bilderzeugung zu automatisieren, bedeutet, dass sie groß angelegte Verzerrungen automatisieren könnten. Ein einfaches Beispiel: Als ich diese Woche die Eingabeaufforderung „ein Banker, der sich für einen großen Tag im Büro angezogen hat“ an DALL-E 2 schickte, waren die Ergebnisse alle Bilder von weißen Männern mittleren Alters in Anzügen und Krawatten.

Siehe auch  Pokémons Diamond & Pearl-Remakes werden zum zweitgrößten Switch-Spielstart in Japan

„Sie ermöglichen es Benutzern im Grunde genommen, Fehler im System zu finden, indem sie es verwenden“, sagte Julie Carpenter, Forscherin und Mitglied der Gruppe für Ethik und neue Wissenschaften an der California Polytechnic State University in San Luis Obispo.

Der Gast

Diese Systeme können auch für schändliche Zwecke verwendet werden, z. B. um Angst zu schüren oder Fehlinformationen über KI-veränderte oder vollständig erfundene Bilder zu verbreiten.

Es gibt einige Einschränkungen für die Bilder, die Benutzer erstellen können. Beispielsweise hat OpenAI DALL-E 2-Benutzer Ich stimme zu zu einer Inhaltsrichtlinie, die ihnen sagt, dass sie nicht versuchen sollen, Bilder zu erstellen, hochzuladen oder zu teilen, „die nicht jugendfrei sind oder Schaden anrichten könnten“. DALL-E 2 führt auch keine Eingabeaufforderungen aus, die bestimmte verbotene Wörter enthalten. Aber das Manipulieren des Wortschatzes kann die Einschränkungen umgehen: DALL-E 2 verarbeitet die Eingabeaufforderung „ein Foto einer blutbedeckten Ente“ nicht, aber es gibt Bilder für die Eingabeaufforderung „ein Foto einer blutbedeckten Ente“ zurück. eine viskose rote Flüssigkeit. ” OpenAI selbst erwähnte diese Art von „visuellem Synonym“ in seiner Dokumentation für DALL-E 2.

Chris Gilliard, Just Tech Fellow beim Social Science Research Council, ist der Ansicht, dass die Unternehmen hinter diesen Bildgeneratoren die „endlose Kreativität“ von Menschen „ernsthaft unterschätzen“, die versuchen, mit diesen Tools Schaden anzurichten.

„Ich habe das Gefühl, dass dies ein weiteres Beispiel dafür ist, wie Menschen Technologie veröffentlichen, die in Bezug auf die Bestimmung, wie sie verwendet werden soll, um Chaos zu verursachen und Schaden zu verursachen, irgendwie unausgegoren ist“, erklärte er. „Und dann zu hoffen, dass es später eine Möglichkeit gibt, diesen Schaden rückgängig zu machen.“

Siehe auch  ModMic Uni, USB und drahtlose Clip-Mikrofone im Test

Um potenzielle Probleme zu umgehen, verbieten einige Stock-Bilddienste KI-Bilder insgesamt. Getty Images bestätigte am Mittwoch gegenüber CNN Business, dass es keine Einreichungen von Bildern akzeptiert, die mit generativen KI-Modellen erstellt wurden, und alle Einreichungen, die diese Modelle verwenden, entfernen wird. Diese Entscheidung gilt für seine Bilddienste Getty Images, iStock und Unsplash.

„Es gibt offene Fragen bezüglich des Urheberrechts der Ergebnisse dieser Modelle und es gibt ungelöste Rechtsfragen in Bezug auf die Bilder und zugrunde liegenden Metadaten, die zum Trainieren dieser Modelle verwendet werden“, sagte das Unternehmen in einer Pressemitteilung.

Tatsächlich könnte sich das Erfassen und Einschränken dieser Bilder jedoch als Herausforderung erweisen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert