Googles google.com/chat“ target=“_blank“>Barden-KI chatbot steigt auf, um es mit chatgpt von OpenAI und dem Microsoft Bing/Copilot Image Creator aufzunehmen. Unter der Führung von Sundar Pichai entstand der Technologieriese hat angekündigt einige raffinierte Upgrades, das Hinzufügen von Bilderstellungsfunktionen mit dem Imagen 2 AI-Modell und die Verbesserung der Gemini Pro-Version.
Jack Krawczyk, Produktleiter bei Bard, hob diese Verbesserungen hervor, die Bard zu einem weltweit zugänglichen KI-Partner für verschiedene Aufgaben machen. Ein kostenloses Tool zum Erstellen von KI-Bildern ist jetzt Teil von Bard und erweitert damit seine Benutzerbasis.
Jetzt müssen Benutzer nur noch den Google Bard in regelmäßigen Chats bitten, ein oder mehrere Bilder einer bestimmten Idee zu erstellen, und er wird mit aufgeforderten Bildern zurückkommen.
Das auf die Sprachverarbeitung zugeschnittene Gemini Pro von Google unterstützt mittlerweile über 40 Sprachen. Dazu gehören Koreanisch, Spanisch, Tamilisch, Italienisch und Russisch, wodurch es in mehr als 230 Ländern zugänglich ist. Die erweiterten Verständnis-, Zusammenfassungs-, Argumentations- und Codierungsfunktionen von Gemini Pro sowie die Doppelkontrollfunktion von Bard verbessern die Benutzererfahrung.
Ein wichtiges Update ist Bards Integration der KI-Bilderzeugung mithilfe des Imagen 2-Modells, das direkt mit ChatGPT Plus von OpenAI mit DALL-E 3 konkurriert. Benutzer können Bard mit Beschreibungen wie „Erstellen Sie ein Bild eines kreativ aussehenden modernen Roboters, der beruflich am Laptop arbeitet“ auffordern ,“ und es generiert Bilder in 10–30 Sekunden.
Trotz der Geschwindigkeit von Bard gibt es Einschränkungen. Anpassungen des Seitenverhältnisses und nicht-englische Eingabeaufforderungen werden nicht unterstützt. Google geht auf Urheberrechtsbedenken ein und ermöglicht Nutzern die Meldung rechtlicher Probleme im Zusammenhang mit KI-generierten Medien.
Bei meinen Tests habe ich Bard gebeten, ein Bild zu erstellen, und es kam mit dem unten aufgeführten Ergebnis zurück. Auf den ersten Blick sieht es gut aus, aber beim Herunterladen der Bilder scheinen sie von sehr schlechter Qualität und geringer Pixelanzahl zu sein, insbesondere wenn ich Bard bitte, mehr zu generieren. Auf der anderen Seite produzieren Bing und ChatGPT Plus viel mehr Fotos in besserer Qualität (ich würde sagen High-Definition), wobei die Wahrscheinlichkeit geringer ist, dass fehlerhafte/fehlerhafte Ergebnisse entstehen.
Bild: Erstellt mit Bard AI. Ohne Bearbeitung hochgeladen. Das zeigt, dass die Ergebnisse nicht sehr ansprechend sind.
Überraschenderweise erlaubt Google derzeit anderen Nutzern nicht, die von mir erstellten Bilder herunterzuladen, selbst wenn ich sie teile chattet öffentlich. Dies könnte daran liegen, dass sich das Tool noch in der Entwicklungsphase befindet.
Zurück zum Thema: Um eine ethische Nutzung zu gewährleisten, begrenzt Google die Erstellung unangemessener Inhalte und bettet digital identifizierbare Wasserzeichen in Bilder ein. Dies hilft Benutzern, zwischen KI-generierten Bildern und solchen, die von menschlichen Künstlern erstellt wurden, zu unterscheiden.
Zusätzlich zu Bard-Updates stellt Google vor ImageFXein experimentelles Bildgenerierungstool auf Basis von Imagen 2. Verfügbar im KI-TestkücheImageFX bietet Benutzern ausdrucksstarke Chips zum Verfeinern von Eingabeaufforderungen und zum Erkunden kreativer Dimensionen. Die AI Test Kitchen präsentiert auch andere Projekte wie MusicFX, das Melodien mit einer Länge von bis zu 70 Sekunden erstellt, und TextFX, ein Experiment für kreative Künstler.
🖼 Einführung von ImageFX in @LabsDotGoogle.
Dieses neue Tool bietet Benutzern eine leistungsstarke Schnittstelle, um die Bilderzeugung schnell und sicher zu erkunden.
Finde mehr heraus. → https://t.co/WuX3HYzzJi pic.twitter.com/OVxTtneuyp
– Google DeepMind (@GoogleDeepMind) 1. Februar 2024
Lesen Sie weiter: Sundar Pichai stellt Googles KI-Innovationen vor: Circle to Search, Lens und Bard, die die Zukunft neu definieren