1. Die neue Funktion von DomoAI_ ist leistungsstark und praktisch. Sie müssen lediglich ein Referenzbild bereitstellen.

Es kann die Stilkonvertierung für Sie durchführen. Ganz gleich, in welchen Stil Sie konvertieren möchten, DomoAI_ erledigt dies schnell und effizient und verleiht Ihren Bildern einen ganz neuen Charme. Diese Funktion spart nicht nur Zeit, sondern erleichtert auch die Umsetzung von Kreativität und bietet mehr Möglichkeiten für Ihre Designarbeit.

2. Neue Funktionen der Chatbot Arena: Bild-Challenge, KI-Duell beginnt

lmsys.org gab bekannt, dass Chatbot Arena das Hochladen von Bildern unterstützt und damit ein neues Kapitel der multimodalen Interaktion mit KI wie GPT-4o, Gemini, Claude und LLaVA aufschlägt. Benutzer können KI-Modelle durch Aufgaben wie Bild-zu-Code-Konvertierung und visuelle Fragen und Antworten kreativ herausfordern und sich auf die kommenden Bestenlisten freuen. Updates der Plattform verbessern nicht nur das Benutzererlebnis, sondern tragen auch zu Fortschritten im Bereich KI bei. Diese Entwicklung wurde durch die gemeinsamen Bemühungen von Community-Buildern und Beratern ermöglicht, und lmsys.org engagierte sich auch bei anderen Community-Projekten auf Twitter und demonstrierte damit sein Engagement für eine offene Zusammenarbeit.

Einzelheiten: https://chat.lmsys.org/

3. LibreChat: ein kostenloser Open-Source-chatgpt-Klon

Kann auf verschiedene KI-Modelle zugreifen. Es unterstützt die Integration mit KI-Modelldiensten wie OpenAI, Azure, Anthropic und google. Sie können während des Gesprächs frei zwischen den KI-Modellen wechseln und auch Plug-Ins wie DALL-E oder Stable Diffusion zur Bildgenerierung verwenden. Die Schnittstelle ist genau die gleiche wie bei ChatGPT… Unterstützt erweiterte Agenten, Code-Interpreter, Tools und API-Operationen über die OpenAI Assistant API. Es stehen auch verschiedene Plug-Ins zur Verfügung.

Siehe auch  Apple arbeitet an seinem eigenen ChatGPT

Testlink:docs.librechat.ai

4. Diffutoon: Rendern Sie jedes fotorealistische Video direkt im hochauflösenden Anime-Stil

Und kann über Text bearbeitet werden. Hauptfunktionen: – Konvertieren Sie fotorealistische Videos in verschiedene Animationsstile. – Behalten Sie die Konsistenz des Videoinhalts bei und vermeiden Sie Flimmern und Verzerrungen. – Möglichkeit, hochauflösende Videos mit langer Dauer zu erstellen. – Bearbeiten Sie Videoinhalte basierend auf Benutzeranweisungen, z. B. indem Sie Farben ändern oder Spezialeffekte hinzufügen. – Details wie Beleuchtung, Haare und Posen werden sorgfältig beibehalten und gleichzeitig ein visueller Effekt beibehalten, der eng mit dem Animationsstil zusammenhängt. – Kann qualitativ hochwertige Videos im Anime-Stil erstellen, auch wenn das Eingabevideo eine niedrige Auflösung hat

Projektarbeit, ausführliche Erläuterung technischer Methoden: https://xiaohu.ai/p/10205

Projektadresse:https://ecnu-cilab.github.io/DiffutoonProjectPage/

5. Die Open-Source-Community hat endlich ein gutes Video-Repainting-Projekt!

Außerdem werden Colab-Notizen bereitgestellt, die direkt ausgeführt werden können, ohne dass man sich mit dem mühsamen Comfyui-Prozess und einer Reihe von Modellen herumschlagen muss. Diffutoon rendert detaillierte, hochauflösende und langlebige Videos im Anime-Stil. Über ein Zusatzmodul können Inhalte auch auf der Grundlage von Eingabeaufforderungen bearbeitet werden.

Projektadresse:https://github.com/modelscope/Dif

6. RTranslator: eine kostenlose Open-Source-Offline-Echtzeit-Übersetzungsanwendung

85

Es kann Konversationen in Echtzeit zwischen mehreren Personen und mehreren Sprachen übersetzen. Benutzer können sich über Bluetooth-Headsets mit der Anwendung verbinden, ihre Mobiltelefone in die Tasche stecken und Konversationen in Echtzeit mit anderen führen die Sprache der anderen Partei übertragen. Es umfasst drei Modi: Konversationsmodus, Walkie-Talkie-Modus und Textübersetzung. Der Konversationsmodus wird über das Mobiltelefon oder Bluetooth-Headset des anderen Teilnehmers abgespielt. Mehrere Geräte können angeschlossen werden, um eine Konversationsübersetzung in Echtzeit zwischen mehreren Personen und mehreren Sprachen zu ermöglichen.

Siehe auch  ChatGPT kann menschliche Urteile über Regelverstöße nicht reproduzieren

Der Walkie-Talkie-Modus spielt übersetzte Stimmen über das Mikrofon ab und alternative Gespräche werden nicht unterstützt.

Verknüpfung:https://github.com/niedev/RTranslator

7. LLM Exploration Guide: Ressourcenpanorama und Praxisessenz

85

Dieser Leitfaden fasst die Kernressourcen großer Sprachmodelle (LLM) zusammen und soll Forschern und Entwicklern einen Lern- und Übungskanal bieten. Der Inhalt umfasst pädagogische YouTube-Kanäle, klassische Bücher, Schlüsselprojekte, praktische Tools und die neuesten Forschungsarbeiten sowie Projektfälle, an denen der Autor persönlich teilgenommen hat. Durch diese ausgewählten Ressourcen können Leser ein tiefgreifendes Verständnis der Grundkenntnisse von LLM erlangen, die neuesten Forschungstrends erfassen und ihr Verständnis und ihre Anwendung der LLM-Technologie durch praktische Projekte vertiefen. Dieser Leitfaden bietet nicht nur eine theoretische Grundlage für das Erlernen von LLM, sondern betont auch die Bedeutung der Wissensvertiefung durch Konstruktion und Experimentieren. Ganz gleich, ob Sie neu auf dem Gebiet des LLM sind oder ein erfahrener Forscher sind, hier finden Sie wertvolle Ressourcen, um Ihre persönliche und berufliche Entwicklung voranzutreiben.

Einzelheiten: https://joshcarp.notion.site/LLM-resources-fe118332b84f49c286b8045922c7f5a2

5/5 - (351 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein