Du siehst gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicke auf die Schaltfläche unten. Bitte beachte, dass dabei Daten an Drittanbieter weitergegeben werden.
Tools, Tools, Tools… Bei unserem 7. AI-Roundtable in Volkach haben wir einen Ausflug in die Welt der verschiedensten KI-Tools gemacht und fleißig diskutiert:
- Wie kann uns KI im Arbeitsalltag weiterhelfen?
- Welche Vorteile hat die Arbeit mit KI?
- Welche bezahlten Tools gibt es, die für uns interessant sind?
Schau doch mal in unser Interview mit unserer Kollegin Theresa. Sie verrät Dir, welche Vorteile die KI für sie mitbringt 😊
Neues von Sora
Sora kennst Du bereits aus unserem AI-Roundtable Vol. 3. In den vergangenen Monaten wurde die KI Sora von OpenAI noch weiterentwickelt. Ausschlaggebend hierfür war das Feedback von Künstlern, Designern, Kreativdirektoren und Filmemachern.
Sora soll gerade diese Berufsgruppen in ihrem kreativen Schaffungsprozess unterstützen können, wie OpenAI in ihrem Blogbeitrag Ende März verkündet. Die dort gezeigten Ergebnisse sind sicherlich nicht perfekt und auch hier ist noch menschliches Zutun notwendig. Allerdings kann die KI bereits sehr gut erste Eindrücke von Storyboards oder anderen Inspirationen visualisieren.
Voice Engine von OpenAI
Uns kommt es fast schon selbstverständlich vor, dass OpenAI aktuell auch an einer Voice Engine KI arbeitet. Aktuell ist das Tool noch nicht für die User zugänglich. Laut OpenAI soll der Voice Engine bei folgenden Anwendungen unterstützen:
- Lesehilfe:
Bereitstellung von Lesehilfe für Nichtleser und Kinder durch natürlich klingende, emotionale Stimmen - Übersetzungen:
Übersetzen von Inhalten wie Videos und Podcasts, damit YouTuber und Unternehmen mehr Menschen auf der ganzen Welt fließend und mit ihrer eigenen Stimme erreichen können. - Unterstützung:
Unterstützung nonverbaler Menschen, beispielsweise durch therapeutische Anwendungen für Personen mit Erkrankungen, die die Sprache beeinträchtigen, und durch Bildungsverbesserungen für Personen mit Lernbedarf. - Wiederherstellung der Stimme:
Hilfe für Patienten, ihre Stimme wiederherzustellen. Wichtig für diejenigen, die unter plötzlichen oder degenerativen Sprachstörungen leiden
Die Beispielaudios von OpenAI haben uns sehr gut gefallen. Gerade im Hinblick der Anwendungsfälle finden wir das eine sehr tolle Entwicklung der KI.
Allerdings haben wir auch über den bitteren Beigeschmack einer solch gut funktionierenden Voice Engine diskutiert. Mit dem Fazit, dass zukünftig Pishing, Deepfakes oder Ähnliches noch leichter zu bewerkstelligen ist. Eine Unterscheidung zwischen Original und generierter KI-Stimme war für uns in den Bespielen nicht zu erkennen.
Genie – Jump and runs aus Bildern
Googles neuestes KI-Modell, Genie, stellt weder ein umfangreiches Sprachmodell noch eine Bilderkennungs-KI dar. Stattdessen zielt Genie darauf ab, den Gaming-Markt zu revolutionieren, indem es ermöglicht, nahezu alles in ein 2D-Jump-and-Run-Spiel zu verwandeln.
Genie wurde mit mehr als 200.000 Stunden an Videomaterial aus Internetvideos trainiert. Das Deepmind-Team von Google gibt an, dass bereits ein einzelnes Bild ausreicht, um eine vollständig interaktive Umgebung zu erzeugen. Dies ermöglicht es Gamerinnen und Gamern, eigenständig virtuelle Welten zu kreieren.
Testen konnten wir dieses Tool leider noch nicht, auch wenn wir es wirklich gerne getan hätten 😉 Bisher wurde Genie von Google „nur“ angekündigt und dass es in 2024 verfügbar sein soll. Ein genauer Termin wurde auf der Ankündigungsseite jedoch leider nicht verraten.
Käufliche Intelligenz
Mittlerweile gibt es eine Vielzahl an KI-Tools auf dem Markt. Nicht alle davon kostenfrei, weswegen wir uns auch mal kostenpflichtige Tools näher angesehen haben:
ElevenLabs
ElevenLabs bietet eine Text-zu-Sprache Technologie, die es ermöglicht, Text in natürliche und lebensechte Sprache in 29 Sprachen und mit 120 verschiedenen vorkonfigurierten Stimmen oder auf Basis der eigenen synthetisierten Stimme umzuwandeln. Nutzer können die Sprachausgabe über eine benutzerfreundliche Schnittstelle anpassen, wobei sie zwischen klarer und stabiler Sprachausgabe oder verstärkten stimmlichen Stilisierungen wählen können. ElevenLabs ermöglicht das Vorlesen von Texten aller Art, von kurzen E-Mails bis hin zu vollständigen PDF-Dokumenten.
HeyGen
HeyGen ist eine Online-Plattform, um Benutzern das Erstellen von Videos mit künstlicher Intelligenz zu ermöglichen. Diese Plattform bietet eine breite Palette an Funktionen, darunter die Möglichkeit, (persönliche) Avatare und Sprecher für Videos zu generieren. Benutzer können zudem aus einer Vielzahl von vordefinierten Avataren wählen, die in mehreren Sprachen sprechen können, wodurch die Videos mehrsprachig und weltweit einsetzbar sind.
Microsoft 365 Copilot
Der Microsoft 365 Copilot ist ein KI-gestütztes Produktivitätstool, das in Microsoft 365-Apps wie Word, Excel, PowerPoint, Outlook und Teams integriert ist und Nutzern dabei hilft, ihre Arbeit effizienter zu gestalten. Es verwendet große Sprachmodelle und Microsoft Graph-Daten, um Aufgaben wie das Verfassen von Texten, das Analysieren von Daten und das Erstellen von Präsentationen zu automatisieren und zu vereinfachen. Copilot zielt darauf ab, die Kreativität und Produktivität der Nutzer zu steigern, indem es Routine-Aufgaben übernimmt und so mehr Raum für kreative und strategische Arbeit schafft.
Runway Gen-2
Die Plattform „runway“ Gen-2 ist ein innovatives Tool zur Erstellung von Videos, das auf künstlicher Intelligenz basiert und es Nutzern ermöglicht, vollständige Videos aus Textbeschreibungen oder statischen Bildern zu generieren. Nutzer können verschiedene Parameter (z.B. Kameraeinstellungen, Motion Brush) einstellen, um maßgeschneiderte Videos zu erstellen.
Suno
Die KI-Plattform Suno bietet Nutzern die Möglichkeit, eigene Songs zu erstellen. Die Plattform befindet sich derzeit in der Beta-Phase und legt den Fokus darauf, Musikschaffenden ein intuitives Werkzeug zur Verfügung zu stellen, mit dem sie Musikstücke zu verschiedenen Themen generieren können, inklusive Lyrics. Suno richtet sich an ein breites Publikum, von Musikbegeisterten bis hin zu professionellen Künstlern, die nach einer einfachen Möglichkeit suchen, ihre kreativen Ideen in Musik umzusetzen
Perplexity
Perplexity ist eine fortschrittliche Suchmaschine, die auf künstlicher Intelligenz basiert und speziell entwickelt wurde, um die Art und Weise, wie Menschen recherchieren und Wissen teilen, zu verbessern. Im Kern bietet Perplexity eine benutzerfreundliche, Chatbot-orientierte Schnittstelle, über die Nutzer in natürlicher Sprache Fragen stellen können. Die Plattform zieht Informationen aus verschiedenen Online-Quellen heran, um präzise Antworten zu generieren. Nutzer können weiterführende Fragen stellen, auf die Perplexity aufbauend auf den vorherigen Antworten reagiert, was eine kontinuierliche und tiefgehende Interaktion ermöglicht.
Du siehst gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicke auf die Schaltfläche unten. Bitte beachte, dass dabei Daten an Drittanbieter weitergegeben werden.
Unser Kollege Björn verrät Dir, was er zum Thema KI denkt und wie die Zukunft für ihn mit KI aussehen könnte. Schau doch mal rein! 😉