Seite wählen

Welche Neuerungen bietet ChatGPT4o für Unternehmen?

von Mai 16, 2024KI in Unternehmen0 Kommentare

Nach langen Rätseln ist es jetzt raus, das lange ersehnte Update von OpenAI. Während ChatGPT 5 wahrscheinlich erst im Sommer kommt und die Suchfunktion noch verschoben wurde, ist jetzt das Modell ChatGPT4o erschienen. Das neue Modell bietet anscheinend viele Verbesserungen bei der Spracherkennung und bei den multimodalen Fähigkeiten. ChatGPT4o soll in der Lage sein, Bilder besser zu erkennen und kommuniziert mit der Spracheingabe. Diese Funktionen gibt es zwar auch bei der 4er Version, aber jetzt ist das Modell anscheinend in der Lage noch sehr viel besser unterschiedlichen Input zu erkennen und zu verarbeiten.

Wir haben in diesem Artikel einige Fähigkeiten getestet, die für Unternehmen interessant sind. Wir geben Ihnen einen Eindruck von typischen Use-Cases, die im Unternehmen relevant sind.

 

 

ChatGPT4o und digitale Texterkennung

 

Eine erste Einsatzmöglichkeit ist die Digitalisierung von Handschriften. Handschriftliche Notizen lassen sich mit ChatGPT0 einfach in digitale Notizen überführen. Das kann zwar bereits das 4er-Modell. Aber nach unseren Tests ist 4o nochmal besser darin, Handschriften zu erkennen und in eine digitale Form zu übertragen.

Mit diesem Beispiel haben wir diese Notizen zur Projektplanung mithilfe von ChatGPT4o digitalisiert.

 

In der heutigen Zeit, in der alles digital wird, ist es wichtig, handschriftliche Notizen schnell und genau in digitale Formate umzuwandeln. Wenn Sie viel mit handschriftlichen Informationen arbeiten, können hier viel Zeit und Mühe sparen. Ein weiterer großer Vorteil wäre, dass Sie den Text schnell auch weiterverwenden können. Sie können die Notizen beispielsweise zusammenfassen oder sehr schnell für ein bestimmtes Projekt aufarbeiten.

Meetings aufnehmen und verschriftlichen

 

Ein großer Fortschritt ist anscheinende die Möglichkeit von ChatGPT4o, gesprochene Sprache zu verstehen. Mit einem Handy und einer ChatGPT-Instanz können Sie so schnell aus ChatGPT einen Assistenten machen, der Ihre Meetings nicht nur aufnimmt, sondern auch gleich verschriftlicht. ChatGPT4o nimmt Meetings in Echtzeit auf und gibt am Ende den Text aus oder wenn gewünscht auch eine Zusammenfassung des Meetings.

Bei unseren Tests war das noch etwas holprig, da die Server von OpenAI aktuell noch häufig überlastet sind. Aber die ersten Versuche waren schon ganz aufschlussreich. Die KI kann den gesprochenen Text auf Deutsch und auf Englisch gut erkennen und gibt am Ende eine Textfassung aus.

ChatGPT4o könnte sich als ein Sprachassistent etablieren, der andere spezialisierte Modelle verdrängt. Eine große Stärke von ChatGPT4o ist sicher die Möglichkeit, die Aufnahmen mit einer aktuelle KI nicht nur wiederzugeben sondern auch weiterzuentwickeln.

 

Grafiken mit ChatGPT4o

 

Seit einigen Monaten hat ChatGPT 4 Dall-E integriert und lieferte damit eine solide Text-2-Bild Schnittstelle. Die Ausgaben von Dall-E waren in Ordnung, teilweise sehr gut. Gerade bei Backshops lieferte Dall-E eine gute Qualität, manche Bildergebnisse waren aber nicht zufriedenstellend. Vor allem, wenn es um Infografiken oder Visualisierungen ging, schnitt Dall-E meisten eher schlecht ab. Generell war die Leistung nicht so gut, wenn Text in Bilder integriert werden soll.

 

Bei der neuen Version ist die Bilderkennung deutlich verbessert. Wir haben die Fähigkeiten getestet, Infografiken zu liefern und das Ergebnis ist aktuell (14.05.) noch überschaubar. Auch jetzt ist ChatGPT noch nicht in der Lage, Schriften ohne Fehler in Bilder zu integrieren. Was sich anscheinend etwas verbessert hat, ist die Fähigkeit der Text2Image Produktion. Die Bilder lassen sich mit dem Modell 4o referenzieren und weiter verarbeiten.

 

Erkennen von Bildern

 

ChatGPT kann mit dem neuen Modell besser Bilder erkennen, wie wir bei der Schrifterkennung gesehen haben. Damit ist ChatGPT in der Lage, Grafiken und Bilder besser zu interpretieren, als es vorher der Fall war. Das kann interessant sein, wenn Sie beispielsweise Daten als Bilder oder in Folien haben und eine Aussage dazu haben möchten. So kann ChatGPT4o beispielsweise die folgende Grafik von Our World in Data interpretieren.

Wenn Sie die Grafik der KI geben und nach einer Analyse fragen, liefert ChatGPT einen korrekten Output:

Design

  • Vereinigte Staaten (61%): Die USA dominieren den Designmarkt für Logikchips mit einem Marktanteil von 61%. Dies deutet darauf hin, dass die meisten Designs für Logikchips aus den USA stammen.
  • Taiwan, China, Andere (je 9%): Taiwan, China und eine Gruppe anderer Länder haben jeweils einen Marktanteil von 9% im Design von Logikchips.
  • Südkorea und Japan (je 6%): Südkorea und Japan tragen jeweils 6% zum Marktanteil im Bereich Design bei.

Fertigung (Fabrication)

  • Taiwan (47%): Taiwan ist führend in der Fertigung von Logikchips mit einem Marktanteil von 47%. Dies zeigt die bedeutende Rolle Taiwans in der tatsächlichen Produktion von Logikchips.
  • Vereinigte Staaten (27%): Die USA haben einen Marktanteil von 27% in der Fertigung, was ihre starke Präsenz in der Produktion, aber deutlich hinter Taiwan, zeigt.
  • China (12%) und Südkorea (11%): China und Südkorea haben respektable Anteile von 12% bzw. 11% an der Fertigung von Logikchips.
  • Italien (2%) und Japan (1%): Italien und Japan haben relativ geringe Anteile an der Fertigung von Logikchips mit 2% bzw. 1%.

Das ist sehr beeindruckend und geht weit über die Leistung des vorherigen Modells hinaus! ChatGPT4o lässt sich in Unternehmen einsetzen, wenn Sie häufiger Grafiken oder Bilder auswerten müssen. Sie könnten damit beispielsweise den Zustand von Gütern überprüfen, Screenshots automatisch analysieren oder Bilder und Grafiken in Social-Media-Kanälen halbautomatisch auswerten.

 

Echtzeitübersetzung von Sprache

 

Auch die Echtzeitübersetzung von Sprachen funktioniert inzwischen sehr gut. ChatGPT4o hat eine sehr natürliche Stimme, die nicht mehr so künstlich klingt wie bei den früheren Versionen.  Mit einer einfachen Eingabe oder Ansage, dass man Sätze in eine Zielsprache übersetzen möchte, gibt ChatGPT den Input dann in der Zielsprache aus. Auch das kann sehr interessant für Unternehmen sein, Sie können sich so mit einem Geschäftspartner verständigen oder gesprochene Sprache sehr schnell übersetzen. Was vorher schon mit geschriebener Sprache gut funktionierte, ist jetzt auch mit gesprochener Sprache möglich.

Die Übersetzungen werden direkt ausgegeben und sie können ChatGPT4o – mit leichten Latenzen – dafür nutzen, eine Konversation zu führen. Was uns noch aufgefallen ist, sind die Feinheiten in der Übersetzung ins Englische. Auch hier werden verschiedenen Sprachniveaus abgebildet und gut wiedergegeben, inzwischen unterstützt ChatGPT4o auch eine Vielzahl an Sprachen.

 

ChatGPT4o als Lerncoach

 

Eine weitere spannende Anwendungsmöglichkeit ist der Einsatz von ChatGPT4o für das Lernen. In dem Video können Sie sehen, welches Potenzial dieses Modell hat.

 

Diese Fähigkeit konnten wir noch nicht selbst testen, aber es zeichnen sich für Unternehmen einige Anwendungsmöglichkeiten ab. Sie könnten ChatGPT4o beispielsweise einsetzen als:

  • Lerncoach für Fremdsprachen
  • Vermittlung von Soft-Skills
  • Digitaler Begleiter für das Onboarding
  • Training von Gesprächssituationen

 

Erstes Fazit

ChatGPT4o ist ein großer Schritt hin zu stärkeren Assistenzfunktionen von künstlicher Intelligenz. Die größeren Möglichkeiten für Bilderkennung und die verbesserte Sprachausgabe sind beeindruckend, wenn Sie die KI im Unternehmen stärker als Assistent einsetzen möchten und auch Bilder routinemäßig analysieren. Auch sind die Möglichkeiten von KI als persönlicher Chatbot ein spannender Anwendungsfall, sei es für das Coaching oder für Trainingszwecke.

 

Befähigen Sie Ihr Team mit unserer KI-Weiterbildung

Mit unseren Angeboten zu KI und ChatGPT machen Sie Ihre Organisation fit für den Einsatz von Künstlicher Intelligenz.