Die Technologiewelt ist in ständiger Bewegung, und Google ist kein Unbekannter für Innovationen. Lassen Sie uns einen genauen Blick auf eine ihrer neuesten Entwicklungen werfen: das PaLM 2, Google’s neue groß angelegte Sprachmodell, das in Gmail, Docs und anderen populären Google-Diensten zum Einsatz kommt.
Das PaLM 2, dessen Name für Pathways Language Model steht, signalisiert den Einsatz von Googles Pathways AI-Architektur. Diese unterstützt das Training von maschinellen Lernmodellen für eine Vielzahl von Aufgaben und ist ein wesentlicher Bestandteil von Googles Vision, allgemeine künstliche Intelligenz (AGI) zu erreichen. Das Ziel ist eine multimodale KI, die über den Text hinausgeht und sowohl visuelle, auditive als auch sprachliche Verständnisse gleichzeitig integriert.
Bei genauerer Betrachtung der technischen Aspekte von PaLM 2 wird klar, dass Google eine neue Technik namens „compute-optimal scaling“ verwendet hat. Diese ermöglicht bessere Ergebnisse mit weniger Parametern und einem kleineren Trainingsdatensatz im Vergleich zu früheren Modellen wie dem LaMDA, das 137 Milliarden Parameter und eine Trainingsgröße von 1,56 Billionen Wörtern aufwies.
Die Verbesserungen von PaLM 2 haben Googles Bard-Chatbot einen erheblichen Leistungsschub gegeben. PaLM 2 wurde auf einer Mischung von Sprachen trainiert und seine Trainingsdaten enthielten viele nicht-englische Textproben. Es zeigt auch bessere logische Schlussfolgerungsfähigkeiten als seine Vorgänger und kann sogar in Tests mit GPT-4 mithalten. Darüber hinaus kann der Bard-Chatbot nun Code generieren und debuggen, was mit den vorherigen Sprachmodellen von Google nicht möglich war.
Wie schneidet das PaLM 2 im Vergleich zu OpenAI’s GPT LLMs ab? Laut Googles technischem Bericht erzielt es bessere Ergebnisse bei Tests zum gesunden Menschenverstand. Aber synthetische Benchmarks übersetzen sich nicht unbedingt in die reale Welt. Bei einer informellen „Rätselherausforderung“ mit Google Bard und Bing Chat, die auf OpenAI’s GPT-4 basiert, konnten beide Modelle das Rätsel korrekt lösen. Allerdings hat Google’s Bard bei einem anderen Rätsel versagt, während Bing Chat eine ausführliche Begründung und die korrekte Lösung lieferte.
Auf der Google’s I/O Entwicklerkonferenz erhielten wir einen Einblick in die Zukunftspläne des Unternehmens für das PaLM 2 und seine allgemeine KI-Entwicklung. Das neue Sprachmodell wird alles von einer neuen „Hilf mir zu schreiben“-Funktion in Google Docs und Gmail bis hin zur KI-Bildgenerierung in Slides antreiben. Darüber hinaus können Softwareentwickler nun programmatisch auf das PaLM 2 zugreifen, was bedeutet, dass wir möglicherweise andere Unternehmen sehen werden, die sich auf Googles großes Sprachmodell verlassen, ähnlich wie Duolingo und Khan Academy GPT-4 für ihre KI-gesteuerten Funktionen angenommen haben.
Ein weiteres bemerkenswertes Feature ist eine spezielle Version von PaLM 2, die für Smartphones entwickelt wurde. Mit dem Codenamen „Gecko“ könnte dieses kompakte Sprachmodell eines Tages die Nutzung generativer KI komplett offline auf einem typischen Android-Smartphone ermöglichen.
Zum Abschluss noch einige häufig gestellte Fragen: Was ist Google PaLM 2 genau? Es handelt sich um das große Sprachmodell, das Bard, den KI-Chatbot von Google, und andere Funktionen wie „Help me Write“ in Gmail antreibt. Ist Med-PaLM 2 verfügbar? Google hat Med-PaLM 2 noch nicht veröffentlicht. Zunächst wird das Unternehmen einer kleinen Gruppe von vertrauenswürdigen Testern Zugang gewähren, und es ist unklar, ob es jemals öffentlich verfügbar sein wird.
Insgesamt stellt das PaLM 2 eine aufregende Innovation im Bereich der Künstlichen Intelligenz dar, die nicht nur Google-Dienste verbessert, sondern auch neue Möglichkeiten für die gesamte Tech-Industrie eröffnet. Es ist ein weiterer Schritt in Richtung der Vision von Google, allgemeine künstliche Intelligenz zu erreichen.