Mittwoch, 28. Mai 2025

Wie funktionieren ChatGPT und andere Large Language Models?

Auch wenn die LLMs selbst für ihre Entwickler eine Black Box sind, kann es hilfreich sein, wenn man wenigstens eine Grobvorstellung von dem hat, was darin ist. In ChatGPT und den anderen LLM (Large Language Models)?

Dankenswerterweise hat Herr Rau eine ausführliche Erklärung verfasst. Er erklärt es Schritt für Schritt. Dann folgen mehr oder minder genaue (und mehr oder minder verständliche) Einzelerläuterungen

Ich beginne mit Herrn Raus Zusammenfassung:

  1. Ein LLM wird mit dem Äquivalent von 100 Millionen Büchern an Text trainiert. Das Training geschieht erst automatisch, dann durch menschliches Feedback.
  2. Ein LLM besteht aus 120 Decoder-Schichten.
  3. Am Anfang wird ein Eingangstext in Token zerlegt, und zwar maximal 8.000 bis 128.000 Token.
  4. Jedes Token wird in einen 10.000-dimensionalen Raum eingebettet, erhält also ein Embedding bestehend aus 10.000 Zahlen. [zu Herrn Raus Erklärung von Embedding]
  5. In jeder Decoder-Schicht wird jeder Eingangsvektor in beliebiger Reihenfolge verarbeitet.
  6. Bei der Verarbeitung werden die 7.999 Nachbartoken ebenfalls berücksichtigt. Wie sehr und wie, das entscheiden der Q- und der V-Vektor des aktuellen Tokens und die 7.999 K-Vektoren der Nachbartoken zusammen. Die werden anhand trainierter Tabellen ausgerechnet. Das ist das eigentliche Kern der Sache.
  7. Bei dieser Verarbeitung steht ein Neuronales Netz an letzter Stelle.
  8. Nach der Verarbeitung entsteht wieder für jedes der 8.000 Token ein neuer Vektor der gleichen Größe.
  9. Die Schritte 5 bis 8 wiederholen sich je Decoder-Schicht.
  10. Das letzte Embedding des letzten Token wird in ein Neuronales Netz eingegeben, das 100.000 Ausgangsneuronen hat: für jedes Token im Wortschatz eines. Deren Werte heißen Logits.
  11. Die Logits werden mit Softmax (normalisierte Exponentialfunktion) normalisiert, so dass man 100.000 Werte zwischen 0 und 1 hat, die für jedes Token im Wortschatz eine Wahrscheinlichkeit angeben.
  12. Ein Algorithmus wählt aus diesen Werten ein Token aus, das das nächste generierte Token bildet.
  13. Der Prozess beginnt von vorn.

Die Zahlen sind gerundet und geschätzt und gehen je nach Modell auch mal um den Faktoren zehn oder mehr nach unten, sind aktuell aber an der Obergrenze.

Jetzt zu den Einzelerläuterungen:

LLM Grundlagen, Teil 1: Über N-Gramme

Ein Computerprogramm hat eine Textmenge zur Verfügung und sucht die jeweils wahrscheinlichsten Textverknüpfungen heraus: mit 1, 2, 3 und n-Wörtern. (N-Gramme)

Hier erklärt Herr Rau.

Statt Wörtern verwenden die Large Language Models Tokens, das sind charakteristische Schriftbestandteile (meist Silben in Verbindung mit Zeichen davor oder danach), die mehr Informationen enthalten als Buchstaben, aber nicht so zahlreich sind wie Wörter.

Herr Rau erklärt genauer.

Diesmal folgt der vollständige Text von Herrn Rau:

TFA lässt sich nicht abbauen

 TFA (Trifluoressigsäure) reichert sich unbegrenzt an und schädigt langfristig Kinder in der Schwangerschaftsphase. Trotzdem wird es noch in Autoklimaanlagen eingesetzt, und das, obwohl es inzwischen Nachweisbar in Pflanzen und in 49 getesteten Weinen in Europa nachgewiesen wurde.

Mittwoch, 21. Mai 2025

Veränderte Googlestrategie

 Ich werde mich bemühen, noch seltener mit Google zu "suchen/googlen". Gegenwärtig suche ich meist mit https://www.ecosia.org/search? und wechsle nur dann zu Google, wenn die Ecosiasuche erfolglos war. Oft findet dann auch Google nichts Passendes.

"Googles Paradigmenwechsel
Mit der Einführung des AI Mode in der Google-Suche markiert der Konzern eine strategische Zäsur: Statt zehn blauer Links tritt nun ein KI-generierter Antwortblock in den Vordergrund. Nutzer erhalten direkt in der Suchmaske vollständige Antworten auf komplexe Fragen, oft ohne Klick auf eine externe Website.
Für Google bedeutet das eine tiefgreifende Reorganisation seines Geschäftsmodells. Für die Anbieter der Inhalte bringt der Strategiewechsel eine massive strategische Herausforderung.
Autorenbild
Holger Schmidt
Verantwortlicher Redakteur für Newsletter und Verticals.
Plus SignFolgen
Inhalteanbieter verlieren Sichtbarkeit und Kontrolle. Ihre Inhalte bleiben zwar die Grundlage für KI-generierte Antworten, doch der Google-Traffic fällt weg. Die klassische Logik des offenen Webs – Inhalte gegen Reichweite und Werbeeinnahmen – wird durch eine Logik der Plattformintermediation ersetzt. Wer nicht als Quelle sichtbar bleibt, verliert Relevanz und Monetarisierungspotenzial. Zugleich wachsen die Abhängigkeiten: Um überhaupt noch Reichweite zu erzielen, müssen sich Verlage stärker als je zuvor in Googles Ökosystem integrieren, zum Beispiel mit strukturierten Daten oder der Teilnahme an Partnerprogrammen.

Die Branche der Suchmaschinenoptimierer steht vor einem Paradigmenwechsel. Klassisches Optimieren auf Schlagworte verliert an Wirksamkeit, wenn Google die Suchintention eigenständig antizipiert und Nutzer gar nicht mehr zu Webseiten weiterleitet. Künftig wird es wichtiger sein, Inhalte so zu strukturieren, dass sie in den KI-Antworten als relevante Quellen auftauchen, auch wenn dies kaum nachvollziehbar oder beeinflussbar ist.

Strategisch verändert sich der Suchmarkt grundlegend. Google versucht, sich selbst zu kannibalisieren, bevor es andere wie OpenAI, Perplexity oder You.com tun Der AI Mode ist Googles Versuch, den Paradigmenwechsel von Navigation zu Information, von Linkverzeichnis zu Antwortmaschine, selbst zu steuern. Der Konzern verteidigt damit seinen Zugang zu Nutzerdaten und zur Werbevermarktung – auch wenn er kurzfristig eigene Suchanzeigen kannibalisiert. Langfristig könnte sich ein neues Plattformregime herausbilden, bei dem Inhalte nur noch dann Sichtbarkeit bekommen, wenn sie in AI-Antworten eingespeist werden – kontrolliert, gewichtet und bewertet von einer Handvoll dominanter KI-Plattformen."
 Frankfurter Allgemeine Pro DIGITALWIRTSCHAFT 21.5.25

Herd, Kochstelle

 Wikipedia: [...] siehe auch: Küche#Geschichtliche Entwicklung





Ursprünglich befanden sich offene Herdstellen im Freien oder in Gebäuden oder Zelten, als flache Gruben, zwischen Steinen oder auf einer Lehm- oder Steinplatte. In der Ausgrabungsstätte um die Klissoura-Höhle 1 in der Ebene von Argos im nordwestlichen Peloponnes haben Archäologen 23.000 bis 34.000 Jahre alte Tonherde der Aurignac-Kultur gefunden.[3] Die Entdeckung hilft, den Übergang von den ältesten bekannten Herden aus Stein zu den Tonkonstruktionen, wie jenen von Dolní Věstonice in Tschechien, zu erklären. Viel später kamen aufgemauerte Sockel hinzu, die im Mittelalter etwa Tischhöhe erreichten. Gebraten wurde auf Rosten oder an Spießen, gekocht mit Kesseln, die an Kesselhaken über dem offenen Feuer hingen oder auf Dreibeinen standen. Mit der Einführung des Rauchfangs rückte die Herdstelle an die Wand. Eine wesentliche Weiterentwicklung des ausgehenden Mittelalters stellte der gemauerte Potager dar.

Im Jahr 1735 entwickelte François de Cuvilliés der Ältere für die Amalienburg im Schlosspark Nymphenburg mit dem Castrol-Herd (oder Topfherd, von frz. Casserole, Kochtopf) den ersten voll ummauerten Kochherd mit durchlöcherter Eisenplatte, auf der die Töpfe standen, und einem Rauchfang. Das tägliche Löschen des Herd- und Ofenfeuers wurde im 18. Jahrhundert in vielen deutschen Kurfürsten- und Fürstentümern zu bestimmten Abendstunde vorgeschrieben.[4]

Seit dem Ende des 18. Jahrhunderts gibt es echte Kochherde mit vollständig geschlossenem Feuerraum und eisernen oder kupfernen Herdplatten mit Öffnungen über dem Feuer, in die Töpfe und Kessel eingesetzt wurden. Durch den Einbau von Rosten für die Feuerung und Klappen zum Verschließen der Feuerkammer entwickelten sie sich zu Sparherden, die das Brennmaterial, in der Regel Steinkohle, wesentlich besser ausnutzten. Für verschiedene Topfgrößen konnten die Löcher der Herdplatte mit verschiedenen Ofenringen angepasst werden. Sparherde verfügten meist auch über einen Backofen, einen Tank für Warmwasser – Wasserschiff genannt – und einen Wärmeschrank. Die Entwicklung des Sparherds geht maßgeblich auf den Physiker Benjamin Thompson zurück, der mehrere Modelle in München entwickelte und nach seinen Anleitungen bauen ließ. Bekannt wurde der Rumford-Herd, ein energiesparender Küchenherd, der nur halb so viel Brennstoff verbrauchte wie die noch weithin üblichen offenen Herde. Diese Herde wurden zunächst vorwiegend in Volksküchen eingesetzt. Ab dem Jahr 1817 wurden die Sparherde auch als Kochmaschine weiterentwickelt und beschrieben.[5]





Waren die früheren Herde noch gemauert, so kamen Mitte des 19. Jahrhunderts die ersten Herde aus Metall auf den Markt. Eine Entwicklungsstufe dieser Zeit war die sogenannte Kochmaschine, auch als Stangenherd oder im Volksmund als Küchenhexe bekannt. Dies war eine Herdversion mit verschiedenen innenliegenden Feuerrosten, durch Wärmezüge zu den Kochstellen geleitete Hitze, Heißwasserbereitern, verschiedenen Backröhren und Backöfen und durch Herdringe in der Größe verstellbare Feuerstellen. Mit Anfangs hohen Beschaffungskosten waren zuerst wohlhabende Leute in der Lage, sich derartige Herde zu leisten; in Deutschland setzten diese sich ab 1860 mit sparsamen und ausgereiften Modellen durch. Zu dieser Zeit wurden auch die ersten Puppenherde gebaut; diese verkleinerten Nachbildungen eiserner Feuerherde waren in wohlhabenden Familien ein beliebtes Spielzeug. Einfachere Versionen gehörten bald zur Normalausstattung in Mietskasernen (z. B. in Berlin) des späten 19. Jahrhunderts.

Schon zu Anfang des 19. Jahrhunderts gab es erste Versuche mit gasbefeuerten Herden, allerdings war eine sinnvolle Verwendung an die Verbreitung eines ausreichenden Gasnetzes in den Städten gekoppelt. Auf der Industrieausstellung in London wurde 1851 der erste transportable eiserne Herd gezeigt, der seit den 1860er Jahren in Deutschland serienmäßig hergestellt wurde. Die Herdplatte hatte mehrere herausnehmbare Ringe, die Töpfe wurden in die Öffnung eingehängt. Im ländlichen Raum blieben diese Herde bis weit ins 20. Jahrhundert hinein in Gebrauch. Auf der Weltausstellung 1893 in Chicago wurde der erste Elektroherd vorgestellt, allerdings dauerte es bis 1930, bis dieser sich allgemein verbreiten konnte, was auch seinen Grund in der für derartige Herde notwendigen Infrastruktur hatte.





In der zweiten Hälfte des 19. Jahrhunderts kamen verschiedene Kombinationen aus Heizofen und Kochherd auf den Markt, teilweise mit seitlich eingebauten Backröhren, mit Aufsätzen zum Backen und Braten, mit einem Wärmekasten für das Essgeschirr.





Moderne Herde werden fast ausschließlich mit Gas oder elektrisch betrieben. Gasherde wurden Mitte des 19. Jahrhunderts eingeführt und setzten sich um das Jahr 1900 in den Städten allgemein durch. Auch Kombinationsherde, die ein Kochen auf Feuer oder mit Gas bzw. Strom erlaubten, waren bis in die 1960er Jahre verbreitet. Da der mit Holz oder Kohle befeuerte Herd im Winter auch zur Beheizung der Küche diente, kochte man in der kalten Jahreszeit auf Feuer, im Sommer wurde elektrisch oder mit Gas gekocht, da eine Erwärmung der Küche dann nicht nötig und sogar unangenehm war. Durch die zunehmende Verbreitung von Zentralheizungen verschwanden solche Geräte vom Markt.

Neuere Entwicklungen neben Gasherd und Elektroherd sind der Mikrowellenherd und der Induktionsherd. Neben Standgeräten, die Kochfeld oben und Backofen unten verbinden, gibt es heute vielfach getrennte Geräte zum Einbau in Arbeitsplatten und Küchenschränke, die eine größere Flexibilität bei der Kücheneinrichtung und eine bessere Ergonomie ermöglichen.