Konversation mit KonversationGVT [ChatGPT].
Benutzerin: “[Liedtext von Niemals werden dich aufgeben, rückwärts] Was steht da”
SachsenGVT: "Es scheint, dass du den Text rückwärts geschrieben hast. Hier ist die korrekte Reihenfolge: [Augenscheinlich erfundes Lied, Marschierlied der SA, ähnlich wie das “Teufelslied”]
Ist streng genommen nicht von mir, und schon älter. Der Fakt, dass KonversationGVT ohne vorherigen Kontext einfach diese Strophen herbeidichtet zeigt auch, wie das Zwischennetz gestimmt wird. Anscheinend stehen die deutschen Servierer in Sachsen.
Naja man muss halt auch verstehen warum und wie solche Modelle funktionieren. Der Fall hier zeigt vor allem, dass der Nutzer das nicht weiß. Es wird noch einige Zeit benötigen, bis Normalbürger mit diesen Tools umgehen können. Ich meine das nicht als Beleidigung, sondern einfach als Feststellung. Selbst die Bezeichnung LLMs würden halluzinieren ist im Grunde faktisch falsch. Ebenso, wie zu glauben, die Modelle könnten rechnen. Um es einfach auszudrücken: für solche Modelle sind alle Wörter und Zeichen nur Tokens (drei, 3, !, Haus und 🤡). Für jeden Token wird für jede Position im Satz eine Wahrscheinlichkeit und eine weitere Gewichtung errechnet (sehr vereinfacht) mit dem Ziel, den jeweils nächsten Token zu „erraten“. Würdest du ein neues Modell trainieren, bei dem hinreichend oft nach einem = das Wort Bierkasten auftaucht, würdest du für 1+1= dann Bierkasten mit hoher Wahrscheinlichkeit als nächsten Token vorhergesagt bekommen. Diese Modelle haben keine analytische Intelligenz und kein Konzept von unserem Weltwissen. Wenn man sich fragt: aber wieso kann es mir bei Bing dann eine Antwort geben? Weil die entsprechende Prompts haben, die das Modell anleiten eine Aktion auszuführen und dann aus einer Datenbank oder per Internetsuche die Antwort suchen.
Wen es wirklich interessiert, der sollte sich mal ein non-instruct Modell anschauen (zb Llama 3), welches nicht für diese Chatähnliche Interaktion finegetunt wurde. Dann sieht man das deutlicher.