Sonntag, 1. Januar 2023

 

ChatGPT. Unsere neuen allmächtigen Herrscher, oder erstmal eine neue Benutzerhilfe?

(first draft, I am adding more thoughts)

TL;DR KI ist kein allmächtiges Werkzeug, sondern eine Zugangshilfe zu komplexen, computerisierbaren Themen, so wie eine grafische Oberfläche am PC den Zugang zu den Möglichkeiten des Computers vereinfacht. KI steht aber gerade am Anfang seiner eigenen Entwicklung und seines gesammelten Wissens.

Ich war sehr beeindruckt von den ganzen Bildern, die vor einigen Monaten mit DALL-E oder anderen KI-Programmen erzeugt wurden und auf Twitter und anderen sozialen Medien zu finden waren. Qualitativ oft ansprechend, und die, die ich sah, waren überwiegend auch inhaltlich ansprechend (wahrscheinlich weil die misslungenen Versuche aussortiert worden waren, klar). Seit kurzem läuft mit ChatGPT die zweite Welle einfach anwendbarer KI, und ich bin ebenfalls beeindruckt von den Texten und vor allem den Programmierbeispielen, die einige Anwender gezeigt haben, auch (oder vielleicht weil) wenn ich kein Programmierer bin und die Qualität nicht einschätzen kann. Vor einiger Zeit, noch vor DALL-E, als andere Beispiele das Potential von KI zeigten, dachte ich, dass es doch möglich sein müsste, eine Bedienungshilfe für komplexe Programme damit zu bekommen. Ich habe vor ein paar Jahren versucht, das 3D-Zeichenprogramm Sketchup zu erlernen, und obwohl es allerlei Bedienhilfen gibt und viele Tutorials, kam ich auf keinen grünen Zweig, von komplexeren CAD-Programmen ganz zu schweigen. Das ist wohl eher meiner mangelnden Geduld und Konzentrationsschwäche anzulasten als dem dem Programm, aber es klappte halt nicht. Deswegen fand ich die Aussicht vielversprechend, einem Programm sagen zu können, was ich will, und es dem Programm zu überlassen, auf welche Weise es einen Strich zeichnen soll. Genauso fände ich es auch reizvoll, einem Programm zu sagen, wie es einen Text formatieren soll, anstatt mich in den Tiefen von Word zurechtzufinden. Da bekam ich von Youtube ein Video mit dem Titel "Can ChatGPT Program Your CNC Machines?"  vorgeschlagen. 




Noch bevor ich die Zeit hatte, es anzuschauen, repostete Bradford DeLong, ein Wirtschaftshistoriker, den ich schätze  https://twitter.com/delong , einen Post auf Mastodon, der sehr kritisch und eher abschätzig gegenüber den jüngsten Ergebnissen von ChatGPT war


https://toad.social/@davetroy/109610129279609016


Während ich darüber nachdachte und das Video über die Bedienung einer CNC-Fräse per ChatGPT anschaute, kam mir der Gedanke, dass wir unsere Erwartungen an KI vielleicht erstmal einfach herunterschrauben sollten und es eher als eine Bedienhilfe ansehen sollten, so wie ein modernes Auto wesentlich einfacher zu bedienen ist als das Ford Model T (von ausgefuchsteren Modellen dieser Zeit ganz zu schweigen), weil es eine Oberfläche für die ganzen Möglichkeiten und Parameter des Autos bietet, oder die grafische Oberfläche eines Betriebssystems oder von Word. Und selbst das, was vor Windows war, das waren schon mehrfache Vereinfachungen des Zugangs zum Computer. Ich denke zuerst an den Lochstreifen, mit dem nur ausgebildete Experten etwas anfangen konnten, dann kamen Monitore, später Betriebssysteme wie UNIX oder MS-DOS, die zwar erforderten, das man wusste, was man dem Computer sagen wollte, aber die "Sprache" war einfacher als das vorher. Mit der von Xerox zuerst ausgedachten grafischen Oberfläche, die dann von Apple und vollends von Microsoft popularisiert wurde, war der Massenzugang zu PCs möglich, und mit Smartphones ist die Bedienung noch einfacher und vor allem so sicher geworden, das man sich anstrengen muss, um das Betriebssystem zu "beschädigen". 


Diese Vereinfachung des Zugangs hat bei Maschinen auch schon mehrfach stattgefunden. Man stelle sich eine Dampfmaschine vor, die in einer Werkstatt für einen bestimmten Zweck gebaut und nur für einen eingewiesenen Bediener gedacht wurde. Die erste Variante hatte wahrscheinlich noch nicht einmal Schilder für die verschiedenen Stellräder und Hebel oder zu schmierenden Stellen, weil davon ausgegangen werden konnte, dass die betreffende Person schon wusste, was sie zu tun hatte. Als erste Vereinfachung (vielleicht für eine Urlaubsvertretung) wäre ein Handbuch oder eine Beschilderung der einzelnen Hebel usw. vorstellbar. Im weiteren Verlauf wird dann der empfohlene Einstellbereich mitgeliefert, später werden verschiedene Parameter (Brennstoffzufuhr, Sauerstoffzufuhr, Wasserdurchlauf, ...) gleichzeitig verstellt, der Zugang wird immer einfacher, wie bei einem Auto, wo ich nicht mehr wissen muss, ob ein Diesel oder ein Otto-Motor unter der Haube ist. Vorglühen gibt es nicht mehr, beim Tanken steht die richtige Spritsorte im Tankdeckel. Mal zur Visualisierung: Hier ist ein Bild einiger Bedienelemente eines deutschen U-Bootes von 1918. Kann sich irgendjemand auch nur im entferntesten vorstellen, wofür eines der Stellräder da ist, was es bewirkt?



Source: https://www.flickr.com/photos/twm_news/8770724256/

Ein anderes Beispiel, das aber nicht so viele Leser kennen werden, ist die Arduino-Elektronik-Baureihe, die die Erstellung von Elektronik für bestimmte Aufgaben vereinfacht hat.

Um zum Punkt zu kommen: Die Beispiele von Programmierung per ChatGPT ermöglichen genau das, was ein GUI, das Armaturenbrett eines Autos oder eine Arduino-Plattform ermöglichen: Sie vereinfachen den Zugang zu einem komplexen Systems, bei dem man nicht mehr alle Möglichkeiten und Parameter der Bedienung kennen muss, sondern sie bringen einen näher an das gewünschte Ergebnis. Sei es ein Text, ein Bild oder eine Webseite. Was einige Kritiker nicht bedenken: Verschiedene KI-Programme sind in der Lage, ihre Ergebnisse erneut zu verarbeiten und zu verfeinern und sogar selbst Fehler zu entdecken, zB beim Programmieren. Außerdem sind sie noch in Entwicklung UND in der Lernphase. In dem erwähnten Video zur Bedienung einer CNC-Fräse scheint ChatGPT noch nicht sonderlich mit der Programmiersprache vertraut zu sein. Das wird sich aber schnell ändern, wenn die KI oder deren Entwickler merken, dass es Nachfrage dazu gibt.

KI sollte momentan also erst einmal als eine Zugangsvereinfachung betrachtet werden, nicht als eine Instanz, die bestimmte Dinge komplett für uns übernimmt. Teilweise ist sie schon in der Lage, Teilaufgaben zu übernehmen, so wie ein Spurhalteassistent auf der Autobahn. Bis zum autonomen Fahren ist es noch ein weiter Weg, aber wenn man die Umgebung vereinfacht innerhalb derer die KI Entscheidungen übernimmt und Hilfestellung (Wegmarken, maschinenlesbare Fahrbahnbegrenzungen, eingewiesene Mitarbeiter im Gegensatz zu Fußgängern im Straßenverkehr)  zur Erhöhung der Eindeutigkeit gibt, zB auf Firmengeländen zum Anliefern von Bauteilen, dann sind jetzt schon erstaunliche Dinge möglich. Mit dieser realistischeren Einstellung lässt sich auch Panik vermeiden, denn Kopfarbeiter, die die zur Erfüllung einer Aufgabe kennen, werden auf absehbare Zeit noch bessere Ergebnisse liefern, weil sie die Komplexität ihrer Hilfsmittel UND der gestellten Aufgabe und damit nicht arbeitslos werden. 

ChatGPT. Welcome to our new computer overlords, or at first a new layer to access complicated things?

(first draft, I am adding more thoughts)


I am very impressed by the pictures that were created by DALL-E and other KI software that show up on social media since some months. I am even more impressed by the the programming work (I am no programmer) that some people have done with its help. Talking to a machine (by keyboard or even by voice) to make it do something complicated that I could think about but what I couldn't achieve on my own is very tempting. I tried to learn Sketchup which is quite an easy to learn 3D drawing program (in contrast to professional CAD software) but could not concentrate enough and find my way through the many different ways you can achive the same thing. I thought some time ago before KI was easy available about using it to access a CAD program or even the more complex functions of Microsoft Word. And so I was very surprised when I found a Youtube video titled "Can ChatGPT Program Your CNC Machines?

Before I had the time to watch it I saw a post on Mastodon, reposted by mastodon.social/@delong, someone I regard as smarter than me.

https://toad.social/@davetroy/109610129279609016

By thinking about it and by watching the mentioned video I came up with the idea that chatGPT is maybe not the new mastermind that is smarter than most of us and pushes brainworkers out of their  jobs but a new layer that can be put upon many (computer related) tasks  in the same way that a GUI is put on. The graphical user interface was not the first to make it easier to access computers. There was ticker tape, then you could access the computer visually on a monitor, then there was something like Unix or DOS with command prompts, and only then came the graphical user interface invented by Xerox and Apple and then becoming a standard with MS Windows.

The same happened earlier with machines. Imagine an old steam engine, build in a workshop for a special task, pnly to be accessed by someone who knew what he was doing. The first layer of making it easier to access it would simply be to write signs for every changeable input or output device or any servicable part. 

Here is a picture from a submarine vessel from 1918. Would you know how to access it? 



Source: https://www.flickr.com/photos/twm_news/8770724256/

An old Ford Model T has fewer levers and wheels to change but cars got easier to access, too. Sometimes on the surface, sometimes it got built in, like automatic gear change.


Using AI as some sort of GUI

When I try to use a CAD software I am overwhelmed with all the possibilities it offers. With a KI administering it I only need to know what I want as a result. In a car I just have to push the gas pedal to become faster, I do not need to know to change the amount of fuel pushed in the combustion chamber, adjust the amount of air for best burning process. With a KI driven car of the future I just need to know where I want to go to. 

KI is a tool in development, obviously, and it gets smarter through improved software and by new material that is fed into it, so in the future it will become better with first results, it will know more programming software and have "learned" more, and