Endlich haben wir die Welt der gruseligen KI-Roboter betreten, und der neueste ist im Wesentlichen ein Empfangsroboter, der auf dem Large Language Model (LLM) von chatgpt läuft. Der Roboter wurde von Ingenieuren der Heriot-Watt University und Alana AI entwickelt. Es funktioniert mit GPT-3.5 von OpenAI und verfügt sogar über ein humanoides Gesicht mit beweglichem Mund und beweglichen Augenbrauen.
Der Roboter wurde entworfen ausschließlich zur Interaktion mit Benutzern im UK National Robotarium. Um die Möglichkeit auszuschließen, dass falsche Informationen bereitgestellt werden, haben die Ingenieure die Website des Robotariums gecrackt und die Informationen einer speziellen Datenbank hinzugefügt, auf die der Roboter bei der Beantwortung von Fragen zugreifen kann.
Das Ergebnis entspricht in etwa dem, was man von etwas mit GPT-3.5 erwarten würde, was für ein großes Sprachmodell immer noch sehr beeindruckend ist. In einem YouTube-Video, interagiert einer der Ingenieure mit der Empfangsdame des Roboters und stellt ihm Fragen. Er antwortet mit einer kurzen Verzögerung – ich kann nur davon ausgehen, dass der Roboter verarbeitet, was die Person gesagt hat.
Der Roboter ist zumindest bei der Beantwortung grundlegender Fragen sehr überzeugend, sieht aber unheimlich aus. Die Ingenieure sagen, dass dies das erste Mal ist, dass jemand ein LLM entwickelt hat, das sich mit einem einzelnen Thema auskennt und in der Lage ist, verbal und nonverbal zu kommunizieren. Es ist wirklich beeindruckend, auch wenn der Roboter so gruselig aussieht.
Wenn jemand mit dem Roboter spricht, wandelt er die Sprache in Text um und verarbeitet sie dann – was die oben erwähnte kurze Pause erklären würde. Anschließend wird abgeleitet, wie es reagieren soll, sowohl mit seiner Stimme als auch mit den entsprechenden Gesichtsausdrücken und Bewegungen, um eine lebensechtere Reaktion zu erzielen.
Die Antworten der Roboter-Rezeptionistin mögen im Tonfall gesprächig und dem Publikum angemessen sein, aber es handelt sich immer noch um eine sehr roboterhafte Übermittlung. Meistens fühlt es sich immer noch so an, als würde Ihnen die Text-to-Speech-Funktion Ihres Telefons Dinge vorlesen. Dennoch ist es schwer, sich nicht von dem beeindrucken zu lassen, was hier möglich ist, und ich bin mir sicher, dass dies nicht der letzte Versuch sein wird, GPT und andere LLMs zu Roboterrezeptionisten zu machen.