Mit einer so schnelllebigen Branche wie der KI Schritt zu halten, ist eine große Herausforderung. Bis eine KI dies für Sie tun kann, finden Sie hier eine praktische Zusammenfassung der Geschichten der letzten Woche in der Welt des maschinellen Lernens, zusammen mit bemerkenswerten Forschungsergebnissen und Experimenten, die wir allein nicht behandelt haben.
In einer der überraschenderen Geschichten der vergangenen Woche blockierte die italienische Datenschutzbehörde (DPA) den viralen KI-betriebenen Chatbot ChatGPT von OpenAI und führte Bedenken an, dass das Tool gegen die Datenschutz-Grundverordnung der Europäischen Union verstößt. Berichten zufolge leitet die DPA eine Untersuchung ein, ob OpenAI die Daten von Personen unrechtmäßig verarbeitet hat, sowie wegen des Fehlens eines Systems, um Minderjährige am Zugriff auf die Technologie zu hindern.
Es ist unklar, was das Ergebnis sein könnte; OpenAI hat 20 Tage Zeit, um auf die Bestellung zu reagieren. Der Schritt der Datenschutzbehörde könnte jedoch erhebliche Auswirkungen auf Unternehmen haben, die maschinelle Lernmodelle nicht nur in Italien, sondern überall in der Europäischen Union einsetzen.
Als Natascha stellt in ihrem Artikel über die Nachrichten fest, dass viele der OpenAI-Modelle mit Daten trainiert wurden, die aus dem Internet stammen, einschließlich sozialer Netzwerke wie Twitter und Reddit. Unter der Annahme, dass dies auch für ChatGPT gilt, da das Unternehmen die Personen, deren Daten es zum Training der KI umfunktioniert hat, offenbar nicht informiert hat, könnte es im gesamten Block mit der DSGVO in Konflikt geraten.
Die DSGVO ist nur eine der vielen potenziellen rechtlichen Hürden, denen KI, insbesondere generative KI (z. B. text- und kunstgenerierende KI wie ChatGPT), gegenübersteht. Mit jeder wachsenden Herausforderung wird klarer, dass es einige Zeit dauern wird, bis sich der Staub gelegt hat. Aber das schreckt VCs nicht ab, die weiterhin Kapital in die Technologie stecken, als gäbe es kein Morgen.
Werden sich diese als kluge Investitionen oder Verbindlichkeiten erweisen? Das ist derzeit schwer zu sagen. Seien Sie jedoch versichert, dass wir über alles, was passiert, berichten werden.
Hier sind die anderen bemerkenswerten KI-Schlagzeilen der letzten Tage:
- Anzeigen kommen zu Bing Chat: Microsoft gab letzte Woche bekannt, dass es das Einfügen von Anzeigen in die Antworten von Bing Chat, seinem Suchagenten, der auf dem GPT-4-Sprachmodell von OpenAI basiert, „erforscht“. Wie Devin feststellt, sind die gesponserten Antworten zwar eindeutig als solche gekennzeichnet, es handelt sich jedoch um eine neue und möglicherweise subversivere Form der Werbung, die möglicherweise nicht so leicht abgegrenzt oder ignoriert werden kann. Außerdem könnte es das Vertrauen in Sprachmodelle weiter untergraben, die bereits genug sachliche Fehler machen, um Zweifel an der Richtigkeit ihrer Antworten zu säen.
- Bitte um Pause: Ein am Dienstag veröffentlichter Brief mit mehr als 1.100 Unterzeichnern, darunter Elon Musk, forderte „alle KI-Labore auf, das Training von KI-Systemen, die leistungsfähiger als GPT-4 sind, unverzüglich für mindestens sechs Monate zu unterbrechen“. Doch die Umstände stellten sich als düsterer heraus, als man erwartet hätte. In den Folgetagen zogen einige Unterzeichner ihre Positionen zwar zurück Berichterstattung enthüllte, dass andere bemerkenswerte Unterzeichner, wie der chinesische Präsident Xi Jinping, sich als Fälschungen herausstellten.
- Und eine Antwort auf die Pausenanfrage: Prominente KI-Ethiker weisen darauf hin, dass es gefährlich und selbstzerstörerisch ist, sich Gedanken über ferne, hypothetische Probleme zu machen, wenn wir die Probleme, zu denen die KI heute beiträgt, nicht angehen.
- Twitter enthüllt seinen Algorithmus: Wie mehrfach versprochen von Twitter CEO Elon Musk, Twitter hat geöffnet einen Teil seines Quellcodes zur öffentlichen Einsicht, einschließlich des Algorithmus, den es verwendet, um Tweets in den Timelines der Benutzer zu empfehlen. Interessanterweise scheint Twitter Tweets teilweise mithilfe eines neuronalen Netzwerks zu ordnen, das kontinuierlich auf Tweet-Interaktionen trainiert wird, um positives Engagement wie Likes und Antworten zu optimieren. Aber es gibt viele Nuancen, wie die Forscher Graben in die Codebase-Notiz.
- Zusammenfassende Besprechungen mit KI: Auf den Fersen von Unternehmen wie Otter und Zoom, Meeting-Intelligence-Tool Lesen hat eine neue Funktion eingeführt, die ein einstündiges Meeting auf einen zweiminütigen Clip verkürzt, begleitet von wichtigen Hinweisen. Das Unternehmen sagt, dass es große Sprachmodelle verwendet – es hat nicht angegeben, welche – kombiniert mit einer Videoanalyse, um die bemerkenswertesten Teile des Meetings herauszusuchen, eine nützliche Funktion.
Mehr maschinelles Lernen
Beim KI-Enabler Nvidia, BioNeMo ist ein Beispiel für ihre neue Strategie, bei der der Fortschritt nicht so sehr darin besteht, dass er neu ist, sondern dass er für Unternehmen immer einfacher zugänglich ist. Die neue Version dieser Biotech-Plattform fügt eine glänzende Web-Benutzeroberfläche und eine verbesserte Feinabstimmung einer Reihe von Modellen hinzu.
„Ein wachsender Teil der Pipelines hat es mit Unmengen von Daten zu tun, Mengen, die wir noch nie zuvor gesehen haben, Hunderte Millionen von Sequenzen, die wir in diese Modelle einspeisen müssen“, sagte Peter Grandsard von Amgen, der eine Forschungsabteilung mit KI-Technologie leitet. „Wir versuchen, sowohl in der Forschung als auch in der Fertigung operative Effizienz zu erreichen. Mit der Beschleunigung, die Technologien wie die von Nvidia bieten, was Sie letztes Jahr für ein Projekt hätten tun können, können Sie jetzt fünf oder zehn mit der gleichen Investition in Technologie durchführen.“
Dieser Buchauszug von Meredith Broussard drüben bei Wired ist lesenswert. Sie war neugierig auf ein KI-Modell, das bei ihrer Krebsdiagnose verwendet wurde (es geht ihr gut), und fand es unglaublich umständlich und frustrierend, zu versuchen, diese Daten und Prozesse in Besitz zu nehmen und zu verstehen. Medizinische KI-Prozesse müssen den Patienten eindeutig stärker berücksichtigen.
Eigentlich schändliche KI-Anwendungen bergen neue Risiken, etwa den Versuch, den Diskurs zu beeinflussen. Wir haben gesehen, wozu GPT-4 in der Lage ist, aber es war eine offene Frage, ob ein solches Modell in einem politischen Kontext effektiv überzeugende Texte erstellen könnte. Diese Stanford-Studie legt dies nahe: Als Menschen Essays ausgesetzt waren, in denen ein Fall zu Themen wie Waffenkontrolle und Kohlenstoffsteuern argumentiert wurde, „waren KI-generierte Botschaften in allen Themenbereichen mindestens so überzeugend wie von Menschen generierte Botschaften.“ Diese Botschaften wurden auch als logischer und sachlicher wahrgenommen. Wird KI-generierter Text irgendjemandes Meinung ändern? Schwer zu sagen, aber es scheint sehr wahrscheinlich, dass die Leute es zunehmend für diese Art von Agenda einsetzen werden.
Maschinelles Lernen wurde von einer anderen Gruppe in Stanford zur Verbesserung eingesetzt Simulieren Sie das Gehirn – wie das Gewebe des Organs selbst. Das Gehirn ist nicht nur komplex und heterogen, sondern „ähnlich wie Jell-O, was sowohl das Testen als auch das Modellieren physikalischer Effekte auf das Gehirn sehr herausfordernd macht“, erklärte Professorin Ellen Kuhl in einer Pressemitteilung. Ihr neues Modell wählt aus Tausenden von Gehirnmodellierungsmethoden aus und wählt sie aus, mischt und passt sie an, um den besten Weg zur Interpretation oder Projektion der gegebenen Daten zu finden. Es erfindet die Modellierung von Hirnschäden nicht neu, sollte aber jede Untersuchung schneller und effektiver machen.
Draußen in der Natur, ein neuer Fraunhofer-Ansatz zur seismischen Bildgebung wendet ML auf eine vorhandene Datenpipeline an, die Terabytes an Ausgabe von Hydrophonen und Luftgewehren verarbeitet. Normalerweise müssten diese Daten vereinfacht oder abstrahiert werden, wodurch ein Teil ihrer Genauigkeit verloren würde, aber der neue ML-gestützte Prozess ermöglicht die Analyse des ungekürzten Datensatzes.
Interessanterweise stellen die Forscher fest, dass dies normalerweise ein Segen für Öl- und Gasunternehmen wäre, die nach Lagerstätten suchen, aber mit der Abkehr von fossilen Brennstoffen kann es klimafreundlicheren Zwecken wie der Identifizierung von potenziellem CO zugeführt werden2 Sequestrationsstellen oder potenziell schädliche Gasansammlungen.
Das Monitoring von Wäldern ist eine weitere wichtige Aufgabe der Klima- und Naturschutzforschung, und die Messung der Baumgröße gehört dazu. Aber diese Aufgabe beinhaltet die manuelle Überprüfung der Bäume einzeln. Ein Team in Cambridge hat ein ML-Modell erstellt das einen Smartphone-Lidar-Sensor verwendet, um den Stammdurchmesser zu schätzen, nachdem es mit einer Reihe manueller Messungen trainiert wurde. Richten Sie das Telefon einfach auf die Bäume um Sie herum und boomen Sie. Das System ist mehr als viermal schneller und übertrifft dennoch ihre Erwartungen, sagte die Hauptautorin der Studie, Amelia Holcomb: „Ich war überrascht, dass die App so gut funktioniert. Manchmal fordere ich es gerne mit einem besonders überfüllten Waldstück oder einem besonders seltsam geformten Baum heraus, und ich denke, es wird unmöglich, es richtig zu machen, aber es tut es.“
Da es schnell ist und keine spezielle Schulung erfordert, hofft das Team, dass es weit verbreitet werden kann, um Daten für Baumuntersuchungen zu sammeln oder bestehende Bemühungen schneller und einfacher zu machen. Vorerst nur Android.
Endlich genießen diese interessante Untersuchung und Experiment von Eigil zu Tage-Ravn zu sehen, was ein generatives Kunstmodell aus dem berühmten Gemälde im Spouter-Inn macht, das in Kapitel 3 von Moby-Dick beschrieben wird.