Wir setzen Cookies ein, um Interaktionen mit unseren Webseiten und Diensten einfacher zu machen und zu verbessern, um besser zu verstehen wie unsere Webseiten und Dienste genutzt werden und um Werbemaßnahmen zu personalisieren. Hier erfahren Sie mehr zum Einsatz von Cookies und Ihren Wahlmöglichkeiten. Durch die Weiternutzung dieser Webseite stimmen Sie dem Einsatz von Cookies zu.

 

 

Herr Socher, nachdem Sie sowohl Menschen als auch Maschinen neue Dinge beibringen – was sind die größten Unterschiede dabei, wie Menschen und Maschinen lernen?

Die Unterschiede sind sehr groß – es ginge vermutlich schneller, wenn ich über die Gemeinsamkeiten reden würde. Allgemein kann man sagen: Menschen können von wenigen Beispielen lernen, Maschinen brauchen Millionen oder Milliarden von Wiederholungen. Wenn wir gesprochene Sätze in Text umwandeln wollen, benötigen wir tausende Stunden Material. Jedes Wort muss ein paar hundert Mal vorkommen. Auch bei Bildern müssen wir tausend Beispiele eines Objekts zeigen, bevor es ein Algorithmus erkennen kann. Im Gegensatz dazu können Menschen Wörter aus dem Kontext verstehen.

Das heißt?

Ich kann etwa sagen: „Das Mädchen hat gerade die uffjah aufgehoben.“ Auch wenn wir das Wort noch nie gehört haben: Uns ist aus unserem Allgemeinwissen und gesundem Menschenverstand heraus klar, dass ein uffjah kein theoretisches Objekt ist, sondern konkret in der realen Welt greifbar. Es ist nicht zu schwer, nicht zu groß, sonst könnte ein Kind es nicht heben.

Eines der großen Versprechen von Machine Learning ist, dass die Software mich versteht. Denn dann kann ich beispielsweise schneller und einfacher lernen, wie ich einen Service oder ein Produkt nutze. Was ist die größte Schwierigkeit für Maschinen dabei, Menschen zu verstehen?

Die größte Herausforderung stellt wieder das Allgemeinwissen dar. Für einen Menschen ist vieles selbstverständlich. Wenn ich etwa einen Termin ausmachen will für einen der nächsten Dienstage, dann ist uns klar, dass wir von einem der nächsten drei reden, nicht einem der nächsten tausend. Oder dass der Kalender zwar um 23 Uhr noch eine Lücke hat, aber man da kein Meeting ansetzt – außer, man ist in sehr unterschiedlichen Zeitzonen. Diese implizit klaren Punkte sind einer Software schwierig beizubringen. Da geht es um Regeln, für die es aber gleichzeitig viele Ausnahmen gibt. Das ist für Algorithmen schwierig.

Wie sehen hier Lösungsansätze aus? Muss das über Regeln hart codiert werden oder lässt sich das anlernen?

Gute Frage. In der Forschung streben wir danach, end-to-end trainierbare Modelle zu entwickeln, die nur aus Rohdaten Vorhersagen entwickeln. Wenn man die Algorithmen für Unternehmen anwenden will, funktioniert das heute aber meistens über manuell gesetzte Regeln. So können wir bestimmte Dinge bereits jetzt umsetzbar machen und leisten, während wir an der eleganten Lösung weiterforschen.

Nachdem Sie ganz nah an den Entwicklungen sind: Können Sie uns ein paar Einblicke zu aktuellen Trends und Durchbrüchen bei künstlicher Intelligenz geben?

Es gibt einige spannende Sachen: Das frühere Orchideenfach ist aufgeblüht – wir können jetzt viele kleine Dinge tun, die große Auswirkungen haben: Wir können Wortarten erkennen und Sprachen ganz ordentlich übersetzen, auch wenn hier noch viel geforscht werden muss. Wir werden immer besser dabei, Fragen zu beantworten. Auch, wenn sie nicht genau so gestellt werden wie erwartet. In der Sprachverarbeitung geschieht gerade sehr viel – dort liegt auch der Fokus meiner Forschung.

Und in anderen Bereichen?

In der Robotik werden vermehrt Durchbrüche erzielt. Computer Vision – also Bild- und Objekterkennung – hat sich massiv entwickelt. Das ist etwa für selbstfahrende Autos erforderlich. Unser Feld wird insgesamt immer größer. Wir sehen auch immer mehr kluge Menschen, die in diesen Bereich strömen. Sie können mit KI fast alles bearbeiten – von philosophischen Fragen bis zu Applikationen, Suche oder Werbung.

Bedeutet das auch, dass Sie mit ganz anderen Gesprächspartnern zu tun haben?

Ja. Natürlich gibt es auch Spezialisten, die sich fokussieren. Aber ich persönlich habe viel Spaß daran, das gesamte Feld KI zu durchdenken. Ich finde es auch bereichernd, sich mit Kunden zu unterhalten und Ideen zu entwickeln, wie man die Forschung einsetzen kann, um ihr Leben und ihr Geschäft einfacher zu machen. Das können Kosteneinsparungen sein – oder Verbesserungen im Marketing, etwa wann Nutzer welche Botschaften erhalten. Diese Verknüpfung von Forschung mit Anwendungsgebieten macht mir viel Spaß.

Wo geht die Reise hin?

In ein paar Jahren müssen Menschen vermutlich nicht mehr in Service- Warteschleifen hängen, sondern können sich stattdessen direkt mit Software unterhalten. Letztlich möchten wir allen Unternehmen ermöglichen, dass sie ihren eigenen, KI-basierten Berater haben. Da wird viel passieren, auch im CRM-Bereich. Bereits heute können wir Verkäufern sagen, welche zehn Kunden sie an einem Tag am besten ansprechen sollten.

Welche Innovationen dürften denn in den nächsten drei bis fünf Jahren für Unternehmen am vielversprechendsten werden?

Wir werden einiges an Automatisierung erleben. Da wird gerade die menschengerechte Gestaltung wichtig sein. Wenn bestimmte Jobs automatisiert werden, dann sollten diese Mitarbeiter Trainings erhalten, die sie für neue Aufgaben qualifizieren. Selbstfahrende Autos werden ein sehr spannendes Segment. Persönliche digitale Assistenten werden auch immer besser werden, Geräte steuern und sich personengebundenes Wissen aufbauen. Dann können wir Menschen uns mehr auf Dinge konzentrieren, die wirklich wichtig sind. Wie bei der Erfindung von Staubsauger oder Waschmaschine früher geht es darum, uns das Leben leichter zu machen.

Nachdem ihr Fokus auf Sprachverarbeitung liegt, ist das vermutlich auch der Trendbereich, den sie persönlich am spannendsten finden, oder?

Ja. Ich glaube, Sprache ist die interessanteste Manifestation von Intelligenz bei Menschen. Sprache verbindet uns auch untereinander. Und sie umfasst alle Formen der Intelligenz – wir können uns über Visuelles, Sport bis zu Logik und Philosophie über alles unterhalten.

Was wollen Sie als nächstes lernen?

Ich will immer mehr in der KI lernen, das ist meine Leidenschaft, nicht nur meine Arbeit. Wenn ich Stanford- Studenten Dinge erklären will, die es erst seit ein paar Jahren gibt, muss ich mich auch selbst tief damit auseinandersetzen. Und ich habe mit Jet Surfing und AcroYoga angefangen.