Seit 2017 steigt die Nachfrage nach hochpräzisen Trainingsdaten für selbstfahrende Autos der Automobilindustrie stark an. Enorme Mengen dieser Daten sind nötig, um das ehrgeizige Ziel des autonomen Fahrens zu erreichen. Damit aus selbstlernenden Algorithmen selbstlenkende Fahrzeuge werden können, braucht es zunächst viel menschliche Arbeit, die von Crowdworkern auf der ganzen Welt geleistet wird. Sie bringen den lernenden Maschinen das Hören, das Sehen und das umsichtige Fahren bei, indem sie Millionen Bilddateien mit Verkehrssituationen präzise so aufbereiten, dass sie für die KI zu verarbeiten sind. Mit diesen Crowdwork-Plattformen für autonomes Fahren beschäftigt sich eine aktuelle Studie von Alexander Schmidt von der Hochschule für Technik und Wirtschaft Dresden, die von der Hans-Böckler-Stiftung gefördert wurde.
Wie Billiglöhner autonomen Autos das Fahren beibringen
Da die Qualitätsanforderungen hoch sind, haben sich laut Studie spezialisierte Plattformen etabliert, die den dort arbeitenden Online-Arbeitskräften teils eine höhere Bezahlung und bessere Arbeitsbedingungen bieten als das beim Gros der etablierten Crowdwork-Plattformen üblich ist. Durch den weltweiten harten Wettbewerb unter Crowdworkerinnen und Crowdworkern gerate dieses höhere Niveau aber bereits wieder unter Druck. Auch, weil derzeit Hunderttausende gut qualifizierte notleidende Menschen aus Venezuela ihre Arbeit zu sehr niedrigen Preisen anböten. Auf manchen der neuen Plattformen stelle diese Gruppe inzwischen 75 Prozent der Arbeitskräfte. Qualifizierte Vollzeitarbeitskräfte berichteten über Stundenverdienste von umgerechnet ein bis zwei Euro.
Als Kunden für crowdproduzierte Trainingsdaten treten laut Alexander Schmidt Dutzende gut finanzierte Firmen auf, die in den entstehenden Markt für das autonome Fahren drängen. Neben den großen Automarken und deren etablierten Zulieferern sind auch große Hardware- und Softwarefirmen wie Intel und Nvidia, Google und Apple aktiv. Hinzu kämen zahlreiche risikokapitalfinanzierte Start-ups. 2018 verfügten bereits 55 Firmen über eine Lizenz zum Testen eigener autonomer Fahrzeuge in Kalifornien, Tendenz steigend.
Sie alle, erklärt der Experte für Designkonzeption und Medientheorie, sind für das Funktionieren ihrer Algorithmen auf präzise beschriftete – "annotierte" – Trainingsdaten angewiesen. Sie brauchen demnach Millionen von Fotos aus dem Straßenverkehr, bei denen jedes abgebildete Pixel einer Szene einem Objekt zugeordnet wurde. Fahrbahnmarkierungen, Fahrzeuge und Fußgänger müssten trennscharf voneinander abgegrenzt und mit Zusatzinformationen versehen werden, damit im Zuge des maschinellen Lernens daraus Regeln abgeleitet und Softwaremodelle entwickelt werden könnten.
Durch die deutlich gestiegenen Qualitätsanforderungen dieser neuen Kunden verändert sich ein Teil der Crowdsourcing-Branche, analysiert der Wissenschaftler. Zwar finde die Produktion von KI-Trainingsdaten auch über herkömmliche Plattformen wie Amazon Mechanical Turk statt, zugleich haben sich jedoch eine Reihe Plattformen entweder extra zu diesem Zweck neu gegründet oder ihr Angebot und ihre Prozesse komplett auf die Anforderungen der Autoindustrie umgestellt. Zu den großen gehören demnach Mighty AI, understand.ai, Playment, Hive und clickworker.
Im Zuge dieser Veränderung versuche die Branche auch, sich ein moderneres Image zu geben. Der Begriff der "Crowd" gerate aus der Mode und werde durch den Zusatz "AI" als vielversprechende Formel in den Firmennamen der Plattformen ersetzt. Zwar gehe es weiterhin um billige Arbeitskräfte, die hinter den Kulissen die künstlichen Intelligenzen mittels menschlicher Intelligenz trainieren und anleiten, betont Forscher Schmidt. Die Crowdplattformen setzten zugleich jedoch tatsächlich auch selbst mehr KI-Technologien zur Optimierung ein. Teile der Arbeit könnten bereits von Machine-Learning-Systemen übernommen werden, so dass die Crowdworker oft nur noch die Ergebnisse der KI überprüften und korrigierten.
Chancen und Risiken des globalen Wettbewerbs im Plattform-Kapitalismus zeige besonders plastisch Schmidts Analyse zu den Menschen, die ihre Dienste auf Plattformen für Trainingsdaten anbieten: 2018 seien dort mindestens 200.000 Menschen aus Venezuela auf der Suche nach Arbeit gewesen – "einem Land mit gut ausgebildeter und gut vernetzter, jedoch von Hyperinflation völlig ausgezehrter Bevölkerung", schreibt der Forscher. Für viele Venezolaner sei Crowdarbeit "zur Devisen bringenden Lebensader geworden. Sie selbst sind heute Teil eines Heers von digitalen Wanderarbeiterinnen und -arbeitern, die wie Erntehelfer zwischen den neuen Plattformen hin und her ziehen." (os)
Lesen Sie auch:
US-Firmen Cepton und Dataspeed kooperieren: Neue Zusammenarbeit bei Lidar-Systemen
Autonomes Fahren: Lyft nutzt Waymo-Roboterautos
Kommentar: Die lange Reise zum autonomen Auto
Aus dem Datencenter: