Kolumnen zu Karriere, Führung und Entwicklung

Robo-Recruiting: Wenn der Computer die Auswahl für den Bewerber trifft… sollte sich das Gehirn besser nicht abschalten

Von | 2018-11-17T22:55:51+00:00 17. November 2018|

Was für eine Mühe, ja, mehr noch: Hingabe! Stunde, ja Tage stecken in Ihren Unterlagen! Mindestens eine Designer-Jeans hat die Optimierung durch den Profi gekostet. Immer noch glauben Sie, dass ein Anschreiben Wunder wirken kann. Dabei wird es kaum mehr gelesen, erst recht nicht von Menschen.

Stattdessen werden Sie analysiert, Ihre Persönlichkeit wird per Robo-Recruiting vermessen. Die künstliche Intelligenz sagt Ihnen dann, wer Sie sind. Am Ende entlarvt Sie sie sogar als das, was sie nie sein wollten: Ein uninspirierter Langweiler, beispielsweise.

Der Mensch entscheidet? Bewerbungen sind handverlesen? Naiv, wer sich an diesem Glauben festhält. Schon Online-Formulare, wie sie schon seit mindestens 15 Jahren flächendeckend in Gebrauch sind, erlaubten Automatisierung frei nach dem Muster: „Wer keinen Master hat, fliegt raus.“ Oder: „Note schlechter als 2,0 im Abi – tschüss, ade, goodbye.“ Das nennt sich Negativselektion. Der Computer spielt die guten ins Töpfchen, die schlechten ins Kröpfchen.

Wenn-dann heißt die Zauberbeziehung, die ruckzuck über tausende von Daten hergestellt werden kann. Heißt: Wenn nicht passend, dann raus. Dass Unternehmen schon vor 15 Jahren behaupteten, ein Mensch würde weiterhin alles ansehen – geschenkt, wir haben es nie geglaubt. Dass es shifting Baselines gibt, haben wir aber kaum bemerkt. Jetzt sind Computer auch bei der Positivselektion im Spiel, sie entscheiden also mit wen wir einstellen. Doch die meisten verstehen gar nicht, was da zwischen IT und HR passiert. Und das ist das wirkliche und wahre Problem.

Robo-Recruiting: Es geht immer um Effizienz

Automatisierung kroch viele Jahre langsam in die Personalabteilungen. Seit zwei Jahren hat sich das Tempo jedoch erheblich beschleunigt. Seit einem Jahr liest man allerorts und auch in Deutschland über „Robo-Recruiting“. So heißt der Trend, nach dem künstliche Intelligenz Teile oder gar den gesamten Auswahlprozess unterstützt – oder wahlweise gar übernimmt. Dabei gibt es zwei große Richtungen, die sich stark unterscheiden:

  • Effizienz als Verbesserung der Kommunikation mit dem Bewerber durch Chatbots, also Nutzung von Software, die meist mit dem Messenger-Prinzip à la Facebook agiert. Das sieht der Bewerber und kommt ihm zugute. Es erfüllt seine Bedürfnisse.
  • Effizienz durch Automatisierung der Auswahl von Bewerbern mit Hilfe künstlicher Intelligenz (Negativ- und Positivselektion). Das ist der wesentlich weniger transparente Bereich. Was da passiert ahnt der Bewerber nicht mal. Es läuft seinen Bedürfnissen entgegen – und oft auch dem Recht.

Die Art der angestrebten effizienten Problemlösung macht das vielleicht am ehesten deutlich. Ein Prozess läuft nicht schnell genug oder ist zu teuer – was tun? Wer die Bewerberkommunikation verbessern möchte, sucht Effizienz im Kontakt, damit Interessenten sich nicht verärgert abwenden, weil sie zu lange warten müssen. Wer dagegen die Auswahl automatisieren will, dem geht es um Kosteneffizienz. Ein Assessment Center ist teuer; es kann vernünftigerweise nur von hochqualifizierten Wirtschaftspsychologen durchgeführt werden. KI dagegen geht analytisch vor und macht all die Menschenfehler – scheinbar – nicht. Künstliche Intelligenz unterliegt auf den ersten Blick  keinen Biassen und Heuristiken – wie etwa dem berühmten Halo-Effekt: Durch sein Auftreten und seine Eloquenz überstrahlt ein charmanter Bewerber alles, und er wird trotz mangelnder Eignung eingestellt. So etwas zu verhindern ist erklärtes Ziel. Die Grundannahme dahinter: Der Recruiter ist ein Mängelexemplar, KI frei von menschlichen Fehlern. Diese Grundannahme ist falsch, aber dazu später mehr.

Grundannahme: KI macht keine menschlichen Fehler ist falsch

Eine verbesserte Bewerberkommunikation ist eine aus Bewerbersicht gute Entwicklung, eine verbesserte Auswahl wäre das auch – wenn nicht vorhandene Denkfehler einprogrammiert würden. Und das scheint mir so zu sein. Das gilt nur bedingt für Chatbots: Sie ermöglichen eine schnelle (und kostengünstige) Kontaktaufnahme und Austausch mit dem Bewerber. Der kann  z.B. über Facebook mit dem Unternehmen kommunizieren und fühlt sich nicht mehr in langer Warteschleife oder gar ignoriert. Das verbessert den Prozess, den Recruiting-Experten „Candidate Experience“ nennen.  Bekomme ich sofort Resonanz und passiert kein peinlicher technischer Bruch, ist vielen vielleicht irgendwann auch egal, ob am anderen Ende ein Chatbot oder ein Mensch sitzt. Bewerberkommunikation könnte also sogar verbessert werden.

Bei der Bewerberauswahl jedoch sind die Vorteile des Robo-Recruitings allein auf der Seite des Unternehmens. Man darf sich da keinen Illusionen hingeben: Der Einsatz dieser Technologien beruht allein auf Automatisierungsgedanken. Übrigens ist Robo-Recruiting ein irreführender Begriff, denn mit Robotern hat das alles nichts zu tun. Bisher geht es lediglich um Datenanalysen und Algorithmen – nicht um menschenähnliche Maschinen, die Gespräche führen, also den Personaler aus Metall.

Unternehmen sparen mit Robo-Recruiting Geld, der Bewerber gewinnt nichts

Letzte Woche war ich in diesem Zusammenhang mit dem Zeit-Redakteur Dr. Kolja Rudzio und Talanx-Vorstandssprecher Thomas Belker auf einem Podium des Museum für Arbeit in Hamburg im Rahmen der Ausstellung „Out of Office“, die vom Bucerius Lab organisiert wird und noch läuft.

Rudzio erläuterte sein in der ZEIT veröffentlichtes Selbstexperiment mit der Software „Precire“, die anhand einer Sprachprobe von wenigen Minuten ermittelt, ob sich ein Bewerber für einen Job eignet oder nicht. „Precire“ fragt beispielsweise nach einem idealen Sonntag. Sind ausreichend Sprachproben gesammelt, analysiert es die Sprachstruktur und die Intonation – nicht den Inhalt. Die Frage nach dem idealen Sonntag ist also austauschbar.

Dass Sprachstrukturen viel über das „Mindset“ aussagen, ist für mich nichts Neues. An der Art wie Menschen Sätze bauen, erkennt man ihr Denken – weniger daran, WAS sie sagen. Inhalte sind austauschbar. Das nennt sich in der Psychologie ein projektives Verfahren. Solche Verfahren sind – wenn sie gut sind – nicht oder nur sehr bedingt manipulierbar. Man kann nicht vorausschauen, worauf der Computer hinauswill. Die meisten Tests im Ankreuzverfahren sind mit etwas Verstand dagegen leicht zu durchschauen.

Bewerberdiagnosen sind  immer heikel – erst recht wenn Laien sie stellen

Talanx wendet „Precire“ zur Auswahl seiner höheren Führungskräfte an – wie ich verstanden habe, betrifft es also nur den außertariflichen Bereich. Es trifft also keine „unbedarften“ Angestellten (oder noch nicht). Ob Precire oder herkömmlicher Test: Jede Form von „Diagnose“, die ein Bewerber nicht richtig einordnen kann, empfinde ich als Risiko für die persönliche Entwicklung. Die meisten Menschen nehmen für bare Münze, was in so einem Test steht. Ohne statistische Kenntnisse verzweifeln manche sogar daran, dass sie „nur Durchschnitt“ sind, also im Mittelfeld einer Persönlichkeitsausprägung liegen – dabei entspricht das ja nur der Normalverteilung. Wobei dann immer die Frage gestellt werden sollte, an welcher Norm sich diese Verteilung ausrichtete. Waren es Führungskräfte? Wie viele? Welches Alter? Bildungsstand? Solche Kleinigkeiten werden von den meisten Anbietern gar nicht erst genannt oder verschwinden verallgemeinernd in einer Zahl im Kleingedruckten. Bei Precire ist diese Normierung auch nicht ganz transparent.

Kollatoralschäden beim Bewerber

Dumm genug, wenn der Bewerber eine Absage bekommt, obwohl er passen würde. Schwierig, wenn es Kollatoralschäden gibt. Diagnosen wie „Bewerber ist wenig dominant“ dienen eher der Zustandsfestschreibung als dass sie persönliche Entwicklung fördern. Wenn Kolja Rudzio von Precire zugeschrieben wird, wenig Dominanz zu haben und dies für die Führungskarriere als relevant vorausgesetzt wird (das entscheidet der Nutzer, hier die Talanx), könnte er mit dieser „Diagnose“ die nächsten Jahre „rumlaufen“ und weitere Entscheidungen auf dieser Basis treffen. Ich hatte oft Kunden, die mit solchen – im schlimmsten Fall nahezu willkürlichen – Zuschreibungen im Kopf eher gebremst als gefördert worden sind. Denn Auswertungsgespräche werden – wenn überhaupt – oft von wenig vorgebildeten Personalern oder Führungskräften geführt, die dass Testergebnis ebenso für bare Münze halten.

Worte formen Denken

Auch dass Talanx inzwischen laut Aussage von Herrn Belker statt Dominanz das freundlichere „Einfluss“ verwendet, macht es nicht besser. Wörter formen Denken, das sollten wir nie vergessen. Das ist allerdings grundlegend so, bei allen Tests und nicht nur bei Precire. Ich vermute aber, dass KI der Wortgewalt noch etwas hinzufügt: Das Gefühl auf Seiten des Bewerbers, dass sie besser urteilen kann als ein Mensch. Durch die für Fachfremde irritierende Form der Analyse – über Sprache – tritt etwas Geheimnisvolles hinzu. Ein technisches Wunder wird  noch weniger in Frage gestellt als ein menschlicher Experte.

Durch Daten von gestern Prognosen von morgen erstellen

Die wissenschaftlich fundierte Testkonstruktion von Precire stellen Persönlichkeitspsychologen wie der Osnabrücker Uwe Kanning allerdings in Frage (z.B. hier). Wer aber liest das? Offenbar sind Unternehmen, die sparen wollen, bereit, Kritik im Zweifel zu ignorieren. Auch dass der Paragraph 26 BDSG-neu „Erforderlichkeit“ verlangt, worauf Cyquest-Geschäftsführer Joachim Diercks bei LinkedIn hinwies, scheint nicht zu interessieren. Laut Rüdiger Hossiep von der Ruhr-Universität Bochum und Vater des Bochumer Inventars sind projektive Verfahren im Recruiting unzulässig.

Daten von gestern für Herausforderungen von Morgen

Aber auch wenn das Verfahren zulässig und die Wissenschaftlichkeit gewährleistet wäre: Mich stört der Versuch, durch Daten von gestern Prognosen von Morgen erstellen zu wollen. In einem komplexen Umfeld und unter komplexen Bedingungen, spiegelt das wenig hilfreiches Industriezeitalter-Denken, das der Digitalisierung und unserem aktuellen Wissensstand nur noch bedingt angemessen ist. Jeder, der sich mit Persönlichkeitspsychologie beschäftigt weiß, dass diese immer nur das Individuum betrachtet, vielleicht seine Einflussgrößen durch Erziehung, Bildung und andere Faktoren, kaum aber durch wechselnde Kontexte. Die Prognosekraft von Eigenschaften ist gering – der Mensch verhält sich je nach Situation und Kontext immer wieder anders.

Studien zu OCEAN (Big Five) oder anderen Verfahren wie dem Bochumer Inventar, die angeblich auch Precire zugrunde liegen sollen (laut Hossiep existiert die Studie gar nicht), untersuchen aber Eigenschaften – und noch dazu, wie sich diese in der Vergangenheit auf Arbeitskontexte ausgewirkt haben.

Sie stellten beispielsweise vor vielen Jahren in Studien fest, dass erfolgreiche Führungskräfte nur eine mittlere Offenheit für neue Erfahrungen mitbrachten, also platt gesagt nur mittel oder gar niedrig neugierig waren. Der KPI-getriebene Leader mit BWL-Studium entspricht vielfach diesem Typus. Philosophie und alles was keine direkte Lösung bringt, schreckt ihn – er möchte Modelle, Best Practice und Kochrezepte. Nun weisen neuere Untersuchungen aber darauf hin, dass ein agiler oder digital Leader sehr neugierig sein sollte. Epistemische Neugier ist sogar der Boden, auf dem eine Zukunft gebaut ist, in der wir immer wieder neu lernen müssen. So könnte es sein, dass solche Aussagen heute nicht mehr gelten. Auch lange präferierte Eigenschaften wie Dominanz stehen für mich auf dem Prüfstand auf dem Weg Richtung Zukunft der Arbeit. Ist den Unternehmen also immer klar wonach sie suchen?

Tragende Eigenschaften der Zukunft sind vielleicht nicht identisch mit denen der Vergangenheit

Nicht nur ein Bodo Janssen, der Vorzeige-Leader von Upstalsboom, zeigt eher den gegenteiligen Typ. Und nebenbei auch, dass Dominanz wie auch andere Eigenschaften keine unabwendbaren „Schicksale“ sind. Neugier lässt sich erlernen, wir können auch milder werden und kooperativer. Wenn wir daran glauben, deshalb bin ich ein so großer Fan des growth und fixed mindset-Modells von Carol Dweck. Die differenzielle Psychologie und ihre Persönlichkeitsdiagnostik agiert zu einem großen Teil aber aus einem fixed-Mindset-Denken. Sie sucht eher zu beweisen, dass etwas stabil bleibt, als den Gegenbeweis anzutreten (das überlässt sie anderen Disziplinen). Sie sucht nicht sehr aktiv nach Gegenbeweisen, was mir auch ein spezielles Bildungsverständnis dieser Disziplin zeigt. So misst der IQ aus dieser Sicht Bildungsfähigkeit. Meine Definition wäre eine ganz andere: Bildung lässt Menschen reifen, die in der Lage sind, Position zu beziehen und diskursiv zu eigenen Schlüssen zu kommen. Das setzt notwendig voraus, dass sie neugierig sind, denn zu eigenen Schlüssen kommt man nur, wenn man viel liest, sich informiert und eigene Grundannahmen immer wieder aktualisiert. Bildung ohne Persönlichkeitsentwicklung und Persönlichkeitsentwicklung ohne tiefe Diskussion sind aus dieser Perspektive undenkbar.

Kein Precire der Welt kann die Fähigkeit dazu ermitteln, sich auf diese Weise zu bilden. Es geht von einem Fixed-Zustand aus – muss es auch, denn zu den Gütekriterien eines Tests zählt u.a. die Retest-Stabilität. Ein valider Test darf also nicht nur einen Momentzustand aufnehmen. Wäre das so, taugt er nichts.

Mehr Mediengag als Fortschritt

Precire ist also mehr Mediengag als Fortschritt, zumal seine Anschaffung ohnehin nur für Großunternehmen lohnenswert ist. Man beachte, dass Talanx letztes Jahr Riesenverluste eingefahren hat – es geht offensichtlich ums Sparen.

Dass ein Programm wie Precire etwa Depression erkennen könne, ist ein gefundenes mediales Fressen. Ansonsten sehen Precires Analysen genauso aus wie frühere Testanalysen auf der Basis von Ankreuzverfahren. Einen Unterschied aber gibt es: Sie stellen höhere Anforderungen an das Auswertungsgespräch. Eine Führungskraft, die auf dieser Basis ein Interview führt? Ich habe große Zweifel, dass das gelingen kann. Das kann eigentlich nur jemand mit einer konstruktivistischen Grundhaltung leisten, der sich bewusst ist, dass er da ein Konstrukt hinterfragt. Alle anderen werden nach Beweisen zur Selbstbestätigung suchen. Womit wir bei dem Thema wären, das Precire ja eigentlich ausräumen wollte… Heuristiken kommen dann um eine andere Ecke in den Entscheidungsprozess wieder hinein.

Und selbst wenn diese auswertende Führungskraft offene, bewertungsfreie Fragen stellen könnte  – wäre sie in der Lage, die Antworten zu verarbeiten? Vorurteils- und stereotypfrei, und zwar ohne das schriftliche Ergebnis zu betrachten? Welchen Druck übt der Kontext aus, ein Unternemen wie Talanx, das ja nach Bestätigung für seine Entscheidung sucht?  Ich frage mich, ob bei seriöser und verantwortlicher Anwendung noch ein Kostenvorteil bleibt. Ich vermute gar, dass Orecire (und andere KI) überflüssig würden, wenn die Auswählenden sensibel und selbstkritisch agierten.

Precire habe ich hier beispielhaft genannt, es gibt zahlreiche neue Entwicklungen, über IBM Watson und Crystal Knows habe ich bereits vor einiger Zeit hiergeschrieben. Lösungen à la Crystalknows als mit Halbwissen über die menschliche Psychologie zusammengeschraubte Startup-Entwicklung halte ich für gefährlich. Sie ordnen Menschen in Schubladen, ohne dass diese sich dagegen wehren können.

Was wir brauchen ist nicht mehr Technologie, sondern mehr Mensch

Nein, ich komme mehr und mehr zu dem Schluss, dass diese ganzen Entwicklungen alles brauchen, nur keine Technologie: Sie brauchen Menschen, die durchschauen und verstehen, die in Frage stellen und sich nicht selbst bestätigen. Sie brauchen keine Menschen auf der Suche nach einfachen Effizienzlösungen. So sehr mir Richard David Precht mit seiner teils pauschalen Digitalisierungschelte in „Jäger, Hirten, Kritiker“ derzeit auf den Keks geht, so sehr unterstreiche ich die Forderung nach mehr und völlig anderer Bildung. Das ist die Voraussetzung, damit KI sinnvoll eingesetzt werden kann. Hier hilft ein einfacher Blick auf eine Wertehierarchie: Derzeit wird KI aus pragmatischen Gründen eingeführt. Es soll Personalauswahl effizienter machen. In Zukunft sollten die moralischen Gründe mitgedacht werden: Welche Folgen hat das für Menschen? Da ist ohne Frage mehr Politik und weniger Wirtschaft gefragt.

Foto: Pathdoc – Fotolia.com

Svenja Hofert ist Management- und Karriereberaterin. Mit ihren beiden Unternehmen entwickelt sie Menschen, Teams und Organisationen. Der Schwerpunkt von Hofert Tätigkeit liegt in der Ausbildung sowie im Coaching und der entwicklungsbezogenen Beratung von Führungskräften, Teams und Unternehmen. Hofert hat ab 2000 das Büro „Karriere und Entwicklung“ in Hamburg aufgebaut und unter anderem ein Startup-Portal etabliert, bevor sie 2015 die Teamworks GTQ Gesellschaft für Teamentwicklung und Qualifizierung GmbH mit Thorsten Visual gründete. Hofert lebt in der Nähe von Hamburg und etwa ein Drittel des Jahres in Marbella, Spanien. Im Laufe der letzten zwei Jahrzehnte hat die gebürtige Kölnerin über 30 Bücher geschrieben, darunter immer wieder Longseller und Standardwerke, die bis zu acht Auflagen erreichten. Standen zunächst die Themen Karriere und Beruf im Mittelpunkt, erweiterte sie ihren Blick ab 2004 zu Gründung, Management und Unternehmensführung, um schließlich ab 2009 auch Teams und die neue Arbeitswelt in den Fokus zu nehmen. Der rote Faden blieb die Verknüpfung von betriebswirtschaftlichen, philosophischen und psychologischen Perspektiven – und ein Fokus-Thema: Die Entwicklung von Menschen, Gruppen, Organisationen. Buchung |

Ein Kommentar

  1. Barbara Mussil 21. November 2018 at 23:57 - Antwort

    Danke für den Beitrag – wie immer sehr lesenswert. Ich teile Ihre Überlegungen voll und ganz!

Hinterlasse einen Kommentar