Our results support the conclusion that the two existing categories of men and women are insufficient to be mapped to actual, modern-day gender identity categories. An individual’s gender identity is one of the most important determinants of professional and personal life trajectories in human societies. Gender distinctions influence modern-day societies with respect to income levels, leadership, participation, health, and academic status. Not conforming to the socially established gender norms might likely mean to face stigma, social exclusion, and discriminatory practices, which in turn can have detrimental effects on physical and mental health. Specifically, many previous studies examining brain correlates of transgender tended to neglect the possibility of a dimensional gender construct, thus reinforcing a sexually dimorphic view of gender identity. This is worrisome, considering the steep increase in prevalence of gender incongruence and the associated social, psychological, and monetary burdens for the affected individuals and our health care system.
The present study provides important quantitative evidence for future decision-making in a clinical or societal context. We substantiated the existence of specific intermediate phenotypes for gender identity: besides male and female participants, our support-vector classifier was able to predict both trans women and trans men as distinct gender groups, with prediction accuracies above chance level for all four groups. Transgender subgroups were identified with prediction accuracies comparable with men and women and were not systematically misclassified as skewed towards male or female. These results clearly support a dimensional gender perspective that captures four distinguishable brain phenotypes for gender identity. And since trans women and trans men were not primarily ‘misclassified’ as either men or women, these two groups constitute distinct gender subtypes which are associated with unique brain phenotypes. Thus, applying a simple, binary gender variable may incur an oversimplification that does not accurately capture the existing spectrum of human gender identities.
Here, we extend previous knowledge on human gender identity by showing that trans men and trans women represent separate and gradual gender identity subtypes using two machine learning algorithms and brain imaging data. While we found at least four separable gender identity subtypes, it should be noted that this result might have been partly due to inherent limitations of our analytic approach and that additional gender identity subtypes might exist. Thus, we acknowledge that our results can only indicate first steps towards unraveling the brain basis of gender identity. Given the challenging recruitment of our unique sample, we are happy about a sufficient sample size that showed out-of-sample prediction accuracy well above chance level. While future studies will need to corroborate our findings, we have made first steps towards a more nuanced conceptualization of gender dimorphism. These first steps should help to move away from the binary gender concept, hence taking away the pressure from transgender and intersexual individuals to fit into one of two categories. We should redefine the way we think and speak about transgender and other conditions that are not conforming to traditional gender concepts prevalent in modern societies.
German Research Foundation (DFG: HA 3202/7-1 and IRTG 1328); the Start program 34/13 and the Brain Imaging Facility of the Interdisciplinary Centre for Clinical Research of the Faculty of Medicine at RWTH Aachen University, Germany. D.B. was funded by the German Research Foundation (DFG, BZ2/2-1, BZ2/3-1, and BZ2/4-1; International Research Training Group IRTG2150); Amazon AWS Research Grant (2016 and 2017); the German National Merit Foundation, as well as the START-Program of the Faculty of Medicine (126/16) and Exploratory Research Space (OPSF449), RWTH Aachen.
The authors thank Sabine Bröhr, Cordula Kemper, Maria Peters, David Weyer, and Teresa Karrer for their assistance and support. Specifically, we are indebted to all self-help groups, web forums, and participants, whose keen support and endurance made this study possible. Conflicts of Interest: The authors report no biomedical financial interests or conflicts of interest.
U.H., B.D., E.S., J.N., J.J., T.A., F.S., and B.C. conceived the study design and acquired funding. J.J, E.S., and B.C. were responsible for data acquisition. D.B., G.M., and B.C. analyzed the data. B.C. wrote the first draft of the manuscript and prepared the figures. All authors read, approved, and contributed to the final version of the manuscript.
Abstrakt
Die genauen neurobiologischen Grundlagen der Geschlechtsidentität (d. h. der subjektiven Wahrnehmung, einem bestimmten Geschlecht anzugehören) sind nach wie vor unbekannt. Durch die Kombination von funktionellen Ruhe-Netzwerkdaten und Verhaltensdaten untersuchten wir die Geschlechtsidentität bei cisgender und transgender Personen mit einer datengesteuerten, maschinellen Lernstrategie. Intrinsische funktionelle Konnektivität und Fragebogendaten wurden von cisgender (Männer/Frauen) und transgender (Transmänner/Transfrauen) Personen erhoben. Algorithmen des maschinellen Lernens erkannten die Geschlechtsidentität zuverlässig mit hoher Vorhersagegenauigkeit in jeder der vier Gruppen allein auf der Grundlage von Konnektivitätsmustern. Die vier normativen Geschlechtsgruppen wurden mit Genauigkeiten zwischen 48 % und 62 % klassifiziert (und lagen damit über dem Zufallsniveau von 25 %). Diese auf Konnektivität basierenden Klassifikationsgenauigkeiten übertrafen jene, die mit einem weithin etablierten verhaltensbezogenen Instrument zur Erfassung der Geschlechtsidentität erzielt wurden. Mittels kanonischer Korrelationsanalysen wurden anschließend funktionelle Hirnmaße und Fragebogendaten integriert, um neun kanonische Vektoren (d. h. Gehirn-Geschlechts-Achsen) zu bestimmen, die ein mehrstufiges Fenster auf die konventionelle Geschlechtsdichotomie eröffnen. Unsere dimensionale Perspektive auf Geschlecht erfasst vier unterscheidbare Gehirn-Phänotypen der Geschlechtsidentität und plädiert für eine biologisch fundierte Neukonzeptualisierung des Geschlechtsdimorphismus. Wir hoffen, den Weg zu objektiven, datengesteuerten diagnostischen Markern für Geschlechtsidentität und Transgender zu ebnen, die neurobiologische und Verhaltensunterschiede in einem integrativen Modellierungsansatz berücksichtigen.
Einleitung
Obwohl bei den meisten Personen sichtbare Anatomie und Geschlechtsidentität übereinstimmen, gibt es Ausnahmen. Im gesamten Manuskript verwenden wir den Begriff „biologisches Geschlecht“, um das Geschlecht zu beschreiben, das jedem Menschen bei der Geburt auf Grundlage der Anatomie des Fortpflanzungssystems zugewiesen wird. Der Begriff „Geschlechtsidentität“ wird verwendet, um die subjektive Wahrnehmung zu beschreiben, einem bestimmten Geschlecht anzugehören, das männlich, weiblich, keines von beiden oder eine Kombination aus beidem sein kann. Unterschiedliche Begriffe wurden verwendet, um Personen zu beschreiben, deren Geschlechtsidentität nicht mit ihrem biologischen Geschlecht übereinstimmt. Von all diesen Begriffen hat sich „transgender“ als bevorzugter Begriff etabliert, während „cisgender“ Personen bezeichnet, bei denen das biologische Geschlecht mit der Geschlechtsidentität übereinstimmt. Transgender-Personen können entweder Transmänner (Tm) sein, womit Personen beschrieben werden, die mit dem biologischen Geschlecht „weiblich“ geboren wurden, sich aber als Männer identifizieren, oder Transfrauen (Tw), womit Personen mit weiblicher Geschlechtsidentität, aber männlichem biologischem Geschlecht beschrieben werden. Ein weiterer Begriff, der in mehreren Klassifikationssystemen verwendet wurde, nun aber verworfen wird, ist „Geschlechtsdysphorie“. Diese psychische Gesundheitsdiagnose bezeichnet ein starkes Unbehagen, das sich aus der Diskrepanz zwischen Geschlechtsidentität und biologischem Geschlecht ergibt (American Psychiatric Association 2013). Wichtig ist, dass „transgender“ zu sein nicht gleichbedeutend mit einer psychischen Erkrankung ist und nicht alle Transgender-Personen unter Geschlechtsdysphorie leiden (Safer and Tangpricha 2019). Um Stigmatisierung zu verringern und den Zugang zu den relevanten Gesundheitsversorgungsangeboten für Transgender-Personen zu erleichtern, sieht der Plan für die ICD-11 vor, Geschlechtsinkongruenz in den Abschnitt zur sexuellen Gesundheit aufzunehmen und den Begriff Geschlechtsdysphorie vollständig zu entfernen (Reed et al. 2016). In Übereinstimmung mit dieser grundlegenden Änderung der Terminologie werden wir daher ebenfalls den Begriff Geschlechtsdysphorie vermeiden und im gesamten Manuskript den Begriff Geschlechtsinkongruenz verwenden.
Einer aktuellen Schätzung zufolge leben allein in den USA mehr als 1,45 Millionen Transgender-Personen, was mindestens 0,6 % der Gesamtbevölkerung entspricht (Flores et al. 2016). Die Prävalenzraten könnten jedoch erheblich unterschätzt worden sein (Mędraś and Jóźków 2010). Höchstwahrscheinlich werden diese Zahlen in naher Zukunft weiter steigen, bedingt durch Gesetzesänderungen, die zunehmende Sichtbarkeit von Transgender-Prominenten in den Medien, die bessere Verfügbarkeit medizinischer Verfahren und eine abnehmende Stigmatisierung. Eines der schwerwiegendsten Probleme für Transgender-Personen sind die zahlreichen Hürden beim Zugang zu angemessener und kompetenter medizinischer Versorgung (Safer und Tangpricha 2019). Diese Schwierigkeiten beim Zugang zu Gesundheitsleistungen, ein Mangel an sachkundigen Hausärztinnen und Hausärzten sowie gesellschaftliche Stigmatisierung tragen nachweislich zu vielfältigen Gesundheitsproblemen bei Transgender-Personen bei: Substanzmissbrauch, psychische Erkrankungen, erhöhte Raten bestimmter Krebsarten, Infektionen und chronische Krankheiten (Jaffee et al. 2016; Reisner et al. 2016). Dies verdeutlicht, wie wichtig es ist, dass Klinikerinnen, Kliniker und Wissenschaftlerinnen, Wissenschaftler unser Verständnis für die spezifischen medizinischen Probleme und zugrunde liegenden neurobiologischen Mechanismen, die für diese Bevölkerungsgruppe relevant sind, weiter vertiefen.
Neuere Arbeiten deuten zudem darauf hin, dass es eine biologische Grundlage der Geschlechtsidentität gibt, die bereits bei der Geburt vorhanden ist (Safer and Tangpricha 2008; Saraswat et al. 2015), wobei Zwillingsstudien eine höhere Übereinstimmung in Bezug auf Transgender-Identität bei eineiigen Zwillingen im Vergleich zu zweieiigen Zwillingen zeigen (Heylens et al. 2012). Darüber hinaus scheint das Sexualhormon Androgen eine wichtige Rolle zu spielen. Personen, die im Mutterleib einer übermäßigen Androgenexposition ausgesetzt waren, zeigen erhöhte Raten einer männlichen Geschlechtsidentität (Dessens et al. 2005), während Individuen mit Androgeninsensitivitätssyndrom erhöhte Raten einer weiblichen Geschlechtsidentität aufweisen (Mazur 2005). Wie genau unterscheiden sich also Transgender-Personen von Cisgender-Personen in Bezug auf Hirnmorphologie, Konnektivität und Funktion? Diese Frage scheint aus wissenschaftlicher, gesellschaftlicher und klinischer Perspektive relevant zu sein. Die wenigen vorliegenden neurowissenschaftlichen Befunde haben die Diskussion in unterschiedliche Richtungen gelenkt: Daten aus funktionellen Magnetresonanztomografie(fMRT)-Studien liefern ein komplexes Ergebnismuster und beruhen häufig auf kleinen Stichproben, die meist nicht repliziert wurden und in vielen Fällen nur Transfrauen einschließen (Smith et al. 2015a, 2015b; Mueller et al. 2017b). Während frühere postmortale Studien auf eine Feminisierung hypothalamischer Kerne und des Stria-terminalis-Kerngebiets bei Tw hindeuteten (Zhou et al. 1995), ergibt sich ein komplexeres Bild, wenn man auch Ergebnisse späterer postmortaler Studien berücksichtigt, die Transgender-Personen untersuchten (Garcia-Falgueras and Swaab 2008; Garcia-Falgueras and Swaab 2009). Insgesamt gibt es ein verbreitetes Denkmuster, das Erkenntnisse aus psychologischen und neurowissenschaftlichen Studien zu Transgender behindert: Traditionelle Ansätze sind routinemäßig von zwei starren Geschlechtskategorien ausgegangen und haben damit eine sexuell dimorphe Sichtweise auf menschliches Verhalten und menschliche Kognition verstärkt.
Im Gegensatz dazu verfolgt unsere Studie eine dimensionale, gruppenübergreifende Perspektive auf die neuronale Grundlage von Transgender. Unter Verwendung einer umfassenden Stichprobe von Männern, Frauen, Transmännern und Transfrauen nutzten wir Algorithmen des maschinellen Lernens, um die komplexen Wechselwirkungen zwischen Geschlechtsidentität und biologischem Geschlecht zu beleuchten und so multidimensionale Marker zu definieren, die Geschlechtsphänotypen über Cisgender- und Transgender-Gruppen hinweg abgrenzen. Das übergeordnete Ziel unseres Ansatzes besteht darin, die neurobiologische Grundlage von Transgender besser zu verstehen, indem wir nach bio-behavioralen Markern suchen, anstatt uns einfach auf primäre Geschlechtsmerkmale zu stützen. Angesichts der sich häufenden Hinweise auf nuanciertere Sichtweisen von Geschlecht und seiner Ausprägung im menschlichen Gehirn (Joel et al. 2015; Manzouri et al. 2017; Manzouri and Savic 2018) könnte man argumentieren, dass es so etwas wie ein kategorial männliches oder weibliches Gehirn nicht gibt. Mit diesem strikt kategorialen Ansatz wurden nur geringe Fortschritte bei der Beantwortung einer wichtigen Frage erzielt, die im Zentrum aller neurobiologisch orientierten Transgender-Forschung steht: Stellen Transmänner und Transfrauen getrennte und unterscheidbare Subtypen von Geschlecht dar, oder können wir alle Menschen als entweder männlich oder weiblich klassifizieren? In der vorliegenden Studie verwenden wir einen datengesteuerten, auf maschinellem Lernen basierenden Ansatz, in der Hoffnung, die oben genannte Frage zu beantworten und Licht auf die neurobiologischen Grundlagen von Transgender und Geschlechtsinkongruenz zu werfen.
Materialien und Methoden
Teilnehmer
In die vorliegende Studie wurden 92 Teilnehmer eingeschlossen, darunter 23 cisgender Männer, 23 cisgender Frauen, 23 Transmänner und 23 Transfrauen. Alle cisgender Teilnehmer wurden über öffentliche Ankündigungen im Raum Aachen (Deutschland) rekrutiert. Tm und Tw wurden in Selbsthilfegruppen sowie an der Klinik für gynäkologische Endokrinologie und Reproduktionsmedizin des Universitätsklinikums der RWTH Aachen, Deutschland, rekrutiert. Alle Transgender-Teilnehmer gaben an, in Zukunft eine gegengeschlechtliche Hormontherapie durchführen zu wollen, berichteten ein starkes Zugehörigkeitsgefühl zum jeweils anderen Geschlecht und lebten die gewünschte Geschlechtsrolle im Alltag. Darüber hinaus erfüllten alle Transgender-Teilnehmer die diagnostischen Kriterien für Geschlechtsdysphorie, diagnostiziert durch einen ärztlich anerkannten Fachvertreter für psychische Gesundheit. Die deutsche Version des Strukturierten Klinischen Interviews zur vierten Auflage des Diagnostischen und Statistischen Manuals Psychischer Störungen (DSM-IV) (Wittchen et al. 1997) wurde verwendet, um sicherzustellen, dass Teilnehmer mit psychischen Störungen, die nicht mit Geschlechtsinkongruenz in Zusammenhang stehen, ausgeschlossen wurden. Für alle cisgender und Transgender-Teilnehmer galten weitere Ausschlusskriterien: neurologische Erkrankungen, andere medizinische Zustände mit Einfluss auf den Hirnstoffwechsel sowie Verwandte ersten Grades mit einer Vorgeschichte psychischer Erkrankungen. Die lokale Ethikkommission der Medizinischen Fakultät der RWTH Aachen genehmigte die Studie (EK 088/09). Die Teilnehmenden erhielten eine finanzielle Aufwandsentschädigung und gaben ihre schriftliche Einwilligung zur Teilnahme an der aktuellen Studie.
Ablauf
Unser Datensatz bestand aus zwei Teilen: Fragebogendaten zur selbst wahrgenommenen Geschlechtsidentität und Ruhe-fMRT-Aufnahmen. In den letzten Jahren haben funktionelle Konnektivitätsansätze in der fMRT mehrere Hirnregionen identifiziert, deren spontane niederfrequente Schwankungen (<0,1 Hz) des BOLD-Signals im Ruhezustand miteinander korrelieren. Diese Regionen gelten als funktionell miteinander verbunden, auch ohne konkrete Aufgabenanforderungen, und spiegeln die intrinsische funktionelle Architektur des Gehirns wider. Weiterhin umfassten unsere Daten die detaillierten, quantifizierten Informationen zur Geschlechtsidentität, wie sie durch das Bem Sex-Role Inventory (BSRI; Bem 1974) bereitgestellt werden (vgl. Methoden). Dieser Fragebogen verlangt von den Teilnehmern, sich selbst auf kulturell als männlich oder weiblich geltenden Eigenschaften einzuschätzen. Das BSRI ist eines der wenigen empirisch fundierten Instrumente zur Untersuchung der Geschlechtsidentität, und die daraus resultierenden Geschlechtskategorien korrelieren mit verschiedenen stereotypen geschlechtstypischen Verhaltensweisen (Bem 1977; Lee 1982; Hoffman and Borders 2001; Savic and Arver 2011). Obwohl mehrere psychometrische Instrumente speziell für die Erfassung der Geschlechtsidentität bei Transgender-Personen entwickelt wurden, haben wir hier keines dieser spezialisierten Instrumente gewählt, da dies den direkten Vergleich und die gemeinsame Auswertung von cisgender und transgender Personen erschwert hätte. Studien, die den Einsatz des BSRI bei Transgender-Populationen berichten, sind weiterhin selten. Mehrere frühere Untersuchungen in Spanien (Gòmez-Gil et al. 2012) und Polen (Herman-Jeglinska et al. 2002) haben das BSRI jedoch eingesetzt, um cisgender Kontrollgruppen und Transgender-Personen zu vergleichen. Beide Arbeiten zeigten, dass Transgender-Personen im BSRI entsprechend ihrer Geschlechtsidentität und nicht entsprechend ihres biologischen Geschlechts abschneiden. Diese Ergebnisse stützen das BSRI als ein hilfreiches Instrument zur Erfassung der Geschlechtsidentität, auch bei Transgender-Personen.
Erfassung der Hirnbildgebungsdaten
Unter Verwendung eines 3-Tesla-Siemens-Trio-MRT-Scanners (Siemens Medical Systems, Erlangen, Deutschland) an der Klinik für Psychiatrie, Psychotherapie und Psychosomatik des Universitätsklinikums der RWTH Aachen wurden für jeden Teilnehmer folgende Sequenzen über das gesamte Gehirn hinweg aufgenommen: (1) eine 4‑minütige T1‑gewichtete Magnetization Prepared – Rapid Gradient Echo (MP-RAGE) 3D-Messung (Repetitionszeit [TR] = 1900, Echozeit [TE] = 2,52, Inversionszeit [TI] = 900; α = 9°, Field of View (FoV) = 250 mm², Voxelgröße: 1 × 1 × 1 mm³, Schichten = 176) und (2) eine 6,2‑minütige T2*-gewichtete Echo-Planar-Imaging-Ruhebettungsbedingung (TR = 3000, TE = 35, α = 84°, FoV = 192 mm, Voxelgröße: 3 × 3 × 3 mm³, 44 Schichten, Abstand 15%, 64 × 64 Matrix, Wiederholungen = 124). Für die Ruhebedingung wurden die Teilnehmer gebeten, sich im Scanner zu entspannen, die Augen geöffnet zu halten und nicht einzuschlafen, was wir in Nachbefragungen nach dem Scan bestätigten.

Bild 1: Überblick über den Analyse-Workflow. Zeigt den Ablauf der Analysen sowohl für die funktionellen Bildgebungsdaten als auch für die Verhaltensdaten. Nach der Standardvorverarbeitung wurden Ruheaufnahmen aller 92 Teilnehmer einer ICA und Zeitreihenextraktion unterzogen, um raumzeitlich kohärente Netzwerke zu gewinnen. Die resultierenden Zeitverläufe jedes dieser Netzwerke wurden verwendet, um die funktionellen Konnektivitätsstärken zwischen den Netzwerken zu berechnen. Anschließend wandten wir eine Dimensionsreduktion mittels PCA auf diese Konnektivitätsindizes an. Das gleiche Verfahren zur Dimensionsreduktion wurde getrennt auch auf die Verhaltensdaten angewendet, also auf die Werte jedes Teilnehmers für die 60 Items des BSRI. Auf diese Weise erhielten wir 50 Hauptkomponenten der funktionellen Konnektivität und 25 Hauptkomponenten der BSRI-Items. Einerseits wurden die wesentlichen funktionellen Kopplungskomponenten in einen Maximum-Margin linearen Support-Vector-Klassifikator eingespeist, der nach Kreuzvalidierung zu den Werten der Vorhersagegenauigkeit führte, die bei zukünftig untersuchten Personen zu erwarten sind, wie in Bild 2 dargestellt. In einer separaten Analyse unserer Studie wurden sowohl die BSRI- als auch die Konnektivitätskomponenten gemeinsam in eine kanonische Korrelationsanalyse (CCA) eingespeist. Mittels 1000 Permutationsdurchläufen, die eine bestmögliche Signifikanzschwelle von 0,001 erlaubten, wurde eine Nullverteilung zufälliger Zusammenhänge zwischen Dynamik der Hirnnetzwerke und geschlechtsspezifischen Verhaltensneigungen über die Personen hinweg erzeugt. P-Werte wurden aus der Anzahl der Korrelationskoeffizienten r abgeleitet, die das Null-CCA-Modell übertrafen, und dieses nichtparametrische Hypothesentestverfahren ergab k = 9 statistisch signifikante CCA-Moden. Diese signifikanten Varianten der Gehirn-Geschlechts-Zusammenhänge sind in Bild 3 dargestellt. Eine explizite Korrektur für multiple Vergleiche wurde durchgeführt, indem alle geschätzten CCA-Moden durchsucht wurden (alle P < 0,001, family-wise-error-korrigiert).
Bildverarbeitung
Die Vorverarbeitung der fMRT-Daten wurde mit einer Standard-Pipeline durchgeführt, die räumliche und zeitliche Normalisierung der Daten sowie die Berücksichtigung von Kopfbewegungen im Scanner einschloss. Sämtliche Vorverarbeitung erfolgte mit dem FMRI Expert Analysis Tool Version 6.00, einem Bestandteil der Functional MRI of the Brain (FMRIB’s) Software Library. Die ersten drei Bilder jeder funktionellen Serie wurden verworfen, um T1-Sättigungseffekte zu vermeiden; die verbleibenden 121 Volumen wurden verwendet. Es wurde folgende Signalverarbeitung angewendet: Bewegungskorrektur mit dem Motion Correction FMRIB Linear Image Registration Tool (MCFLIRT) (Jenkinson et al. 2002), Entfernung von Nicht-Hirngewebe mit dem Brain Extraction Tool (BET) (Smith 2002), räumliche Glättung mit einem gaußschen Kern mit einer Halbwertsbreite (FWHM) von 6,0 mm, Normierung der mittleren Gesamtintensität des gesamten 4D-Datensatzes durch einen einzigen multiplikativen Faktor sowie Hochpass-Filterung in der Zeitdomäne (gaußsche gewichtete Kleinste-Quadrate-Anpassung einer Geraden mit Sigma = 360 s). Auf eine Tiefpassfilterung wurde verzichtet, um hochfrequente Anteile zu erhalten und den größtmöglichen Frequenzbereich beizubehalten. Die Registrierung auf hochaufgelöste strukturelle und/oder Standardraum-Bilder erfolgte mittels FMRIB Linear Image Registration Tool (FLIRT) (Jenkinson and Smith 2001). Die Registrierung vom hochaufgelösten strukturellen in den Standardraum wurde anschließend mit dem FMRIB Non-Linear Image Registration Tool (FNIRT) weiter verfeinert.
Zusätzliche Vorverarbeitungsschritte umfassten das Maskieren von Nicht-Hirn-Voxeln, das voxelweise Mittelwert-Subtrahieren der Daten sowie die Normalisierung der Daten in den Raum des Montreal Neurological Institute (MNI). Um scheinbare Korrelationen, die mit Kopfbewegungen bei allen 92 Teilnehmern zusammenhängen, weiter zu verringern, wurde die Varianz, die durch Kopfbewegung erklärt werden konnte, aus der Zeitreihe jedes Voxels entfernt. In Anlehnung an zuvor veröffentlichte Studien (Chai et al. 2012; Satterthwaite et al. 2013; Kernbach et al. 2018) entfernten wir Störsignale anhand von 24 Regressoren ohne Interesse: (1) die sechs aus der Bild-Realignmentprozedur abgeleiteten Bewegungsparameter, (2) ihre sechs ersten Ableitungen und (3) die jeweiligen 12 quadrierten Terme. Für diesen Regressionsansatz wurde gezeigt, dass er Spezifität und Sensitivität von funktionellen Konnektivitätsanalysen erhöht und valide Signalkorrelationen im Ruhezustand nachweist (Satterthwaite et al. 2013).
Statistische Analyse: Musterklassifikation von vier Geschlechtsgruppen anhand der Gehirnkonnektivität
Siehe auch Bild 1 für einen schematischen Überblick über alle in der vorliegenden Studie durchgeführten statistischen Analysen. Zunächst wollten wir korrelierte Muster funktioneller Konnektivität und Verhaltensdaten klassifizieren, die unseren vier Geschlechtsgruppen – Männer, Frauen, Transmänner und Transfrauen – gleichzeitig Rechnung tragen. Zu diesem Zweck verwendeten wir Maximum-Margin lineare Support-Vector-Maschinen (SVM; C-Hyperparameter auf Standardeinstellung gesetzt), um zu prüfen, ob ein 6‑minütiger Ruhe-fMRT-Scan eine Gruppierung der Teilnehmer entsprechend ihrer Geschlechtsidentität ermöglicht. SVMs wurden gewählt, weil sie wahrscheinlich der am weitesten verbreitete Musterklassifikationsalgorithmus in der Bioinformatik im Allgemeinen sind (Hastie et al. 2001) und bereits vielfach im Neuroimaging-Bereich eingesetzt wurden (z. B. Hanson and Halchenko 2008). Um Overfitting zu vermeiden, drückten wir die Ganzhirn-Zeitreihen-Karten in einer grundlegenden Netzwerkdarstellung als effektive Zusammenfassung der verteilten Datenvariation aus. Zunächst wurde auf Gruppenebene eine Independent Component Analysis (ICA) auf Basis einer zusammengefassten Teilstichprobe funktioneller Karten (25 fMRT-Scans, zufällig für jeden der Teilnehmer ausgewählt) durchgeführt und anschließend wurden 50 raumzeitliche Netzwerkeinheiten (Bzdok et al. 2016) für die weitere Analyse extrahiert (unter Wahrung der Blindheit gegenüber den Klassenlabels, vgl. Hastie et al. 2001). Zweitens wurde die funktionelle Konnektivität als lineare Korrelation zwischen jedem Paar des extrahierten Ensembles von 50 verteilten makroskopischen Netzwerken berechnet. Dieser Ansatz ergab bei jedem Teilnehmer 1225 einzigartige Kopplungsbeziehungen zwischen Netzwerken. Drittens wurden diese 1225, für jeden Teilnehmer spezifischen, Maße der Kommunikation zwischen Netzwerken mittels Hauptkomponentenanalyse (PCA) weiter reduziert, um 50 Ausprägungen der wichtigsten zugrunde liegenden Richtungen funktioneller Netzwerkvariation zu erhalten, die für jeden Teilnehmer charakteristisch sind.
Um eine unverzerrte Schätzung der in zukünftigen Hirnbildgebungsdaten zu erwartenden Leistungsfähigkeit zu erhalten, wurde eine Kreuzvalidierung mit 100 zufälligen, aber gruppenbalancierten Datensplits durchgeführt (Witten et al. 2009). 95% der Daten wurden für das Modelltraining und 5% der Daten für die Bewertung der Vorhersageleistung verwendet. Die Analysestrategie liefert Einblick darin, wie sich die neuronalen Signaturen von Männern, Transmännern, Frauen und Transfrauen bei der Vorhersage auf Ebene einzelner Probanden gegeneinander ausspielen. Konkret wurden prädiktive Modelle in einem Eins-gegen-den-Rest-Schema abgeleitet, bei dem jeder Subtyp gegen die drei übrigen Geschlechts-Subtypen klassifiziert wurde (Hastie et al. 2001). Auf diese Weise konnten wir zum Beispiel quantifizieren, wie viele Tm fälschlich als zur Gruppe der Männer, Frauen oder Tw zugehörig erkannt wurden.
Statistische Analyse: Extraktion kontinuierlicher Gehirn-Geschlecht Phänotypen
Anschließend wollten wir die Möglichkeit prüfen, kontinuierliche Zusammenhänge zwischen Gehirn und Verhalten, die der Geschlechtsvariabilität zugrunde liegen, zu erfassen. Wir erhoben hierzu detaillierte Informationen zur Geschlechtsidentität und Geschlechtsrolle, wie sie durch das BSRI bereitgestellt werden (Bem 1974). Das BSRI ist eines der wenigen empirisch fundierten Fragebögen, mit denen untersucht werden kann, wie Menschen sich im Hinblick auf Geschlecht einordnen (Lee 1982; Hoffman and Borders 2001). Das BSRI wurde entwickelt, um die Forschung zum Konzept der psychologischen Androgynie zu erleichtern, und präsentiert den Teilnehmern 60 verschiedene Persönlichkeitseigenschaften, anhand derer sie sich selbst auf einer 7‑stufigen Likert-Skala einschätzen, die von 1 (nie oder fast nie zutreffend) bis 7 (immer oder fast immer zutreffend) reicht. Unter diesen 60 Eigenschaften sind 20 stereotyp männlich (z. B. durchsetzungsfähig und dominant), 20 stereotyp weiblich (z. B. liebevoll und mitfühlend) und 20 als „Füllereigenschaften“ beschrieben, die als geschlechtsneutral gelten. Sowohl die typisch männlichen als auch die typisch weiblichen Eigenschaften im BSRI stellen kulturell wünschenswerte Eigenschaften für Männer bzw. Frauen dar, während 10 der geschlechtsneutralen Items als für beide Geschlechter wünschenswert konzeptualisiert wurden (z. B. anpassungsfähig und aufrichtig) und die anderen 10 als für beide Geschlechter unerwünscht (z. B. ineffizient, eifersüchtig) (Bem 1974). Für Versuche, Geschlechtszuweisungen anhand der im BSRI erfassten Verhaltensmerkmale vorzunehmen, verwendeten wir das ursprüngliche Median-Split-Auswertungsverfahren (Bem 1977). Wir nutzten die deutsche Version des BSRI, für die in einer Stichprobe von insgesamt 580 deutschen Männern und Frauen gute Validität und Reliabilität nachgewiesen wurden (Schneider-Düker and Kohler 1988). Für die hier berichteten kanonischen Korrelationsanalysen (CCA) verwendeten wir die Rohwerte jedes einzelnen BSRI-Items für jeden einzelnen Teilnehmer.
Über alle 92 Teilnehmer hinweg suchten wir nach dominanten Kopplungsregimen – „Moden“ der Populationsvariabilität –, die Aufschluss darüber geben, wie funktionelle Variation innerhalb funktioneller Netzwerke erklären kann, wie sich Personen in geschlechtstypischem Verhalten unterscheiden. Ein wichtiger Vorteil von Ruhe-fMRT-Daten im Vergleich zu aufgabenbasierter fMRT besteht darin, dass sie nicht durch die Anforderungen einer spezifischen Aufgabe beeinflusst werden, die die Ergebnisse in Bezug auf Geschlecht verfälschen könnte. Die Kombination beider Variablensätze (BSRI und Ruhe-fMRT) im Rahmen der CCA liefert uns eine neuartige Kombination aus Selbstbeurteilungsfragebogen und neurobiologischen Daten, anhand derer wir die Machbarkeit einer kontinuierlichen Gehirn-Geschlechts-Achse über die vier Teilnehmergruppen hinweg demonstrieren. CCA ist eine naheliegende Methode, um eine solche multivariate Entsprechung zwischen zwei hochdimensionalen Variablensätzen zu untersuchen. Für die CCA wurde dieselbe konnektomische Information verwendet wie in den oben beschriebenen SVM-Analysen. Ein erster Variablensatz X entsprach den individuellen Maßen der Kommunikation zwischen Netzwerken (92 × 50 Matrix), und ein zweiter Variablensatz Y wurde aus den Kopplungsstärken zwischen Netzwerken (92 × 25 BSRI-Items, durch PCA reduziert, um Overfitting zu vermeiden) konstruiert. Die CCA besteht darin, die kanonischen Vektoren u und v zu finden, die die symmetrische Beziehung zwischen einer linearen Kombination funktioneller Netzwerkkonnektivität (X) und einer linearen Kombination von Geschlechtsfacetten (Y) maximieren. Die multivariate Musterlernmethode deckt somit eine Reihe von funktionellen Konnektivitätsmoden auf, von denen jede die beiden Projektionen Xu und Yv identifiziert, die die maximale lineare Gleichzeitigkeit zwischen Mengen großskaliger Netzwerkkopplungen und Mengen von Verhaltensneigungen über unsere vier Geschlechtsgruppen hinweg ergeben.
Jedes geschätzte Gehirnsexusmuster wurde im Hinblick auf statistisch signifikante Robustheit anhand eines Hypothesentests in einem Permutationsverfahren geprüft, das in früheren Arbeiten eingesetzt wurde (Miller et al. 2016). Unter möglichst geringen Modellannahmen wurde eine Nullverteilung für die erzielte Korrelation zwischen den kanonischen Variationen aus der CCA-Analyse abgeleitet. In 1000 Permutationsdurchläufen, entsprechend einer bestmöglichen Signifikanzschwelle von 0,001, wurde die Konnektivitätsmatrix zwischen Netzwerken konstant gehalten, während die BSRI-Fragebogenitems teilnehmerweise zufällig durchmischt wurden. Die so konstruierten Surrogatdaten bewahrten die statistische Struktur, die für die funktionellen Netzwerkbeziehungen charakteristisch ist, ermöglichten aber gezielt die Zerstörung der Signalanteile, die mit geschlechtsspezifischem Verhalten zusammenhängen. Die hier erzeugte Verteilung spiegelte die Nullhypothese eines zufälligen Zusammenhangs zwischen Dynamik der Hirnnetzwerke und geschlechtsspezifischen Verhaltensneigungen über die Personen hinweg wider. In jedem Durchlauf wurde der Pearson-Korrelationskoeffizient zwischen den gestörten kanonischen Vektoren der Netzwerksseite und der Verhaltensseite aufgezeichnet, um eine Nullverteilung der Teststatistik zu erhalten. Die P-Werte wurden aus der Anzahl der Korrelationskoeffizienten r abgeleitet, die das Null-CCA-Modell übertrafen (Miller et al. 2016). Dieses nichtparametrische Hypothesentestverfahren ergab k = 9 hochsignifikante CCA-Moden, wobei eine explizite Korrektur für multiple Vergleiche durchgeführt wurde, indem alle geschätzten CCA-Moden durchsucht wurden (alle P < 0,001, family-wise-error-korrigiert). Unser CCA-Analyse-Workflow folgt damit direkt mehreren früheren Studien (Smith et al. 2015a, 2015b; Miller et al. 2016; Kernbach et al. 2018). Analog zu diesen Arbeiten hat die vorliegende Validierung mittels Permutationstest unter der Nullhypothese das Vertrauen gestärkt, dass unsere Modi der Gehirn-Verhaltens-Variation statistisch signifikant sind und nicht einfach durch Rauschen erklärt werden können.
Ergebnisse
Alle Teilnehmer waren rechtshändige, muttersprachlich deutschsprachige Personen, mit Ausnahme eines linkshändigen Teilnehmers in jeder der vier Gruppen. Die Händigkeit wurde mit Hilfe des Edinburgh Handedness Inventory erfasst (Oldfield 1971). Die Teilnehmer nahmen an zwei funktionellen MRT-Aufgaben teil, die teilweise andernorts berichtet wurden (Junger et al. 2014). Die vier Gruppen unterschieden sich nicht signifikant in der Anzahl der Ausbildungsjahre (F = 1,158, P = 0,331), jedoch zeigte sich ein kleiner Gruppenunterschied im Hinblick auf das Alter (F = 3,151, P = 0,029) (siehe Tabelle 1). Dies war auf das jüngere Alter der Transmänner-Gruppe im Vergleich zu den drei anderen Gruppen zurückzuführen.
Tabelle 1 Demografische Informationen der Teilnehmerstichprobe
| |
Weiblich (F) |
Männlich (M) |
Transmänner (Tm) |
Transfrauen (Tw) |
| Alter |
32 (11) |
32 (9) |
25 (7) |
31 (10) |
| Anzahl Ausbildungsjahre |
15 (3) |
15 (3) |
14 (2) |
14 (3) |
| Biologisches Geschlechts |
46 |
46 |
n.a. |
n.a. |
| Geschlechtsidentität |
23 |
23 |
23 |
23
|
Anmerkung: Die Tabelle enthält relevante demografische Informationen über die Teilnehmer (Mittelwerte, mit Standardabweichungen in Klammern), aufgeschlüsselt nach Gruppen. Da sich der Begriff „biologisches Geschlecht“ auf das anatomisch bestimmte Geschlecht bezieht, das Transgender‑Untergruppen nicht einschließt, bleiben die entsprechenden Zellen in der Tabelle leer.
Maschinelle Lernalgorithmen waren in der Lage, Männer (n = 23), Frauen (n = 23), Transmänner (n = 23) und Transfrauen (n = 23) anhand von Hirnscans der intrinsischen funktionellen Konnektivität genau zu unterscheiden (siehe Tabelle 1 für demografische Informationen). Im ersten Schritt überprüften wir den Nutzen unseres hirnbasierten Ansatzes zur Klassifikation männlicher und weiblicher Teilnehmer, indem wir unsere Musterklassifikationsergebnisse mit denen aus dem BSRI verglichen. Die ausschließliche Verwendung der BSRI-Daten ermöglichte es, männliche und weibliche Teilnehmer mit Genauigkeiten von 26% bzw. 43% zu klassifizieren (siehe Tabelle 2). Unsere algorithmusbasierte Klassifikation mit Hilfe der intrinsischen Konnektivität des Ruhegehirns (siehe Bild 2) ergab für männliche (52%) und weibliche (63%) Teilnehmer jeweils höhere Genauigkeiten (siehe Tabelle 2). Zu beachten ist, dass bei vier Gruppen die Zufallswahrscheinlichkeit einer korrekten Klassifikation bei 25% lag. Diese Klassifikationsleistung fungiert als Validitätsprüfung für unsere automatische Geschlechtsdetektion und zeigt, dass wir das biologische Geschlecht auf Grundlage unserer Ruhe-fMRT-Scans zuverlässig klassifizieren können. Die aus den Hirndaten abgeleiteten Geschlechtssignaturen ermöglichten damit Klassifikationsleistungen, die das normative Niveau eines weithin verwendeten Verhaltensfragebogens zur Geschlechtsidentität übertrafen.
Tabelle 2: Klinische und algorithmusbasierte Geschlechtsklassifikationen unserer Stichprobe
| |
Weiblich (F) |
Männlich (M) |
Transmänner (Tm) |
Transfrauen (Tw) |
| BSRI-Klassifikationsgenauigkeit pro Gruppe |
43% |
26% |
n.a. |
n.a. |
| SVM-Klassifikationsgenauigkeit pro Gruppe |
63% |
52% |
49% |
52% |
Anmerkung: Die Tabelle fasst die Genauigkeit zusammen, mit der Probanden sowohl anhand des BSRI als auch mit dem SVM-Verfahren als männlich oder weiblich klassifiziert wurden. Während die BSRI-Klassifikation ausschließlich auf Selbstangaben beruhte, basieren alle SVM-Klassifikationsergebnisse auf funktionellen Konnektivitätsdaten im Ruhezustand. Da das BSRI keine Klassifikation von Transmännern oder Transfrauen zulässt, bleiben diese Zellen leer.

Großbildansicht:
Bild 2: Männer, Frauen, Transmänner und Transfrauen können anhand der Gehirnkonnektivität erkannt werden. Jede Gehirndarstellung zeigt, wie das lokale Grausubstanzmuster zur Vorhersage eines bestimmten Subtyps (z. B. Mann) im Vergleich zu den drei übrigen Subtypen beiträgt. Die Konfusionsmatrix in der Mitte zeigt die Varianz der Untergruppenvorhersagen und dass sich alle Untergruppen ungefähr gleichermaßen darin irren, andere Untergruppen fälschlich vorherzusagen. SVM‑Algorithmen unterschieden alle vier Geschlechtsgruppen erfolgreich allein anhand der intrinsischen funktionellen Aktivität. Transgender-Teilnehmer wurden nicht bevorzugt als Männer oder Frauen klassifiziert. Diese beiden Geschlechtsgruppen waren demnach eindeutig in der Gehirnbiologie definiert und stellten keine bloßen Varianten männlicher oder weiblicher Gehirnaktivitätsmuster dar. Alle Zahlen in den Zellen geben die Prozentsätze an, mit denen ein bestimmtes Gruppenmitglied korrekt als zu dieser Gruppe zugehörig oder fälschlich als zu einer der drei anderen Gruppen zugehörig klassifiziert wurde. Auf der horizontalen Achse ist die tatsächliche Geschlechtsidentität aufgeführt, wie von den Teilnehmern selbst angegeben; auf der vertikalen Achse die Geschlechtsidentität, wie sie durch den SVM‑Algorithmus vorhergesagt wurde. Die diskriminativen Klassifikatorgewichte im gesamten Gehirn sind für jede Gruppe auf der MNI‑152‑Vorlage dargestellt. Rot‑bis‑Gelb‑Farben kennzeichnen Hirnregionen, aus denen der SVM‑Algorithmus die Geschlechtsidentität am besten erkennen konnte. Blau‑bis‑Grün‑Farben kennzeichnen Hirnregionen, aus denen der SVM‑Klassifikator Sicherheit dagegen aufbaute, dass die jeweils selbstberichtete Geschlechtsidentität vorliegt. Laterale prämotorische und superior-frontale Areale hatten eine hohe Vorhersagekraft für männliche Teilnehmer und umgekehrt für weibliche Teilnehmer. Bei Transfrauen umfassten die diskriminativen Regionen große Teile der temporalen, parietalen, okzipitalen, frontalen und subkortikalen Mittellinienareale. Die Gehirnsignatur der Transmänner war demgegenüber auf eine kleine Anzahl von Arealen in der hinteren Region des Temporalgyrus, im Prämotorcortex und im mittleren Frontallappen beschränkt.
Um neurobiologische Ausprägungen von Subtypen der Geschlechtsidentität jenseits der üblichen Geschlechtsdichotomisierung zu untersuchen, interessierte uns, wie gut der maschinelle Lernalgorithmus die beiden Transgender-Gruppen vorhersagen konnte. Im Einklang mit unserer Hypothese intermediärer Gehirnsexus-Typen konnten wir sowohl Transmänner als auch Transfrauen erfolgreich als neurobiologisch unterschiedliche Phänotypen identifizieren. Die Klassifikationsgenauigkeiten betrugen 49% für Transmänner und 52% für Transfrauen (siehe Bild 2 und Tabelle 2) im Vergleich zu einer Zufallsrate von jeweils 25%. Mit anderen Worten wurden Transgender-Personen nicht systematisch als in Richtung männlich oder weiblich verschoben fehlklassifiziert. Die aus den Hirndaten abgeleiteten Geschlechtssignaturen (siehe Bild 2) zeigen, dass jede der vier Gruppen mit einem eigenen, nicht überlappenden Muster diskriminativer Hirnregionen verbunden ist, wie es durch den Support-Vector-Klassifikator bestimmt wurde. Diese Bereiche kennzeichnen diejenigen Teile des Gehirns, anhand derer der Algorithmus die jeweiligen Gruppen am besten klassifizieren konnte.
Ein entscheidender Aspekt dieser Befunde ist, dass jede der vier Geschlechtsgruppen in unserer Stichprobe mit jeweils eigenen, nicht überlappenden Gehirnkonnektivitätsmustern verknüpft werden konnte, die sie von den jeweils drei anderen Gruppen unterscheiden. Männer und Frauen zeigten weitgehend unterschiedliche Muster in den superioren Frontallappen und prämotorischen Arealen: In unserem Datensatz sind diese Bereiche hochgradig prädiktiv für die korrekte Unterscheidung männlicher Teilnehmer, während das Gegenteil für weibliche Teilnehmer gilt. Frauen werden am besten durch ein Areal im inferioren Parietallappen vorhergesagt. Die erfolgreiche Vorhersage von Transmännern ist mit wenigen Arealen verbunden, die nahe der hinteren Region des Temporalgyrus, im Prämotorcortex und im mittleren Frontallappen liegen. Transfrauen hingegen wurden am besten anhand eines weitverbreiteten Musters identifiziert, das temporale, parietale, okzipitale und frontale Areale umfasst.
Der nächste Schritt unserer Analysen bestand darin, mittels CCA multivariate Zusammenhänge zwischen funktioneller Konnektivität und einer Reihe geschlechtscharakteristischer Verhaltensmerkmale aus dem BSRI über alle 92 Teilnehmer hinweg zu bestimmen. CCA erweitert die Idee der PCA auf zwei Datenmatrizen: Wir wollen zwei eindimensionale Projektionen der beiden Variablensätze finden, sodass die Korrelation zwischen diesen beiden Variablen maximiert wird. Ziel war es, Gehirnphänotypen für Geschlecht und Transgender direkt aus den Daten zu extrahieren. Diese Phänotypen sollten es ermöglichen, das gehirnbasierte Geschlechtsspektrum von Personen zu beschreiben, unabhängig von ihren körperlichen Geschlechtsmerkmalen. Das CCA-Verfahren war vollständig blind gegenüber der a-priori-Zuordnung jedes Teilnehmers zu einer der vier Geschlechtsgruppen. Auf der Grundlage der erklärten Kovarianz erreichten die ersten neun kanonischen Dimensionen Signifikanz (P < 0,001; nichtparametrischer Permutationstest, vgl. Methoden). Jede dieser neun kanonischen Dimensionen stellte ein eigenes Muster dar, das eine gewichtete Menge von BSRI-Antworten mit einer gewichteten Menge funktioneller Verbindungen verknüpft (siehe Bild 3). Somit konnten wir, ohne Informationen über die jeweilige Gruppe eines Teilnehmers zu nutzen, neun kanonische Dimensionen, oder Gehirnsexus-Achsen, bestimmen, die empfindlich auf Unterschiede zwischen cisgender und Transgender-Personen reagieren. Wie sich diese neun Gehirnsexus-Achsen sowohl auf Muster der Ruhe-Konnektivität als auch auf BSRI-Antwortmuster beziehen, ist in Bild 3 dargestellt.

Bild 3: Gehirnsexus-Achsen bei cisgender und Transgender-Teilnehmern. Um die Möglichkeit zu prüfen, kontinuierliche Gehirn-Verhaltens-Zusammenhänge, die geschlechtlicher Variabilität zugrunde liegen, umfassender zu untersuchen, werden aus der CCA neun Gehirnsexus-Achsen (d. h. kanonische Vektoren) abgeleitet. Hier zeigen wir, wie diese Achsen sowohl mit Mustern der Ruhekonnektivität (Panel A) als auch mit BSRI-Antwortmustern (Panel B) zusammenhängen. Die vorliegenden Gehirnsexus-Zusammenhänge bieten eine graduelle Darstellung, die cis Männer, cis Frauen, Transmänner und Transfrauen gemeinsam beschreibt. Durch kombinierte Analyse von BSRI-Daten und Ruhekonnektivität definieren wir kontinuierliche Dimensionen, die Gehirnsexus-Phänotypen zugrunde liegen. Bemerkenswert ist, dass dieser CCA-Ansatz blind gegenüber der Geschlechtsgruppe jedes der 92 Teilnehmer war, die nur in den dargestellten post-hoc-Assoziationen verwendet wurde. (A): Die Knoten des Kreises zeigen die 50 raumzeitlich kohärenten Hirnnetzwerke, die mittels ICA extrahiert wurden. Ihre Kanten geben die positive oder negative Bedeutung einer bestimmten Netzwerk‑Netzwerk‑Kopplung für jede der neun Gehirnsexus-Achsen an. Die identifizierten neun Gehirnsexus-Achsen stellen kontinuierliche Grade dar, die bei jedem der 92 Teilnehmer ausgeprägt sind und die vier a priori definierten Geschlechtsgruppen in Bezug auf ihre Beziehung zu den 50 verschiedenen Hirnnetzwerken überschreiten. Jede der neun Gehirnsexus-Achsen war mit einem spezifischen Konnektivitätsmuster unter den 50 Ruhe-Netzwerken verknüpft, die über ICA gewonnen wurden. Die Farben auf dem Kreis kennzeichnen ICA-Knoten, deren wechselseitige funktionelle Korrelationen in das CCA-Verfahren eingespeist wurden. Rote (blaue) Farbe zeigt eine erhöhte (verringerte) Konnektivität zwischen zwei Netzwerken an. (B): Die Relevanz der 60 geschlechtsbezogenen Items wird in ihrer Beziehung zu den neun Gehirnsexus-Achsen dargestellt. Die neun Gehirnsexus-Achsen bilden kontinuierliche Grade ab, die bei jedem der 92 Teilnehmer ausgeprägt sind und die vier a priori definierten Geschlechtsgruppen in Bezug auf ihre Beziehung zu den 60 Items des BSRI-Fragebogens geschlechtstypischer Merkmale überschreiten. Blaue (rote) Farbe zeigt eine positive (negative) Assoziation des jeweiligen Items mit einer bestimmten Gehirnsexus-Achse an.
Diskussion
Unsere Ergebnisse stützen die Schlussfolgerung, dass die beiden vorhandenen Kategorien „Mann“ und „Frau“ nicht ausreichen, um die tatsächlichen, heutigen Geschlechtsidentitätskategorien abzubilden. Die Geschlechtsidentität eines Menschen ist einer der wichtigsten Faktoren, die berufliche und persönliche Lebensverläufe in menschlichen Gesellschaften bestimmen. Geschlechtsunterscheidungen beeinflussen moderne Gesellschaften in Hinblick auf Einkommensniveau, Führungspositionen, Teilhabe, Gesundheit und akademischen Status. Wer nicht den gesellschaftlich etablierten Geschlechternormen entspricht, muss häufig mit Stigmatisierung, sozialem Ausschluss und diskriminierenden Praktiken rechnen, was sich wiederum nachteilig auf die körperliche und psychische Gesundheit auswirken kann. Viele frühere Studien zu Gehirnkorrelaten von Transgender haben insbesondere die Möglichkeit eines dimensionalen Geschlechtskonzepts vernachlässigt und damit eine sexuell dimorphe Sichtweise der Geschlechtsidentität verstärkt. Dies ist bedenklich angesichts des starken Anstiegs der Prävalenz von Geschlechtsinkongruenz und der damit verbundenen sozialen, psychologischen und finanziellen Belastungen für die Betroffenen und das Gesundheitssystem.
Die vorliegende Studie liefert wichtige quantitative Belege für zukünftige Entscheidungen im klinischen und gesellschaftlichen Kontext. Wir untermauern die Existenz spezifischer intermediärer Phänotypen der Geschlechtsidentität: Neben männlichen und weiblichen Teilnehmern konnte unser Support‑Vector‑Klassifikator sowohl Transfrauen als auch Transmänner als eigene Geschlechtsgruppen vorhersagen, mit Vorhersagegenauigkeiten oberhalb des Zufallsniveaus für alle vier Gruppen. Transgender‑Untergruppen wurden mit Vorhersagegenauigkeiten identifiziert, die mit denen von Männern und Frauen vergleichbar waren, und sie wurden nicht systematisch als in Richtung männlich oder weiblich verschoben fehlklassifiziert. Diese Ergebnisse unterstützen klar eine dimensionale Geschlechtsperspektive, die vier unterscheidbare Gehirnphänotypen der Geschlechtsidentität erfasst. Da Transfrauen und Transmänner nicht in erster Linie als Männer oder Frauen „fehlklassifiziert“ wurden, stellen diese beiden Gruppen eigenständige Geschlechts‑Subtypen dar, die mit jeweils spezifischen Gehirnphänotypen verbunden sind. Die Verwendung einer einfachen binären Geschlechtsvariable führt daher zu einer Übervereinfachung, die das tatsächliche Spektrum menschlicher Geschlechtsidentitäten nicht adäquat abbildet.
Interessanterweise haben verhaltensbezogene Studien gezeigt, dass die anhand des BSRI erzielten Geschlechtskategorisierungen mit verschiedenen stereotypen geschlechtstypischen Verhaltensweisen korrelieren (Lee 1982; Hoffman and Borders 2001). Trotz seiner nunmehr über 30‑jährigen, weit verbreiteten Verwendung ist das BSRI auch im Hinblick auf seine theoretische Grundlage, die Auswertungsmethoden und das Vorgehen bei der Itemauswahl kritisiert worden (Hoffman and Borders 2001). Die meisten Kritiken bezogen sich auf die Idee, Personen ausschließlich auf Basis der BSRI‑Skalen zu labeln: Allein aus diesem Instrument Schlussfolgerungen zu ziehen, kann zu stark heterogenen Ergebnissen und falschen Schlussfolgerungen führen. Wir halten dies in der vorliegenden Studie aus folgendem Grund für unerheblich: In unserem Ansatz wird das BSRI nicht eingesetzt, um eindeutige Vorhersagen hinsichtlich männlicher oder weiblicher Kategorisierungen zu treffen. Vielmehr versuchen wir das Gegenteil: Indem wir zusätzlich zu neurobiologischen Messungen BSRI‑Daten der Teilnehmer erheben und anschließend beide Variablensätze kombinieren, stützen wir uns ausdrücklich nicht auf einen einzelnen Fragebogen. Und trotz einiger Kritik gilt das BSRI weiterhin als valides Maß für Geschlechtsidentität und hat zweifellos wertvolle Impulse für Forschung und Diskussion zu geschlechtsbezogenen Konstrukten und Stereotypen geliefert (Beere 1990; Hoffman and Borders 2001). Das BSRI hat sich zur bevorzugten Methode für die Mehrheit der Forscher entwickelt, die Geschlechtsidentität untersuchen, und hat sich in unterschiedlichen kulturellen Kontexten als effektiv erwiesen (Hoffman und Borders 2001).
Ein Aspekt, der in unseren Analysen nicht berücksichtigt wurde, war der Einfluss von Hormonbehandlung und Menstruationszyklus auf die beobachteten Unterschiede in den Ruhenetzwerken. Frühere Studien unserer Arbeitsgruppe und eines anderen Labors haben gezeigt, dass das Vorliegen oder Nichtvorliegen einer Hormonbehandlung sowie der Menstruationszyklus die funktionelle Konnektivität des Gehirns nicht wesentlich beeinflussen (Van Goozen et al. 2002; Junger et al. 2014). Selbst bei expliziter Kontrolle des Hormon- bzw. Menstruationsstatus wurden keine Unterschiede zwischen geschlechtsdysphorischen Personen festgestellt. Andererseits gibt es Studien, die hormonelle Effekte auf Ruhenetzwerke gefunden haben. Diese Effekte traten ausschließlich bei Transmännern und nicht bei Transfrauen auf und waren räumlich auf den Frontalkortex und das Kleinhirn begrenzt (Mueller et al. 2017b). In einer weiteren Studie mit einem Vergleich zwischen Transmännern und cisgeschlechtlichen Kontrollpersonen wurden signifikante Veränderungen der funktionellen Konnektivität zwischen parietalen und frontalen Regionen infolge einer Hormonbehandlung berichtet (Burke et al. 2018). Unterschiede in Maßen der Ruhe-Konnektivität aufgrund hormoneller Effekte scheinen daher bei Transmännern ausgeprägter zu sein und eher subtil, falls überhaupt vorhanden. Das genaue Verständnis der Natur solcher Mechanismen wird ein wichtiges Ziel zukünftiger Studien sein, idealerweise unter Einsatz multimodaler, longitudinaler Ansätze in umfangreichen Stichproben mit sowohl Transmännern als auch Transfrauen. Darüber hinaus erkennen wir an, dass zukünftige Studien zusätzliche Informationen zur Wahrnehmung der Geschlechtsinkongruenz, zur sexuellen Orientierung der Probanden sowie zum Beginn und zur genauen Art der Behandlung erfassen sollten. Diese Faktoren könnten die Gehirnphänotypen, die der Geschlechtsidentität zugrunde liegen, weiter beeinflussen.
Im Gegensatz zu unserer fMRT-Konnektivitätsuntersuchung konzentrierten sich viele frühere Neuroimaging-Studien zur Geschlechtsidentität auf Unterschiede im Hirnvolumen. Insgesamt sind die Ergebnisse der Untersuchungen zur strukturellen Neuroanatomie stark uneinheitlich, meist auf eine einzelne oder wenige Hirnregionen fokussiert und in vielen Fällen sogar widersprüchlich. Die Befunde reichen typischerweise von keinen Unterschieden zwischen Männern und Transfrauen (Savic and Arver 2011), über Unterschiede zwischen Transfrauen und sowohl Männern als auch Frauen (Luders et al. 2009), bis hin zu einer Zwischenposition der Transfrauen zwischen männlichen und weiblichen Gehirnen (Rametti et al. 2011). Während die ersten beiden Studien Volumenunterschiede der grauen Substanz untersuchten, analysierte Rametti et al. (2011) die fraktionelle Anisotropie von Faserbahnen der weißen Substanz. Insgesamt deuten diese Untersuchungen darauf hin, dass sich insbesondere der Hypothalamus und andere subkortikale Strukturen in Größe oder Dicke zwischen Transgender- und Cisgender-Personen unterscheiden. Mit Blick auf einen anderen Aspekt der Gehirnanatomie konzentrierten sich weitere Studien auf Vergleiche der kortikalen Dicke zwischen Transgender-Personen und Cisgender-Kontrollen. Zubiaurre-Elorza et al. (2013) fanden Hinweise auf eine Maskulinisierung der subkortikalen grauen Substanz bei Transmännern und eine Feminisierung bei Transfrauen, jeweils rechtslateralisiert. Luders et al. (2012) konnten die kortikale Dicke ebenfalls mit der Geschlechtsidentität in Verbindung bringen, indem sie in mehreren Regionen beider Hemisphären über das gesamte Gehirn verteilt eine dickere Hirnrinde bei Transfrauen im Vergleich zu cisgeschlechtlichen männlichen Kontrollen nachwiesen. Schließlich berichten Manzouri und Savic (2018) multimodale Bildgebungsdaten, konzentrieren sich jedoch hauptsächlich auf die kortikale Dicke, für eine umfangreiche Stichprobe von Transmännern, Transfrauen sowie hetero- und homosexuellen Kontrollen. Für sowohl Transmänner als auch Transfrauen zeigen sie eine erhöhte kortikale Dicke sowie schwächere strukturelle und funktionelle Verbindungen im anterioren cingulären Cortex–Precuneus und im rechten occipito-parietalen Cortex, also in Regionen, die für die Vermittlung der Selbstkörperwahrnehmung bekannt sind. Die Autoren legen nahe, dass der höhere Anteil homosexueller Personen in den Transgender-Gruppen Gehirnunterschiede beeinflussen könnte und dass eine Kontrolle bzw. Korrektur für sexuelle Orientierung einen erheblichen Einfluss auf neuroimagingbezogene Ergebnisse haben kann (Manzouri and Savic 2018).
Der kleinste gemeinsame Nenner all dieser Studien zur Hirnanatomie ist, dass Transmänner und Transfrauen einen intermediären Phänotyp darstellen, der sich im Verlauf einer gegengeschlechtlichen Hormontherapie zunehmend in Richtung des gewünschten Geschlechts zu verschieben scheint (Mueller et al. 2017a). Im Lichte unserer aktuellen und früheren (Clemens et al. 2017) Befunde zur Ruhekonnektivität stimmen wir dieser Aussage zu und untermauern die Existenz intermediärer Geschlechtsphänotypen für Transmänner und Transfrauen, die sich in Bezug auf Hirnanatomie und funktionelle Konnektivität nicht mit Männern und Frauen zusammenfassen lassen. Frühere Befunde aus fMRT-Studien zu Transgender werden typischerweise streng im Vergleich zu Männern und Frauen interpretiert und vernachlässigen die Möglichkeit, dass Transmänner und Transfrauen durch eigene, spezifische Signaturen im Gehirn gekennzeichnet sein könnten. Ähnlich wie strukturelle MRT-Studien liefern diese aufgabenbasierten und Ruhe-fMRT-Studien ein komplexes und oft widersprüchliches Bild mit Aktivierungsähnlichkeiten und -unterschieden zwischen Transgender-Personen und ihren cisgender Pendants (Mueller et al. 2017a).
Neurobiologischen Theorien zufolge (Garcia-Falgueras and Swaab 2009; Mueller et al. 2017a) könnte eine kombinierte Einwirkung aus der Inkongruenz zwischen hormonellen Effekten auf körperliche Geschlechtsmerkmale und Gehirnsexus sowie mehreren genetischen Faktoren die Entstehung von Transgender erklären. Eine Diskrepanz zwischen Hirn- und Genitaldifferenzierung, verursacht durch genetische und hormonelle Faktoren, spielt somit eine wichtige Rolle bei der Erklärung der Ätiologie von Transgender. Hinsichtlich genetischer Faktoren ist jedoch wichtig zu betonen, dass bislang überzeugende Belege für ein einzelnes Gen, das direkt mit Transgender verknüpft ist, fehlen. Am wahrscheinlichsten entstehen Phänotypen, die mit Transgender und Geschlechtsinkongruenz zusammenhängen, aus der Ausprägung polygenetischer Genotypen bzw. mehrerer Gene (Zucker et al. 2016). Außerdem betonen Guillamon et al. (2016) Unterschiede in der Hirnmorphologie zwischen homo- und heterosexuellen Transfrauen. Auf Grundlage von kortikaler Dicke, Diffusions-Tensor-Bildgebung und postmortalen Studien schlagen sie vor, dass die beobachteten Unterschiede zwischen homosexuellen Transfrauen und Transmännern sowie cis männlichen und cis weiblichen Kontrollen auf unterschiedlich getimtes kortikales Ausdünnen in verschiedenen Hirnregionen in jeder Gruppe zurückgehen. Dieser differenzielle Prozess der kortikalen Ausdünnung könnte in erster Linie auf atypische Effekte von Sexualhormonen und zugehörigen Metaboliten zurückzuführen sein. Während dieser Aspekt differenzieller kortikaler Entwicklung für die Entstehung von Geschlechtsinkongruenz wichtig sein könnte, haben andere Ansätze die Inkongruenz zwischen Wahrnehmung des eigenen Körpers und Selbst betont (Manzouri and Savic 2018). Sie führen aus, dass insbesondere das Entstehen einer männlichen oder weiblichen Identität stark durch die frühe Entwicklung einer männlichen oder weiblichen Körper-Selbst-Wahrnehmung beeinflusst wird. Dementsprechend könnten die zugrunde liegenden neurobiologischen Mechanismen von Geschlechtsinkongruenz und Transgender mit kortiko-subkortikalen Netzwerken verknüpft sein, die die Selbstkörperwahrnehmung vermitteln und durch bestimmte entwicklungsbedingte und erworbene Veränderungen beeinflusst werden könnten (Manzouri and Savic 2018). Unter Berücksichtigung dieser verschiedenen theoretischen Ansätze und unserer eigenen Ergebnisse schlagen wir vor, dass die neurobiologischen Mechanismen, die Transgender zugrunde liegen, komplexe Hirnnetzwerke umfassen, die Körperwahrnehmung und andere selbstreflektierende kognitive Funktionen verarbeiten. Eine Mischung aus entwicklungsbedingten, hormonellen und genetischen Faktoren, insbesondere während Jugend und Adoleszenz, könnte diese Netzwerke beeinflussen und zu Veränderungen sowohl der funktionellen als auch der strukturellen Konnektivität führen. Aus klinischer Sicht wäre es am sinnvollsten zu prüfen, ob die in dieser und anderen Studien beobachteten Gehirnphänotypen von Transgender-Personen unter Hormonbehandlung langfristige Veränderungen aufweisen und ob sich dabei eine Verschiebung hin zu einem Risikoprofil für bestimmte gehirnbasierte Erkrankungen zeigt. Optimalerweise sollten Initiativen zur weiteren Klärung dieser Frage longitudinale Studien mit gepoolten Transgender-Stichproben sowie multimodale Bildgebung und multivariate Musterklassifikation einbeziehen.
Mithilfe eines komplexen maschinellen Lernansatzes zeigen wir, dass sich die Geschlechtsidentität anhand von Gehirn‑Verhaltens‑Phänotypen vorhersagen lässt. Die Tatsache, dass die Datenerhebung weniger als 90 Minuten in Anspruch nimmt und MRT-Geräte weit verbreitet verfügbar sind, macht dieses Vorgehen besonders attraktiv. Der Einsatz solcher datengesteuerter Methoden zur Gewinnung zusätzlicher Informationen über die Geschlechtsidentität einer Person könnte in Zukunft objektivere Daten liefern als die oftmals eher subjektive klinische Beurteilung. Das übergeordnete Ziel der Implementierung solcher maschinellen Lernverfahren bei der Klassifikation von Geschlechtsidentität besteht darin, ergänzende, neurobiologisch validierte Informationen bereitzustellen, die nicht durch gesellschaftlichen Druck oder soziale Erwünschtheit beeinflusst sind – für Kliniker und Patienten gleichermaßen. Wir sind überzeugt, dass die Erhebung und Bereitstellung solcher Informationen vielen Personen und ihren Angehörigen, die mit Problemen im Zusammenhang mit Geschlechtsidentität konfrontiert sind, wichtige zusätzliche Entscheidungsgrundlagen liefern wird. Das Ziel besteht darin, Betroffenen von Geschlechtsinkongruenz zu helfen, Entscheidungen im Lichte aller verfügbaren Evidenz zu treffen, wobei nicht nur die vorliegende Studie, sondern auch zukünftige Arbeiten herangezogen werden sollten, die unsere Ergebnisse in größeren Stichproben replizieren und erweitern. Wir behaupten daher keineswegs, dass klinische Beurteilungen und andere Standarddiagnostik im Kontext von Transgender abgeschafft werden sollten. Vielmehr liefern wir zusätzliche Daten, um die Entscheidungsfindung für Personen mit Geschlechtsinkongruenz zu unterstützen und zu optimieren. Ziel ist es, eine präzise biologische Charakterisierung von Transgender und Geschlechtsidentität zu etablieren, die wiederum zu einer frühzeitigen Identifikation und medizinischen Begleitung von Transgender-Personen beitragen könnte. Dieser Ansatz würde einen wichtigen Schritt hin zu datengesteuerten diagnostischen Markern darstellen, die neurobiologische und Verhaltensunterschiede in einem integrativen Modellierungsansatz berücksichtigen. Ein solches Vorgehen steht im Einklang mit der Entwicklung der Research Domain Criteria des National Institute of Mental Health, die darauf abzielen, einen biologisch fundierten Rahmen für die transdiagnostische Charakterisierung biologischer Marker zu schaffen (Cuthbert and Insel 2013).
Schlussfolgerungen
Hier erweitern wir das bisherige Wissen über die menschliche Geschlechtsidentität, indem wir zeigen, dass Transmänner und Transfrauen mithilfe zweier Algorithmen des maschinellen Lernens und Hirnbildgebungsdaten separate und graduelle Subtypen der Geschlechtsidentität darstellen. Auch wenn wir mindestens vier unterscheidbare Subtypen der Geschlechtsidentität gefunden haben, ist zu beachten, dass dieses Ergebnis teilweise auf inhärente Einschränkungen unseres analytischen Ansatzes zurückzuführen sein könnte und dass weitere Subtypen der Geschlechtsidentität existieren könnten. Wir erkennen daher an, dass unsere Ergebnisse nur erste Schritte zur Aufklärung der Grundlagen der Geschlechtsidentität im Gehirn darstellen können. Angesichts der herausfordernden Rekrutierung unserer einzigartigen Stichprobe sind wir zufrieden mit einer ausreichenden Stichprobengröße, die eine Vorhersagegenauigkeit an bislang nicht gesehenen Fällen deutlich über dem Zufallsniveau zeigte. Während zukünftige Studien unsere Befunde bestätigen müssen, haben wir erste Schritte zu einer nuancierteren Konzeptualisierung des Geschlechtsdimorphismus unternommen. Diese ersten Schritte sollten helfen, sich vom binären Geschlechtskonzept zu lösen und damit den Druck von Transgender- und intersexuellen Personen zu nehmen, sich in eine von zwei Kategorien einordnen zu müssen. Wir sollten die Art und Weise, wie wir über Transgender und andere Bedingungen sprechen und denken, die nicht mit den in modernen Gesellschaften vorherrschenden traditionellen Geschlechtskonzepten übereinstimmen, neu definieren.
Förderung
Deutsche Forschungsgemeinschaft (DFG: HA 3202/7-1 und IRTG 1328); das START-Programm 34/13 und die Brain Imaging Facility des Interdisziplinären Zentrums für Klinische Forschung der Medizinischen Fakultät der RWTH Aachen, Deutschland. D.B. wurde gefördert durch die Deutsche Forschungsgemeinschaft (DFG, BZ2/2-1, BZ2/3-1 und BZ2/4-1; International Research Training Group IRTG2150); Amazon AWS Research Grant (2016 und 2017); die Studienstiftung des Deutschen Volkes sowie das START-Programm der Medizinischen Fakultät (126/16) und den Exploratory Research Space (OPSF449), RWTH Aachen.
Anmerkungen
Die Autoren danken Sabine Bröhr, Cordula Kemper, Maria Peters, David Weyer und Teresa Karrer für ihre Hilfe und Unterstützung. Insbesondere sind wir allen Selbsthilfegruppen, Webforen und Teilnehmern zu großem Dank verpflichtet, deren engagierte Unterstützung und Ausdauer diese Studie ermöglicht haben. Interessenkonflikte: Die Autoren berichten über keine biomedizinischen finanziellen Interessen oder Interessenkonflikte.
Autorenbeiträge
U.H., B.D., E.S., J.N., J.J., T.A., F.S. und B.C. entwickelten das Studiendesign und warben die Finanzierung ein. J.J., E.S. und B.C. waren für die Datenerhebung verantwortlich. D.B., G.M. und B.C. analysierten die Daten. B.C. verfasste den ersten Entwurf des Manuskripts und bereitete die Abbildungen vor. Alle Autoren lasen, genehmigten und trugen zur endgültigen Fassung des Manuskripts bei.