Die Entstehung eines ausdifferenzierten Arbeitsmarkts in Österreich
Das Projekt Historical Job Ads untersucht anhand von Stellenanzeigen aus etwa 100 Jahren (1850-1949), wie sich der österreichische Arbeitsmarkt entwickelt und ausdifferenziert hat. Dafür nutzen wir das Archiv der Österreichischen Nationalbibliothek, die bereits digitalisierte Versionen vieler österreichischer Zeitungen zur Verfügung stellt. Aus diesem Fundus verwenden wir die Anzeigenseiten der 29 auflagenstärksten deutsch-sprachigen Zeitungen und isolieren die einzelnen Stellenanzeigen. Während das menschliche Auge Stellenanzeigen sehr schnell erkennt, muss ein Algorithmus darauf trainiert werden, was angesichts der unterschiedlichen Struktur, Größe und Aussagen der Stellenanzeigen eine größere Herausforderung darstellt. Wir werden aber computergestützte Lösungen finden müssen, weil die knapp 8 Millionen Zeitungsseiten der 29 Zeitungen nicht manuell ausgewertet werden können.
Mit der Datenbank der Stellenanzeigen schaffen wir, erstens, eine neue Datenquelle qualitativer Forschung im Bereich der Sozialwissenschaften. Anzeigen und Kleinanzeigen sind ein Mittel individuelle Angebots- und Nachfragewünsche einer unstrukturierten und unbekannten „anderen Marktseite“ bekannt zu machen. Von den verschiedensten Waren und Dienstleistungen, die der Anzeigenteil umfasst, werden wir uns in diesem Projekt nur mit den Stellenanzeigen näher beschäftigen. Diese sind ein dezentrales, unverfälschtes Instrument der recht ungerichteten Informationsübertragung, die ein Matching von suchendem Unternehmen und suchender/m Interessierter/n möglich machen kann und soll. Der Inhalt dieser Anzeigen hat sich in den 100 Jahren sehr verändert, was uns Rückschlüsse auf die Änderung des Arbeitsmarktes erlaubt. Diese Änderungen zu dokumentieren und zu analysieren ist das zweite Ziel unseres Projekts.
Drittens, werden wir verschiedene Methoden der Texterkennung und Textverarbeitung verwenden und gegebenenfalls weiterentwickeln. Die Herausforderungen bei der Textanalyse kommen aus der speziellen Struktur von Anzeigen, die kurz und heterogen und durch eine spezielle, auf Kürze ausgerichtete Sprachstruktur gekennzeichnet ist. Standardalgorithmen werden also nicht ausreichen. Dafür erlaubt uns ein Datensatz mit vielen Stellenanzeigen, einen Bereich in der makroökonomischen Arbeitsmarktforschung mit Details anzureichern, der derzeit noch von vielen Vereinfachungen und Homogenisierungen gekennzeichnet ist.