830 romans policiers identifiés dans le corpus Gallica par classification supervisée et correction par graphe de similarité.
830
Romans identifiés
1880–1930
Période d'essor
Méthode
Identification du genre
Amorce d'entraînement. Romans policiers historiques tirés de la liste Boltanski–Esquenazi du genre, complétés par des œuvres canoniques de Gaboriau, Du Boisgobey, Leroux, Leblanc, Souvestre et Allain.
Classifieur. SVM linéaire sur représentation BoW (5 000 mots les plus fréquents).
Correction par graphe. Construction d'un graphe k-NN sur des embeddings de paragraphes ; protocole identique au sous-corpus aventures.
Les scores d'appartenance pour ce sous-corpus seront ajoutés dans une mise à jour ultérieure.