← Retour au corpus général
Sous-corpus générique

Le roman policier

830 romans policiers identifiés dans le corpus Gallica par classification supervisée et correction par graphe de similarité.

830
Romans identifiés
1880–1930
Période d'essor

Identification du genre

Amorce d'entraînement. Romans policiers historiques tirés de la liste Boltanski–Esquenazi du genre, complétés par des œuvres canoniques de Gaboriau, Du Boisgobey, Leroux, Leblanc, Souvestre et Allain.

Classifieur. SVM linéaire sur représentation BoW (5 000 mots les plus fréquents).

Correction par graphe. Construction d'un graphe k-NN sur des embeddings de paragraphes ; protocole identique au sous-corpus aventures.

Les scores d'appartenance pour ce sous-corpus seront ajoutés dans une mise à jour ultérieure.

Parcourir le corpus

Auteur Dates Titre Année Score