Un instant...

Le corpus



Le corpus est actuellement composé de 788 sonnets, principalement du 19e siècle. Les 16 auteurs suivants sont représentés :

  • Théodore de Banville (1823 – 1891) - 35 poèmes
  • Charles Baudelaire (1821 – 1867) - 71 poèmes
  • François Coppée (1842 – 1908) - 26 poèmes
  • Charles Cros (1842 – 1894) - 50 poèmes
  • Théophile Gautier (1811 – 1872) - 56 poèmes
  • José-Maria de Heredia (1842 – 1893) - 127 poèmes
  • Victor Hugo (1802 – 1885) - 4 poèmes
  • Leconte de Lisle (1818 -1894) - 24 poèmes
  • Stéphane Mallarmé (1842 – 1898) - 30 poèmes
  • Alfred de Musset (1810 – 1857) - 19 poèmes
  • Gérard de Nerval (1808 – 1855) - 168 poèmes
  • Sully Prudhomme (1839 – 1907) - 144 poèmes
  • Arthur Rimbaud(1854 -1891) - 216 poèmes
  • Charles-Augustin Sainte-Beuve (1804 – 1869) - 54 poèmes
  • Paul Verlaine (1844 – 1896) - 112 poèmes
  • Alfred de Vigny (1797 – 1863) - 1 poème

Le corpus a été constitué à partir d'oeuvres disponibles en ligne (principalement issues de Wikisource), en partie vérifié et corrigé à la main. Il est de composition assez inégale : certains auteurs n'ont que très peu de sonnets, d'autres sont totalament absents. C'est le cas par exemple de Tristan Corbière, Judith Mendes ou encore Louise Colet, pour ne citer que ces trois là. Notons qu'aucune auteure féminine n'est présente actuellement dans le corpus.  Nous espérons pallier ce manque et atteindre une meilleure représentatativité des productions de sonnets grâce à une partenariat en cours avec la Bibliothèque nationale de France.

Enrichir le corpus, nous permettrait non seulement de diversifier les auteurs présents dans la base mais aussi d'élargir son empan temporel. C'est une priorité du projet pour les mois à venir.

Des expériences avec des corpus particuliers (par exemple avec des auteurs contemporains dont les oeuvres sont encore sous droits) sont envisagées mais sont plus difficiles à mettre en oeuvre et à rendre piubliques, pour des raisons évidentes.