jeanluc.lauzon · PyLaia · Published December 21, 2025

Les notaires montréalais V3 17e siècle Nouvelle-France

Text Recognition

Description

Ce modèle a été développé dans le cadre du projet « Donner le goût de l’archive à l’ère numérique » (https://donner-le-gout-de-larchive.weebly.com), une collaboration entre l’Université de Montréal, Bibliothèque et Archives nationales du Québec, la Société de recherches Archiv-Histo et l’Atelier permanent d’analyse documentaire – volet transcription. Le modèle est fondé sur les actes notariés d’Adhémar (actes 1–200), Basset (actes 1–600), Bourgine (partiel), Closse, Frérot, Gastineau, Maugue (actes 1–200), Ménard, Moreau (partiel), Mouchy, Oudain, Rémy et St-Père, ainsi que partiellement sur les greffes de plusieurs autres notaires, pour un total d’environ 6600 pages. This model was developed as part of the project “Donner le goût de l’archive à l’ère numérique” (https://donner-le-gout-de-larchive.weebly.com), a collaboration between the Université de Montréal, Bibliothèque et Archives nationales du Québec, the Société de recherches Archiv-Histo, and the Atelier permanent d’analyse documentaire – Transcription section. The model is based on notarial deeds from Adhémar (acts 1–200), Basset (acts 1–600), Closse, Frérot, Gastineau, Maugue (acts 1–200), Ménard, Mouchy, Oudain, Rémy, and St-Père, as well as partially on the records of several other notaries, totaling about 6,600 pages.

Try this model

Les notaires montréalais V3 17e siècle Nouvelle-France
Use this modelOpen in Transkribus
Low error rate8.99% CER

Character Error Rate (CER) measures the percentage of characters incorrectly recognised. Lower is better. This model scored 8.99% on its validation set. As a rule of thumb, a CER below 10% is considered good for most handwritten material. This is a larger model trained on diverse material, which generally makes it more robust across different handwriting styles. That said, larger training sets also make it harder to push the CER down further.

Measured on the model's own validation data. Results on your documents may differ depending on handwriting style, document condition, language, and how closely your material resembles the training data.

Words1,176,725
Lines186,029
Training Pages6,615
Model ID456825
Languages
French
Centuries
17th c.