BNC - British National Corpus

Corpus de la langue anglais contemporaine, écrite et parlée. Il contient environ 100 millions de mots : 90% provenant de la langue écrite et 10% de textes parlés transcrits orthographiquement. Chaque mot est lemmatisé et replacé dans son contexte textuel. Les textes correspondants sont également mentionnés avec des informations détaillées métatextuelles. Le corpus est au format XML ;il est piloté par un outil de recherche spécifique : Xaira. L'accès est libre sur l'intégralité du corpus mais les environnements textuels sont limités à 50 exemples. D'autres possibilités d'accès sont proposées sur le site : elles peuvent demander la création d'un compte personnel, gratuit.

Langues disponibles : Anglais