notesjor corpus-collection

Free corpora (over 6 billion tokens) mostly German (both historically and in contemporary German).

🔗 Visiter notesjor corpus-collection
🗣️ Deutsch📅 15 avril 2026

Description

Free corpora (over 6 billion tokens) mostly German (both historically and in contemporary German).

💬 Notre avis

Le site notes.jan-oliver-ruediger.de/korpora/ propose une collection de corpus linguistiques impressionnante, avec plus de 6 milliards de tokens, principalement en allemand. C'est une ressource précieuse pour les chercheurs et les étudiants en linguistique, mais il faut savoir que la majorité des corpus sont en allemand, ce qui peut limiter son utilité pour ceux qui cherchent des données dans d'autres langues. L'accès est gratuit, ce qui est un avantage considérable, surtout pour un outil de cette ampleur. Cependant, le site n'est pas très connu, ce qui peut susciter des doutes quant à sa fiabilité et à la mise à jour régulière des données. Il n'y a pas de frais cachés, mais il est important de vérifier la qualité des corpus disponibles. Si tu cherches des alternatives, des sites comme Sketch Engine ou Corpus of Contemporary American English pourraient être intéressants, surtout si tu as besoin de corpus dans d'autres langues que l'allemand. En somme, c'est un bon point de départ pour ceux qui se concentrent sur la langue allemande, mais il faut être conscient des limitations.

📊 Score global

45Moyen
🌐Disponibilité15/100Faible

1 langue · 0 plateforme

📄Fiche75/100Bien

Complétude de la fiche d'info

🤖 Fiche enrichie

💰 Modèle tarifaire🆓 Gratuit
👥 Public cibleChercheurs, étudiants, linguistes
🗣️ Languesde
🌍 Pays ciblesMonde
👍

Points positifs

Accès gratuit

Grande quantité de données

Ressource utile pour la linguistique

👎

Points négatifs

Majorité des données en allemand

Peu connu

Mise à jour incertaine