Le service accepte les formats de fichiers suivants : pdf, doc, docx, rdf, txt. Les formats html et xml seront bientôt pris également en charge. :) A noter que pour de meilleurs résultats il est conseillé d'utiliser un format de texte brut, c'est à dire 'txt'.
Dans le cas où votre corpus est composé de plusieurs fichiers séparés (préférable à un seul gros fichier), le service accepte les archives zip et tar.gz.
Nous imposons pour ce service une limite pour la taille totale des fichiers (10M). Si vous souhaitez traiter un plus large volume de donnée, vous pouvez nous contacter via le formulaire de contact du site principal (Navigation->Contact).
Merci de ne pas utiliser abusivement ce service.