Système de Base de données et de Bases de connaissance Dans le contexte du web les données sont hétérogènes, dispersées, et faiblement structurées, et leur utilisation potentielle très variée. Tout cela impose un changement important de point de vue par rapport aux systèmes de gestion de bases de données centralisés et homogènes. Il est fondamental de concevoir des outils permettant de structurer ou d?indexer automatiquement les données pour faciliter leur accès. Des outils d?intégration d?informations provenant de sources de données hétérogènes sont aussi nécessaires. Tous ces outils doivent pouvoir traiter des données exprimées en grande partie sous la forme de textes en langue naturelle. Il est donc important de prendre en compte cet aspect textuel des données tout en exploitant la structure des documents quand elle existe explicitement (documents XML) ou en la découvrant par des outils de " text mining ". Enfin, il est important de créer un lien personnalisé base de donnée/utilisateur : qui a besoin de quoi avec quel point de vue ? Les aspects à prendre en compte : Structuration flexible des données pour un accès personnalisé aux données . Le Système d?Information doit être " user centric ". Cette approche est également valable dans l?industrie et la production. Outils efficaces d?interrogation de bases de documents structurés (XML). XML tend à devenir un format standard d?échange de données sous la forme de documents structurés par des balises. Il est important de fournir des outils d?interrogation fondés sur de réels langages de requêtes, et exploitant la structure du langage XML pour répondre aux requêtes de manière précise et efficace. Entrepôts de données sur le WEB: Outils permettant la constitution, le partage d'informations recherchées sur le web en fonction des besoins de l'entreprise, d'un point de vue,d'un domaine. Outils de publication (de mise a disposition, d'indexation) de documents en fonction d'un domaine, d'un marché, d'un point de vue... Fouille de données Problèmes d?interfaces avec les Bases de Données, approfondissement et efficacité voire combinaison des méthodes fondées sur des traitements statistiques aussi bien que celles fondées sur l?apprentissage, le traitement de la langue, la modélisation, les ontologies, ? Une part importante des données, même sous format XML, reste sous forme textuelle. Il est important de fournir des outils robustes et efficaces capables d?extraire de l?information à partir de textes. Visualisation On doit migrer de la présentation de données vers la visualisation d?information.
Ces informations constituent une part importante du patrimoine national dans le domaine des sciences et des techniques qu?il est nécessaire de sauvegarder et donc il faut assurer la disponibilité. L?enjeu d?aujourd?hui est de garantir que ces gisements soient exploitables demain pour des usages qui ne sont pas encore connus et qui restent à explorer. Différents aspects sont concernés : la pérennité des matériels et logiciels pour assurer la conservation des ?uvres patrimoniales (incunables, estampes, fonds rares, film du patrimoine) ; les supports et les formats de stockage et d?enregistrement ; la garantie de pouvoir exploiter les informations dans le futur pour des usages non prévus à ce jour (problème du balisage de l?information, de l?exploitation collective et coopérative, etc.); la mise en place d'ateliers expérimentaux de production d'?uvres multimédia dans les domaines de l'information (scientifique, technique, pédagogique) selon des critères assurant leur usabilité dans des contextes divers ; l'agrégation de contenus audiovisuels et de documents multimédia dans des applications spécifiques, tels que les Systèmes d'Information Géographiques (SIG), et l?exploitation de ces dispositifs intégrés dans le cadre de différents domaines applicatifs, tels que le tourisme, l?éducation ou la culture.