CATS
CATS is an open-source, scalable, Web-application designed to support researchers who want to carry out studies based on tweets. The purpose of CATS is twofold: (i) allow people to collect tweets (ii) enable them to analyze these tweets thanks to efficient tools (e.g. event detection, topic modeling, named-entity recognition). Register and start using CATS today!
DWEB
DWEB (Data Warehouse Engineering Benchmark) est un banc d’essais décisionnel permettant d’évaluer les performances des entrepôts de données.
XWEB
XWeB (XML Warehouse Benchmark) est le premier banc d’essais pour entrepôts de données XML. Il est dérivé du banc d’essais décisionnel relationnel TPC-H. Ses principaux composants sont un entrepôt de données test basé sur un modèle de référence unifié pour entrepôts XML, ainsi que la charge de requêtes décisionnelles XQuery associée.
Sondy
SONDY (SOcial Network DYnamics) is an open source software written in Java for collecting, analyzing, and mining data generated by social media. Its main focus is on event detection and influence analysis.
Tanagra
TANAGRA est un logiciel gratuit de Data Mining destiné à l’enseignement et à la recherche. Il implémente une série de méthodes de fouilles de données issues du domaine de la statistique exploratoire, de l’analyse de données, de l’apprentissage automatique et des bases de données. |
TOM
TOM (TOpic Modeling) is a Python library for topic modeling and browsing. Its objective is to allow for an efficient analysis of a text corpus from start to finish, via the discovery of latent topics. |
ordinalClust
ordinalClust is an innovative R package dedicated to ordinal data that proposes tools for modeling, clustering, co-clustering and classification.
Readitopics
Readitopics provides a new tool for browsing a textual corpus that showcases several recent work on topic labeling and topic coherence. We demonstrate the potential of these techniques to get a deeper understanding of the topics that structure different datasets. This tool is provided as a Web demo but it can be installed to experiment with your own dataset. It can be further extended to deal with more advanced topic modeling techniques.