Софтуерната система R е мощна среда за статистически изчисления, графична визуализация и програмиране, работеща под различни операционни системи: Unix, Linux, Windows и MacOS. Понастоящем системата се използва от десетки хилияди хора ежедневно за сериозен статистически анализ и научно моделиране. R е свободен софтуер с отворен код (www.r-project.org), който се поддържа от широка научна общност.     

Дисциплината „Статистическа обработка на данни и моделиране със системата R” запознава студентите с основните възможности на софтуерната система R и начините за нейното ефективно използване при статистически анализ и моделиране в химичната информатика. Разглеждат се основните команди и синтаксис, векторна аритметика, базови обекти в R, обработка на данни от файлове, графична визуализация, статистически разпределения и проверка на хипотези, регресионен анализ, методи за кластериране и класификация както и връзка на системата R с други библиотеки по химична информатика.

Курсът дава солидна основа за бъдещо задълбочаване на работата със системата R и самостоятелно създаване на модели, програмиране на скриптове и разучаване на допълнителни пакети към R (понастоящем са известни над 2000 пакета разработени като допълнение към базовото ядро на системата R).