Когда речь идет о "прикладном" анализе данных, для начала можно вообще не думать о математике. Weka - продукт университетского проекта по машинному обучению и предлагает 100+ алгоритмов. Напротив, Microsoft SQL server SSAS предлагает девять алгоритмов - и они даже не утруждают себя объяснением математики.
Они оба предлагают ассоциацию, кластеризацию, выбор атрибутов, какие-то нейронные сети. Итак, фокус в том, чтобы понять, чего вы пытаетесь достичь, а не обязательно в математике. Попробуйте почитать об алгоритмах Microsoft (хорошая документация) и попробуйте найти общие принципы для SSAS и Weka - это поможет вам сосредоточиться на основных принципах и начать работу.
Список нескольких учебников по Weka можно найти здесь.
Вот ссылки на коллекцию видео и коллекцию руководств .
Лично я бы использовал RapidMiner5, так как это очень простая среда с графическим интерфейсом (намного лучше, чем v4). В ней доступны все функции WEKA.
Получить rapidminer можно здесь: http://www.rapid-i.com
Суперпростые вводные видео по RapidMiner здесь:
https://dspace.ndlr.ie/jspui/handle/10633/2353
здесь:
http://www.neuralmarkettrends.com/
и здесь:
http://www.youtube.com/user/VancouverData
Если вы хотите узнать больше о статистике, лежащей в основе добычи данных, посмотрите серию лекций этого профессора из Стэндфорда в Google: