Важные навыки Специалиста по обработке и анализу данных [закрываются]

Каковы соответствующие навыки в арсенале Специалиста по обработке и анализу данных? С новыми технологиями, прибывающими в каждый день, как каждый привередливо выбирает основы?

Несколько идей, релевантных этому обсуждению:

  • Зная SQL и использование DB, такого как MySQL, PostgreSQL был большим до появления NoSql и нереляционных баз данных. MongoDB, CouchDB и т.д. становятся популярными для работы с данными веб-масштаба.
  • Знание инструмента статистики как R достаточно для анализа, но создавать приложения, возможно, должно добавить Java, Python и таких других к списку.
  • Данные теперь прибывают в форме текста, URL, мультимедиа для именования некоторых, и существуют различные парадигмы, связанные с их управлением.
  • Что относительно кластерных вычислений, параллельных вычислений, облака, Amazon EC2, Hadoop?
  • Регрессия OLS теперь имеет Искусственные Нейронные сети, Случайные Леса и другое относительно экзотическое машинное обучение / алгоритмы анализа данных. для компании

Мысли?

57
задан 5 revs, 5 users 88% 5 November 2015 в 17:01
поделиться

9 ответов

Цитата из вступления к докторской диссертации Хэдли :

Во-первых, вы получаете данные в форме, которая вы можете работать с ... Во-вторых, вы нанесите на график данные, чтобы понять, что происходит ... В-третьих, вы повторяете между графикой и моделями, чтобы построить краткое количественное резюме данные ... Наконец, вы снова посмотрите на что ты сделал, и размышляй в каких инструментах вам нужно работать лучше будущее

Шаг 1 почти наверняка будет связан с изменением данных и может включать доступ к базе данных или веб-скрейпинг. Также полезно знать людей, которые создают данные. (Я заносил это в раздел «нетворкинг».)

Шаг 2 означает навыки визуализации / построения графиков.

Шаг 3 означает статистику или навыки моделирования. Поскольку это слишком широкая категория, способность делегировать полномочия моделисту также является полезным навыком.

Последний шаг в основном касается мягких навыков, таких как самоанализ и управленческие навыки.

В вопросе также упоминались навыки программирования, и я согласен, что они очень пригодятся. Software Carpentry имеет хороший список всех базовых навыков работы с программным обеспечением, которые вы должны иметь.

24
ответ дан 24 November 2019 в 19:39
поделиться

Просто чтобы подбросить некоторые идеи для других:

На каком-то смехотворно высоком уровне абстракции вся работа с данными включает следующие шаги:

  • Сбор данных
  • Хранение данных / Извлечение
  • Обработка данных / Синтез / Моделирование
  • Отчетность о результатах
  • Рассказ историй

Как минимум, специалист по анализу данных должен обладать как минимум некоторыми навыками в каждой из этих областей. Но в зависимости от специальности можно проводить намного больше времени в ограниченном диапазоне.

22
ответ дан 24 November 2019 в 19:39
поделиться

JD великолепны, и для более подробного ознакомления с этими идеями прочтите превосходный пост Майкла Дрисколла Три сексуальных навыка компьютерных фанатов :

  1. Навык № 1 : Статистика (Изучение)
  2. Навык №2 : Изменение данных (Страдание)
  3. Навык №3 : Визуализация (Рассказывание историй)
13
ответ дан 24 November 2019 в 19:39
поделиться

JD ударил его по голове: рассказывание историй. Хотя он забыл ДРУГОЙ важную историю: историю о том, почему вы использовали <вставьте сюда причудливую технику>. Умение ответить на этот вопрос - несомненно, самый важный навык, который вы можете развить.

Остальное - просто молотки. Не поймите меня неправильно, такие вещи, как R, великолепны. R - это целый набор молотков, но важно знать, как использовать молотки и еще много чего, чтобы сделать что-то полезное.

5
ответ дан 24 November 2019 в 19:39
поделиться

Я думаю, что важно владеть парой комериальных баз данных. В финансовом мире, с которым я консультируюсь, я часто вижу DB / 2 и Oracle на большом железе и SQL Server на распределенных серверах. В основном это означает возможность читать и писать код SQL. Вы должны иметь возможность получать данные из хранилища в свой аналитический инструмент.

С точки зрения аналитических инструментов, я считаю, что R приобретает все большее значение. Я также думаю, что очень полезно знать, как использовать хотя бы еще один статистический пакет. Это может быть SAS или SPSS ... это действительно зависит от компании или клиента, на которых вы работаете, и их ожиданий.

Наконец, вы можете прекрасно разбираться во всех этих пакетах и ​​при этом не быть очень ценным. Чрезвычайно важно иметь достаточный опыт в конкретной области и уметь сообщать соответствующим пользователям и менеджерам, какие проблемы связаны с вашим анализом, а также с вашими выводами.

4
ответ дан 24 November 2019 в 19:39
поделиться

Матричная алгебра - мой лучший выбор

4
ответ дан 24 November 2019 в 19:39
поделиться
  • Возможность совместной работы.

Великая наука, почти в любой дисциплине, редко делается отдельными людьми в наши дни.

4
ответ дан 24 November 2019 в 19:39
поделиться

Есть несколько тем по информатике, которые полезны для специалистов по данным, многие из них уже упоминались: распределенные вычисления, операционные системы и базы данных.

Анализ алгоритмов , то есть понимание требований к пространству и времени вычислений, является единственной наиболее важной темой информатики для специалистов по данным. Это полезно для реализации эффективного кода, от методов статистического обучения до сбора данных; и определение ваших вычислительных потребностей, таких как объем оперативной памяти или количество узлов Hadoop.

3
ответ дан 24 November 2019 в 19:39
поделиться

Терпение - как для получения результатов разумным образом, так и для того, чтобы иметь возможность вернуться и изменить их на то, что «действительно» требовалось.

2
ответ дан 24 November 2019 в 19:39
поделиться
Другие вопросы по тегам:

Похожие вопросы: