Статьи

Восемь навыков анализа данных, необходимых каждому аналитику

Легко думать, что если бы вы просто лучше знали статистику, анализ данных был бы не таким трудным. 

Верно утверждение, что большее количество статистических знаний всегда полезно. Но я обнаружил, что статистические знания - это только часть проблемы. 

Другая ключевая часть - это развитие навыков анализа данных. Эти навыки применимы ко всем видам анализа. Не имеет значения, какой статистический метод или программное обеспечение вы используете. Так что даже если вам никогда не понадобится более сложный статистический анализ, чем t-тест, развитие этих навыков облегчит вашу работу. 

Статистические знания необходимы даже для того, чтобы начать развивать эти навыки. И по мере развития навыков вы обнаружите, что статистика становится более понятной. Но больше статистических знаний не заменят. Так что же это за важные навыки? 

  

1. Планирование анализа данных 

Как и большинство проектов, проекты анализа данных более эффективны и имеют меньше проблем, если у вас есть план. План требует от вас заранее продумать важные решения, на повторение которых уйдет много времени. 

  Правильный статистический анализ зависит от вопроса исследования, дизайна исследования, переменных и любых проблем с данными. Рассмотрение того, как они работают вместе, перед тем как вы начнете, может сэкономить много времени и уменьшить головные боли при анализе. 

  

2. Управление проектом анализа данных 

Даже если вы единственный, кто занимается анализом данных, вам все равно придется управлять самим проектом. Вам нужно отслеживать файлы, выделять достаточно времени на каждый шаг и находить ресурсы, которые вам понадобятся. 

  

3. Очистка, кодирование, форматирование и структурирование данных. 

Вы ведь слышали термин GIGO? Мусор на входе, мусор на выходе. При анализе данных важны сами данные. И они должны быть чистыми.   

И как только они станут чистыми, вам нужно будет закодировать и отформатировать переменные. Затем вам необходимо правильно структурировать их для запланированного анализа данных. 

  Этот шаг часто занимает намного больше времени и требует больше навыков в области статистического программного обеспечения, чем сам анализ данных. 

  

4. Проведение анализов в оперативном порядке. 

Существует определенный порядок выполнения этапов анализа, и на каждом этапе необходимо принимать решения. 

  Если вы выполняете их не по порядку или сталкиваетесь с препятствием, которое не можете решить, анализ будет медленнее и утомительнее. Что еще более важно, вы можете ошибаться. 

  

5. Проверка предположений и устранение нарушений 

Да, у каждого статистического теста и модели есть свои предположения. Таким образом, содержание этого навыка будет зависеть от того, чем вы занимаетесь. Но общий подход к проверке предположений тот же. А еще нужно много умения читать неопределенные ситуации и делать выводы. 

  

6. Признание и решение проблем с данными 

Настоящие данные - это беспорядочные данные. 

У реальных данных есть проблемы, которые затрудняют анализ. Выбросы, небольшие размеры выборки и усеченные распределения встречаются во всех типах наборов данных. Распознавать, когда возникает проблема с данными, знать, достаточно ли она серьезна, чтобы вызвать проблемы, и знать, что с этим делать, - важные навыки. 

  

7. Обнаружение проблемных результатов и устранение неполадок 

Иногда вы получаете странные результаты - действительно странные результаты - несмотря на очистку данных, проверку предположений и поиск проблем с данными. 

  Возможных причин очень много: опечатки в наборе данных, сбои в программном обеспечении, недостающие данные. 

  Необходимо умение распознавать, когда что-то не так, и как исследовать проблему и ее решения. 

 

8. Интерпретация, представление и сообщение результатов. 

Этот набор навыков может быть самым важным из всех. Сюда входит интерпретация результатов и их запись так, чтобы аудитория понимала. Это требует создания полезных, подходящих и точных графиков и таблиц. 

  Это также означает знание того, как заставить вашу статистическую программу делать за вас тяжелую работу. Если вы можете создавать таблицы так, как вам нужно, вам не придется тратить часы на их переформатирование. 

 

  Как развить эти навыки 

  Ни один аналитик данных не имеет вначале этих навыков, независимо от того, сколько уроков статистики он посещал. Есть только один способ развить эти навыки: требуется опыт анализа реальных наборов данных. 

  Но развить навыки будет легче, если у вас есть специальная подготовка по этим навыкам и кто-то, кто будет наставлять вас по мере накопления опыта. Считайте себя учеником квалифицированного ремесла. Да, вы можете сделать это самостоятельно. Но вы быстрее улучшите свои навыки и по ходу дела будете лучше выполнять свою работу с некоторыми рекомендациями. 

 

Источник: https://www.theanalysisfactor.com/data-analysis-skills-every-analyst-needs/ 

Мы выложили этот материал, потому что наша точка зрения совпадает с мнение авторов статьи. Развитием перечисленных навыков аналитиков мы так или иначе занимаемся на всех наших тренингах. Посмотреть полный список и выбрать подходящий лично вам можно здесь https://analytera.ru/treningi/

Остались вопросы?

Напишите нам и мы подробно ответим на все Ваши вопросы!