Как управлять проектом категории “большие данные” – часть 1

16 Июня 2014
Перевод интервью с Джеймсом Кобилусом, Старшим директором программ в IBM, автор – Роберто Зикари.

Опубликовано на сайте ODBMS.ORG

Вопрос: Зачем вообще заниматься проектом с «большими данными» на предприятии?

Джеймс Кобилус: Многие проекты с «большими данными» как правило находятся в области поддержания отношений с клиентами (CRM) в маркетинге, обслуживании, продажах и мониторинге бренда. Чтобы доказать необходимость проекта с «большими данными» с фокусом на CRM, нужно обратиться к следующим показателям ROI:

  • Ценность, основанная на объеме: чем более сложное представление о своих клиентах у вас есть, и чем больше у вас на них исторических данных, тем больше инсайтов вы сможете извлечь из этого, и в конце концов прийти к более лучшим решениям в приобретении, удержании клиентов, и управлении отношениями с ними.
  • Ценность, основанная на скорости: чем больше данных вы можете быстро загружать в свою платформу «больших данных» и чем больше вопросов может быть у пользователя решено с помощью запросов, отчетов, «приборных панелей», тем более вероятно, что вы будете принимать нужные решения в нужное время, чтобы достичь своих целей в отношениях с клиентами.
  • Ценность, основанная на разнообразии: чем больше разнообразных данных у вас есть на ваших клиентов – из CRM, из социальных медиа, из логов колл-центра, и так далее – тем более детальный портрет пользователя вы можете получить, и соответственно принимать более качественные решения в отношениях с ними
  • Ценность, основанная на достоверности: чем более консолидированные, однообразные, последовательные, актуальные данные у вас есть на пользователей, тем более точные и аккуратные будут ваши решения.
Как к этому всему привязать ценность в денежном выражении? Ценность клиента за срок его «жизни» в компании (customer lifetime value – CLV) является стандартной метрикой, которую вы можете рассчитать с учетом того влияния, которое окажет аналитика больших данных на приобретение, удержание, допродажи, кросс-продажи, и другие конкретные показатели, влияющие на итоговую прибыль, а также и соответствующие улучшения в операционной эффективности.

Вопрос: Какие бизнес-решения потребуется принять, чтобы успешно поддержать проект, связанный с «большими данными», на предприятии?

Джеймс Кобилус: Вам нужно подготовить вашу инфраструктуру и приложения до состояния готовности к реальной деятельности. Такая готовность означает, что ваши инвестиции в «большие данные» соответствуют тому потенциалу, который вы можете получить. Если вы думаете, что приведение к состоянию готовности означает какой-то один шаг, например внедрение избыточности с помощью HDFS NameNode, то реальность «окатит вас холодным душем».

Приведение к состоянию готовности требует фокуса на жизненном цикле всех платформ «больших данных», а не только например Hadoop/HDFS, как в этом примере, и соответствия большому числу требований, а не единственному, как в этом примере – «высокая доступность распределенной файловой системы».

Приведение к состоянию готовности подразумевает прохождение через несколько процедур чтобы убедиться, что ваши инвестиции в «большие данные» могут функционировать вместе, как единый надежный бизнес-актив. Вот несколько высокоуровневых соображений, которые следует держать в уме в процессе подготовки вашего проекта с «большими данными» к реальной деятельности:

  • Другие участники и вовлеченные лица – соответствует ли ваша инициатива требованиям других участников? Если другие участники, на кого этот проект оказывает влияние, или в чьих интересах делается, не конкретизировали свои требования или ожидания, то система не готова. Критерии готовности завязаны на то, что требуют все участники, и в огромной степени это зависит от того, как система будет использоваться. Соглашения об уровне сервиса (SLA) различаются весьма широко в зависимости от типа решения – будет ли это «склад данных» уровня предприятия, или экспериментальная «песочница», или неструктурированный уровень преобразования информации, архив с запросами к нему, или что-то еще. SLA для производительности, доступности, безопасности, управления, соответствия стандартам, мониторинга, аудита и т.д. будут зависеть от особенностей каждого приложения «больших данных», и насколько оно критично для вашего бизнеса.
  • Стек технологий: укрепили ли вы используемый набор технологий – базы данных, приложения, инструментарий и т.д. для соответствия всем SLA в соответствии с наиболее частыми сценариями использования? Если платформа «больших данных» не соответствует требованиям, она не готова к использованию.
  • Возможность масштабирования: сконструировали ли вы вашу среду таким образом, чтобы обеспечить помодульное наращивание, чтобы всегда соответствовать растущим объемам данных, скорости доступа и растущему многообразию данных? Если вы не можете предоставлять, добавлять и реаллокировать вычислительные мощности, емкость для хранения и сетевые ресурсы на платформе «больших данных» быстро и эффективно с точки зрения затрат, чтобы соответствовать растущим требованиям – то система не готова.
  • Навыки: насколько вы подтянули навыки сотрудников в своей организации? Если вашему персоналу не хватает навыков работы с базами данных, интеграцией или аналитических навыков, чтобы поддержать ваш проект с «большими данными», то это тоже означает неготовность. Не надо идти в «большие данные», если персонал не понимает, как с этим работать.
  • Поддержка и обслуживание: Насколько ваши процессы в управлении данными, ИТ и аналитике соответствуют вашему проекту? Если вы не можете обеспечить поддержку пользователей, реакцию на сообщения о проблемах, обучение и другие функции поддержки эффективным и надежным способом, то ваша платформа не готова.

И наконец, во многих случаях вам нет надобности «изобретать велосипед». Если у вас уже есть, например, работающая система «склада данных» уровня предприятия, вам стоит использовать ее как шаблон для дальнейшего наращивания в проекте с «большими данными»

Следите за продолжением...
Получить консультацию специалиста