暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

使用Oracle的Big Data Discovery 实现大数据分析和挖掘(二)

凛冬未至 2017-10-10
247

接着上篇文章,我继续为大家展示BDD的强大。大家还记得GoEagle公司吗,上篇中通过BDD帮助他们找到了潜在的客户CoffeeMeUp,现在GoEagle的市场部经理想在上一阶段分析的基础上,整合社交媒体的信息,去分析经常光顾CoffeeMeUp的人群都有哪些,他们对CoffeeMeUp的反馈怎么样,找出谁是经常光顾CoffeeMeUp的人群中影响力最大的人?想想好复杂的问题,每天海量的社交媒体信息,怎么从海量信息中抽取出我们期望的数据,使用什么算法能找出哪个影响力最大的人呢?

让我们看看BDD是怎么帮市场部经理解决这些棘手的问题的吧!

1、登录BDD

2、我们为项目增加社交媒体数据源,这次增加的是twitter数据,增加数据源的过程略过。。。。。

3、点击页面中的“Discover”按钮,然后在出现的页面中再点击“Twitter Analysis”按钮,这个页面我们提前构建好了,构建的方法参考上篇文档的介绍。

4、接下来我们的市场经理将通过对这些数据分析,找出他期望的结果,这个页面在已有的商业数据分析的基础上会再结合上Twitter数据,我们看到我们轻而易举就实现了结构化数据和非结构化数据的联合,是不是很神奇。下面就看我们市场经理的了

1)、他先观察了对Twitter数据进行汇总的显示面板

从这个汇总页面中我们获得了很多信息,我们看到有大量的信息被“retweet”,BDD通过情感分析统计出来这些评论中正面和负面的比例,并且我们也看到在CoffeeMeUp主要使用社交媒体的群体是年轻人,我们发现了人群中最有影响力的52个人。

2)、他也发现了如下有意思的内容:

我们发现大家在谈论coffee的时候,同时也在谈论一些其他的主题,比如:“alcoholicdrinks, ambience, customer service”,他想做一个事情,他想看看人群中除了谈论coffee之外什么是谈论最多的话题?按如下的步骤几次鼠标点击,市场经理的过滤想法实现了,图示如下:

过滤掉coffee关键词后,我们看到了期望的结果,是不是很简单。

我们看到人们在Coffee馆除了谈论coffee外,谈论最多的话题是“ambience”。

我们的市场经理来了兴致,他想了解每家CoffeeMeUp的店里社交媒体发布的次数以及里面详细的内容,哈哈又是一个复杂的问题呀?我们看到在Map页面上,我们获得了社交媒体相关的其他信息,也就是说,我们已经把业务数据和社交媒体数据做了关联,我们可以做更复杂的分析了。

结合业务数据和社交媒体数据,通过构建这样的一个图表,我们可以很容易的获得哪家店的投诉最多,并能知道人们投诉最多的话题是什么?

从上图我们看到投诉最多的是“Belmont”这家店,我们点击“Belmont”就可以看到针对这家店的社交媒体信息统计了。出现如下的页面:

通过图表我们可以了解到在“Belmont”这家店人们投诉最多的是“ambience “和“poor customer service”。拿到这些信息后GoEagle的市场经理有信心去CoffeeMeUp去推荐他们新开发的基于移动数据和社交媒体数据的新移动增值业务了。

大家看到我们通过使用BDD非常快速而简单的对复杂的商业问题进行了分析,这也正是BDD的强大之处,大家是不是心动了,赶快行动起来去尝试吧!!

文章转载自凛冬未至,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论