您当前所在的位置:鲸舆科技文化(北京)有限公司 > 供求信息 > 舆情监测方案

供求信息

鲸舆科技专做舆情处置方案

关键词:

舆情监测方案

2018-12-09

鲸舆科技文化(北京)有限公司,是一家集舆情处置方案、舆情处理为一体的综合型现代化企业,为广大客户奉献专业、高品质的舆情监测公司专营机构。

鲸舆科技文化(北京)有限公司于2017-08-31在北京市朝阳区北苑路170号4号楼3层(大屯孵化器A383号)注册成立以来,从事商务服务、其他商务服务、网络服务领域。目前,分公司及办事处已遍布全国多个城市及地区。建立起了一个以市辖区、朝阳区为中心,覆盖全国的产品经销和服务网络。 延伸拓展 详情介绍:舆情处置方案:数据检索与聚合,数据获取下来后哪些是你关心的、 哪些是垃圾噪声,需要用一些NLP处理算法来解决这些问题。这方面门槛高、难度大。首先大规模的数据如何被有效的检索使用就是个难题。 比如一天收录一百万个页面(真实环境往往比这个数量级高很多),上百G的数据如何存储、如何检索都是难题。值得高兴的是业内已经有一些成熟的方案,比如使用solr或者es来做存储检索, 但随着数据量的增多、增大,这些也会面临着各种问题。通常对热门的判断逻辑是被各家网站转载、报道的多, 所以使用NLP的手段来做相似性计算是必须的,业内常用的方法有Simhash或者计算相似性余弦夹角。有些场景不单单是文章相似,还需要把类似谈及的文章都做聚合,这时就需要用到一些聚类算法,例如LDA算法。从实践经验来看,聚类算法的效果良莠不齐, 需要根据文本特征的情况来测试。目前舆情监测的现状存在很多待改进的地方。首先,手工监测存在天然局限性。通过安排固定人手24小时值班,不间断地浏览目标站点并搜索目标关键词,是在缺少自动化系统时最直接也是最初级的舆情监测方式。由于受到每个人主观思想的限制,手工监测总会有观察盲区,总会有觉得不重要但事后被证明很严重的地方,且手工无法察觉到一些站点或者一些偏僻的网页内容发生改变;同时,人不是机器,长期反复监测容易导致疲劳,经常会使得该判断出来的舆情,一不留神就漏掉了。这些都会在实时性和准确性上存在很大波动。其次是过度依赖搜索引擎。人们往往认为在网络舆情的大海里也只有搜索引擎才可能具备捞针的本领。但是,搜索引擎仍然具有不少局限性。除了搜索结果受关键词影响很大外,搜索引擎返回的结果往往来自不受任何访问限制的网站,而诸如论坛等需要登录的网站则完全被排除在外。但是网民发表意见最多的地方,恰恰是这些提供互动功能的网站。更进一步的,搜索引擎的网络爬虫具有一定的时延性,因此不能实时搜索到最新的网页更新。因此,搜索引擎不能为我们提供问题的全貌,因为它只针对关键词而不针对问题,所以谈不上全面性;搜索引擎也不能在第一时间得到我们所想要的结果,因为不仅是它的内容更新不够快,而且它也不能提供针对时效性的服务,所以谈不上及时性;搜索引擎只能在海量网页中返回另一个海量的结果,而且是以杂乱无章的形式,对于我们关心什么,它一无所知,所以它给出的结果是所有人都关心的,而非我关心的,因此也谈不上准确性。可见,我们不能完全依赖搜索引擎来监测网络舆情,需要提出全新的技术手段来获知网络舆情,并跟踪和分析舆情。


想了解更多舆情处置方案、舆情监测方案详情请访问官网:www.jingyukeji.cn,或者拨打我们的热线电话:010-85751604了解更多舆情监控x5a5bfn信息,我们专业的客服人员将竭诚为您服务,谢谢!
网上有害信息举报
x

填写举报信息

提示:请填写您的实名信息,中国114黄页承诺对您的信息进行保密