知识库 : 舆情服务市场与技术难点简要分析

一、国内舆情服务市场概况

网络舆情是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式,是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。“网络舆情是以网络为载体,以事件为核心,广大网民情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。”

当前国内舆情服务市场主要由网络舆情系统开发商、互联网数据调查与分析公司、专业新闻媒体机构、公关公司等六大阵营组成(如下图所示),其中以舆情服务系统开发厂商占据产业链的核心地位,其在舆情服务市场的份额也是最高的。

                       

据业内权威人士预测,目前国内舆情服务市场规模超100亿元,舆情系统平台规模超过30亿元。目前,国内舆情软件企业超过1000家,这些参与者按背景来划分的话,可以分为五大派系,即软件派、媒体派、学院派、公关派、政府派,其中软件派占主导地位。另外,国内舆情系统市场门槛低、行业集中度不高,TOP5的公司占据45%市场份额,份额最高的军犬舆情监测系统的市场份额才15%左右。

二、国内舆情监测与分析服务的主要业务模式

根据笔者研究,可将当前主流的舆情服务模式分为三大类:

2.1   “内容+服务”模式

  • 典型代表:人民网舆情检测室、新华网舆情监测中心
  • 模式特点:具有传统权威媒体优势,内容资源丰富。舆情服务是其内容价值释放和向新媒体转型的有效途径

 

2.2   “软件+服务”模式

  • 典型代表:谷尼、军犬、拓尔思、红麦
  • 模式特点:网络爬虫技术和文本分析技术是其最具竞争力的能力。技术是核心,服务是延伸

2.3   平台聚合模式

  • 典型代表:《中国经营报》旗下中国企业舆情中心
  • 模式特点:作为一个能力输出平台和舆情服务“超市”,集聚了舆情监测公司、应急系统公司、公关公司以及自身的权威媒体优势

三、网络舆情系统的关键技术与难点

 网络舆情系统实际上是一种实时性的互联网数据集成、加工与信息分发的智能平台。网络舆情系统的主要功能有信息数据自动采集(Automation Information Retrieval)、文本自动聚类和自动分类(Text Clustering & Text Classification)、话题与跟踪(Topic Detection and Tracking, TDT)、文本情感分析(Sentiment Analysis,SA)、趋势分析、自动文本摘要(Automation Document Summarization)、舆情态势判断、统计报告、舆情报警、重大舆情应对的指挥与整合等几个方面。其中,网络舆情系统的关键技术包括热点话题的自动发现技术以及观点的抽取和观点倾向的定性和定量分析技术。

     在当前互联网信息爆炸的环境下,人们面临的问题是信息过载和信息噪音,所以人们关注的重心是信息的聚合分析。而观点的抽取和观点倾向的定性和定量分析技术又成为研判舆情态势另一个重要依来源和依据。目前,普通搜索引擎基于关键词得到搜索引擎返回结果的信息冗余度过高,很多不相关的信息仅仅因为含有指定的关键词被作为结果返回,并且没有对搜索结果进行有效合理的组织。在大量网络信息中,与同一主题相关的信息往往孤立地分散在不同的时间段和不同的地方。面对互联网上众多站点和质量不齐网络信息,仅仅通过这些孤立的信息,人们对事件难以做到全面的把握。在这种情况下通过向量模型建立和对数据相似性分析的识别话题与跟踪技术成为舆情系统关键所在。

     网络舆情系统的难点在于网络舆情数据的获取能力和舆情数据语义分析。另外,互联网的分布式、流动性,使网络热词、语境发生巨大变化,从而使舆情系统实现核心功能语义逻辑的自然语言处理、向量模型的完善性受到冲击,影响了舆情研判的准确性、实效性。

     总体而言,在舆情数据语义分析上,需要解决如下问题:

  • 有效处理海量和高维的数据能力;
  • 数据噪音甄别;
  • 数据完整性;
  • 数据时效性;
  • 词义和语境的复杂性,影响数据的极性分析(正负面倾向性、褒贬义程度及结构)准确性;
  • 数据倾向性细粒化处理(肯定之中否定、否定之中肯定的成分分析);
  • 自然语言构词知识完善及更新;
  • 语境变化的语义逻辑准确性;
  • 向量模型构造和优化;

    随着互联网及其应用向着移动泛在、多终端整合、微众即时互动、个性化方向发展,作为互联网信息集成、智能整合分析的舆情系统理应与之匹配,未来的舆情系统呈现云处理、APP平台化、层次化、个性化、移动化、融合化、语义智能化等特征。

 

 

Attachments:

舆情圈.png (image/png)