互联网舆情管理系统主要包含哪些技术?

如题所述

以新浪舆情通-政企舆情大数据监测系统为例,应用到了以下5大核心技术:
1)大数据采集、挖掘技术
网络舆情主要通过新闻、论坛、微博、公众号、博客等渠道形成和传播,网络舆情监测系统依靠强大的大数据计算能力实现了全网信息的实时收集、挖掘和智能检索,保障信息的及时性和完整性。
2)大数据处理技术
快速将数据去重、内容分类,噪音识别等,保障数据的精准度。
3)自然语言处理、图文智能分析等技术
通过词法分析、语义分析等先进技术,判断内容的情感属性,并优先展示涉及敏感的信息,让舆情监测系统在分析方式、分析对象、分析能力等方面更加“智能”,数据更加精准。
4)音视频处理技术
通过通过语音识别、视频处理等技术,将音视频信息转化为文本,实现对音视频信息的分析、分类与检索。对字幕和弹幕的提取和处理能更进一步了解用户的关注点以及情绪。
5)OCR 技术
通过 OCR 技术将图片中的信息识别为文本,实现对图片信息的分类与检索。用户只需要设置监测内容的关键词方案,即可实时获得相关的全网图片内容信息。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2022-05-25

在当下,舆情监测已被广泛应用于各领域,从企业到党政机关、高校,再到公众人物,相关事业单位等。

因此市场上相关的舆情监测软件产品也是层出不穷如识微商情监测系统、鹰眼速读网系统等,可供用户选择。

从技术角度来看,网络舆情监测其实是众多技术结合的成果。一般来说,舆情监测技术手段主要包括:

一、网络舆情采集

在信息采集步骤中,主要包括网络爬虫(We-bCrawler)和网页清洗(WebPageCleaning)等技术。

网络爬虫是一个按照一定规则自动抓取网络信息的程序,又称为网络蜘蛛(WebSpider)。网络爬虫分为三类:通用爬虫(GeneralPurposeWebCrawler) ,面向主题爬虫(FocusCrawlerorTopicalCrawler) ,面向DeepWeb爬虫(DeepWebCrawler)。考虑到网络舆情监测一般是面向行业监测,倾向于使用面向主题爬虫。

网页清洗就是从网页中过滤掉“噪声"数据,提取出网页中有价值的信息内容。网页清洗分析方法主要分为三类:基于树结构分析方法,基于Web挖掘方法,基于正则表达式方法。基于树结构分析方法应用最广,开源软件Htmlparse是比较有代表性的工具,缺点是高度依赖每个网站网页的结构。

二、舆情自动分类

网络舆情分类是将收集的舆情进行自动分类,是整理和发现舆情的关键步骤,主要运用到自然语言处理中的文本分类(TextCategorization)和文本聚类(TextClusters)等技术。

三、话题识别与跟踪

话题识别与跟踪(TopicDetectionandTracking)是对网络舆情聚类分析后,通过算法找出热点问题,并通过算法跟踪话题发展过程,是网络舆情监测中的核心技术。

四、文本情感分析

文本情感分析(又称文本倾向性或意见挖掘(OpinionMining)),是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分析是自然语言处理技术中新兴的研究课题,具有很大的研究价值和应用价值,一般来说,它分为三个主要研究任务:情感信息抽取、情感信息分类、情感信息的检索与归纳。

第2个回答  2020-04-18
通过互联网信息采集和文本挖掘技术,快速发现和收集所需的社会网络舆情信息,通过采集、分类、过滤、聚类、主题检测和统计分析,实现社会热点话题、突发事件、重大案情的快速识别和定向追踪,对有较大影响的重要事件进行快速的发现和处理,如乐思的系统就是由两个子系统组成,自动采集子系统与分析浏览子系统。
第3个回答  2020-03-05
通过互联网信息采集和文本挖掘技术,帮助有关单位快速发现和收集所需的社会网络舆情信息,通过采集、分类、过滤、聚类、
主题检测和统计分析,实现社会热点话题、突发事件、重大案情的快速识别和定向追踪,对有较大影响的重要事件快速发现快速处理的一套系统。
天互云镜舆情系统为你在线服务
相似回答