怎样通过电脑网络的检索来了解有关研究的历

如题所述

摘 要:针对目前网络信息检索中面临的网络信息泛滥且网站质量良莠不齐、搜索引擎存在缺陷、检索效率低、个性化需求差等问题,提出了加强宏观调控、统一搜索引擎分类标准、提高网络信息检索技术水平、完善用户指导等相应的对策。
关键词:网络信息;信息检索;搜索引擎;个性化需求

自20世纪80年代末以来,我国的计算机技术、通讯技术以及网络技术发展迅猛,对信息检索领域造成了很大的冲击,引发了诸多的网络信息问题。为促进网络信息检索的进一步发展,本文就网络信息检索中遇到的问题进行深入的研究,并给出相应的对策。
1 目前网络信息检索中存在的问题
网络信息资源具有数量大,增长快,形式多样,分布广泛等特点,在给网络信息检索带来强大功能的同时,也由于网络信息没有统一的组织管理,没有统一的目录,使得人们虽然面对丰富的资源,却难以找到自己所需的、恰当的信息。
1.1 网络信息泛滥且网站质量良莠不齐
由于任何组织和个人都可以在网上发布信息,使得网上信息以几何级数急剧膨胀,网上的信息资源不计其数,基本上涵盖了人类知识的各个方面。由于其发布具有很大的自由性和随意性,缺乏规范,使得信息质量和精度低,可靠、权威、利用价值受到质疑。同时,信息类型庞杂,垃圾、虚假、冗余过时信息以及政治反动信息等增加了信息的不确定性和用户的不安全性,造成了信息污染。部分网站质量差,栏目设置混乱,无导航措施,内容无特色、陈旧,长期不更新。而部分网站信息变化大,重复率高,无规律可循,搜索引擎常常是被重复显示十几次甚至几十次,所给结果并非用户所需信息而是一系列网址,获得所需确切信息需以牺牲大量时间为代价。用户面对眼花缭乱的信息无所适从,难以找到适合需要的信息。
1.2 搜索引擎存在缺陷且智能化程度低
搜索引擎起着网络导航的作用,在给我们提供方便的同时,也存在一些问题。目前还缺乏一部统一的网络资源分类法,多数信息机构都是依据现有的《中图法》稍加改造后就用于网上信息的分类,虽取得了一定的成绩,但也存在类目设置不科学,内容重复交叉等现象。分类目录搜索引擎采用人工干预技术,信息分类不规范,没有一个统一的控制词表和参照标准,分类目录差别较大,搜索范围较小,数据库更新慢,查询交叉类目时容易遗漏,查全率低。关键词式全文搜索引擎采用机器人搜索技术,数据库更新快,检索功能强,但是自动标引不完善,信息关联难以控制且重复链接信息较多,查准率低,输出信息重复,检索结果太多且不一定与用户需求相关。现有搜索引擎在信息维护,信息重复,网络及站点负载方面还存在很大的不足,检索的查准率不高,同时信息资源层出不穷,无人组织控制,查全率无法得到保证,信息检索结果不太令人满意。
1.3 检索效率低
网络信息导航只支持单步信息定位,只允许导航系统一步一步地追踪信息,客户机在追踪过程中接受了诸多冗余信息,造成效率降低,即使是一些优秀的搜索引擎,也需按屏幕提示一步一步追踪,如果查到的地址有几百条、几千条,要确定哪个符合要求就很困难。目前,许多网站提供的搜索引擎都是自动分词,自动抓取的检索原理,这样的检索只是对网络信息用词表面的分析,不能提示文章用词所隐含的有价值的信息。搜索引擎无统一严格的标准,给查找特定主题的文献带来困难。在查找特定主题的文献时,一般依赖于关键词检索,可是目前搜索引擎采用的排序方法有所不同,大多考虑关键词出现的位置和频次,所以会出现许多结果。更重要的是用户对特定主题的检索往往难以定义其关键词,即使定义了关键词,命中记录数往往很多,不易查准,若再进一步限定,命中记录数会减少却又很容易漏检,而不能查全。大多数的检索工具都用自然语言标引和检索,同义词和近义词得不到控制,词间关系得不到提示,造成检索结果中的大量误检。检索工具覆盖范围有限,即使功能最完善的也只能搜寻到大约1/3的网页。由于一些隐性信息的存在,使得用户不能及时准确地从繁杂的网络信息资源中找到自己所需的信息。
1.4 个性化需求差
信息服务的内在机理要求信息服务的出发点和立足点是用户信息活动,而不是信息资源,信息服务应基于用户信息活动而不是信息资源来开展。网络信息资源的指数级膨胀使得用户在获得自己所需要的信息资源时要花费大量的时间和精力。同时随着社会信息化程度的不断提高,用户对信息的需求增加,信息需求也呈现出了多样化、个性化的趋势,每个人的不同信息需求将凸现于标准化单一的“大众需求”之上。个性化服务也就是针对性的个别服务,具体来说就是指以用户为中心,有针对性地为用户提供服务。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息是远远不够的,只有针对不同用户的不同需求“对症下药”,提供个性化服务,才有可能使每位用户都感到满意,信息的价值才能得以实现,但这方面的技术还不成熟,有关专家正在积极探索这一方面的技术,以求最大限度地为用户提供所需信息。
1.5 缺少基于内容的信息搜索引擎
计算机技术、数字化技术、高密度存储技术为非文本信息——图像、声频、视频等多媒体信息提供了广阔的发展舞台,图文并茂的多媒体信息已经逐渐成为Web的主流。但目前信息检索都是基于文本方式匹配的,有时并不能客观反映信息内容的多样性。 比如进行图像检索, 必须事先使用人工标注的方法将图像的内容以文本形式表达出来,但这种检索方式具有明显不足:首先,人工标注需要大量的人力物力,无法满足大型的多媒体数据库的需求,如Web网络资源、数字图书馆等,更不能适应大量的新资源的出现。其次,人工标注难以描述蕴藏在图像数据中的丰富内容,也无法解决内容描述的主观性问题,因为同一幅图像,每个人可能有不同的见解,从而标注的内容也不一样。最后,对于实时媒体流的处理,手工是完全无法适应的。所以,传统信息检索技术无法满足现代图像数据检索的需要,必须从一个新的角度来管理海量的图像信息,使非结构化的数据向结构化的数据进行转换。
自20世纪80年代末以来,我国的计算机技术、通讯技术以及网络技术发展迅猛,对信息检索领域造成了很大的冲击,引发了诸多的网络信息问题。为促进网络信息检索的进一步发展,本文就网络信息检索中遇到的问题进行深入的研究,并给出相应的对策。
1 目前网络信息检索中存在的问题
网络信息资源具有数量大,增长快,形式多样,分布广泛等特点,在给网络信息检索带来强大功能的同时,也由于网络信息没有统一的组织管理,没有统一的目录,使得人们虽然面对丰富的资源,却难以找到自己所需的、恰当的信息。
1.1 网络信息泛滥且网站质量良莠不齐
由于任何组织和个人都可以在网上发布信息,使得网上信息以几何级数急剧膨胀,网上的信息资源不计其数,基本上涵盖了人类知识的各个方面。由于其发布具有很大的自由性和随意性,缺乏规范,使得信息质量和精度低,可靠、权威、利用价值受到质疑。同时,信息类型庞杂,垃圾、虚假、冗余过时信息以及政治反动信息等增加了信息的不确定性和用户的不安全性,造成了信息污染。部分网站质量差,栏目设置混乱,无导航措施,内容无特色、陈旧,长期不更新。而部分网站信息变化大,重复率高,无规律可循,搜索引擎常常是被重复显示十几次甚至几十次,所给结果并非用户所需信息而是一系列网址,获得所需确切信息需以牺牲大量时间为代价。用户面对眼花缭乱的信息无所适从,难以找到适合需要的信息。
1.2 搜索引擎存在缺陷且智能化程度低
搜索引擎起着网络导航的作用,在给我们提供方便的同时,也存在一些问题。目前还缺乏一部统一的网络资源分类法,多数信息机构都是依据现有的《中图法》稍加改造后就用于网上信息的分类,虽取得了一定的成绩,但也存在类目设置不科学,内容重复交叉等现象。分类目录搜索引擎采用人工干预技术,信息分类不规范,没有一个统一的控制词表和参照标准,分类目录差别较大,搜索范围较小,数据库更新慢,查询交叉类目时容易遗漏,查全率低。关键词式全文搜索引擎采用机器人搜索技术,数据库更新快,检索功能强,但是自动标引不完善,信息关联难以控制且重复链接信息较多,查准率低,输出信息重复,检索结果太多且不一定与用户需求相关。现有搜索引擎在信息维护,信息重复,网络及站点负载方面还存在很大的不足,检索的查准率不高,同时信息资源层出不穷,无人组织控制,查全率无法得到保证,信息检索结果不太令人满意。
1.3 检索效率低
网络信息导航只支持单步信息定位,只允许导航系统一步一步地追踪信息,客户机在追踪过程中接受了诸多冗余信息,造成效率降低,即使是一些优秀的搜索引擎,也需按屏幕提示一步一步追踪,如果查到的地址有几百条、几千条,要确定哪个符合要求就很困难。目前,许多网站提供的搜索引擎都是自动分词,自动抓取的检索原理,这样的检索只是对网络信息用词表面的分析,不能提示文章用词所隐含的有价值的信息。搜索引擎无统一严格的标准,给查找特定主题的文献带来困难。在查找特定主题的文献时,一般依赖于关键词检索,可是目前搜索引擎采用的排序方法有所不同,大多考虑关键词出现的位置和频次,所以会出现许多结果。更重要的是用户对特定主题的检索往往难以定义其关键词,即使定义了关键词,命中记录数往往很多,不易查准,若再进一步限定,命中记录数会减少却又很容易漏检,而不能查全。大多数的检索工具都用自然语言标引和检索,同义词和近义词得不到控制,词间关系得不到提示,造成检索结果中的大量误检。检索工具覆盖范围有限,即使功能最完善的也只能搜寻到大约1/3的网页。由于一些隐性信息的存在,使得用户不能及时准确地从繁杂的网络信息资源中找到自己所需的信息。
1.4 个性化需求差
信息服务的内在机理要求信息服务的出发点和立足点是用户信息活动,而不是信息资源,信息服务应基于用户信息活动而不是信息资源来开展。网络信息资源的指数级膨胀使得用户在获得自己所需要的信息资源时要花费大量的时间和精力。同时随着社会信息化程度的不断提高,用户对信息的需求增加,信息需求也呈现出了多样化、个性化的趋势,每个人的不同信息需求将凸现于标准化单一的“大众需求”之上。个性化服务也就是针对性的个别服务,具体来说就是指以用户为中心,有针对性地为用户提供服务。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息是远远不够的,只有针对不同用户的不同需求“对症下药”,提供个性化服务,才有可能使每位用户都感到满意,信息的价值才能得以实现,但这方面的技术还不成熟,有关专家正在积极探索这一方面的技术,以求最大限度地为用户提供所需信息。
1.5 缺少基于内容的信息搜索引擎
计算机技术、数字化技术、高密度存储技术为非文本信息——图像、声频、视频等多媒体信息提供了广阔的发展舞台,图文并茂的多媒体信息已经逐渐成为Web的主流。但目前信息检索都是基于文本方式匹配的,有时并不能客观反映信息内容的多样性。 比如进行图像检索, 必须事先使用人工标注的方法将图像的内容以文本形式表达出来,但这种检索方式具有明显不足:首先,人工标注需要大量的人力物力,无法满足大型的多媒体数据库的需求,如Web网络资源、数字图书馆等,更不能适应大量的新资源的出现。其次,人工标注难以描述蕴藏在图像数据中的丰富内容,也无法解决内容描述的主观性问题,因为同一幅图像,每个人可能有不同的见解,从而标注的内容也不一样。最后,对于实时媒体流的处理,手工是完全无法适应的。所以,传统信息检索技术无法满足现代图像数据检索的需要,必须从一个新的角度来管理海量的图像信息,使非结构化的数据向结构化的数据进行转换。
2 应采取的对策
2.1 加强宏观调控
要确立因特网信息服务管理的战略目标和任务,加强国家信息管理机构的职能,制定网络信息服务的有关政策。加强政策调控,完善信息产权的保护政策,建立一个完善的网络安全管理制度,通过立法程序把一些最基本的规范上升为法律、法规,强制性地使人遵守,才能保证起码的网络社会秩序,促进网络信息健康有序地发展。目前世界上许多国家都已把互联网立法提上了议事日程,我国近年来也加快了互联网法律、法规的制定步伐。在加强法制建设的同时,也应对网民进行道德教育,倡导以德治网,教育用户在使用网络时注意信息的选择和遵守规则,提高网民辨别是非的能力,维护网络健康发展。
2.2 统一搜索引擎分类标准
网站信息瞬息万变,纷繁杂乱,需要对数据进行挖掘以实现精确分类。虽然目前存在有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,制定一个统一的分类标准势在必行。这个标准应当是传统分类标准与当前网络信息分类方法相互融合的产物,兼备了传统文献分类的科学性与目前网络信息分类方法的灵活性。可以参照国际标准,也可以制定国内标准,还要规范网络术语,使其与常规术语接轨,提高资源共享的程度。
2.3 提高网络信息检索技术水平并实现智能检索
智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。近几年来,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,目前已有一些搜索引擎支持智能检索,但其智能化程度还不高,在这方面如果多做一些研究,一定会更好地满足用户的需求。
2.4 加强网站管理以提高质量水平
目前的网站中虽不乏一些优质的网站,但一些质量差的网站也大量存在,国家应制定相关法律来加强网站管理监督,严格把关,对质量较差的加以限制,甚至于取缔。同时,制定相关政策,提高网络规范程度,以保证用户的检索效率。网站的设计者与开发者也应加强自身素质,掌握信息检索的发展动向,虚心听取用户建议和要求,客观地评价自己的网络,有目的有重点地不断改进自己的网站,提高自己的职业道德水平,努力为用户奉献一个优质的网站。
2.5 完善用户指导
进行网络检索,归根结底还是要由人来操作的,由于各个检索工具都有自己独特的检索要求,有时检索结果连一些专业人员都很难做到满意,更何况网络面对的是众多的用户,他们对网络信息资源的了解及其利用的程度都各有不同,大部分人还受着原来传统文献检索行为习惯的影响,对于新的事物还有一个认识、接受、熟悉的过程,因而教育程度、知识结构的不同直接影响到了检索的效果。目前的检索结果有时不令人满意,很大程度上就是工作人员的操作技术不过关,不懂得查询技巧和数据库的技巧。对用户应当加以培训,使他们能较快地转变角色,从只会一些简单的检索到能掌握复杂的检索方法,直到能检索到令自己满意的信息。
2.6 善于总结心得体会
面对浩如烟海的信息资源,要想快速准确地找到自己所需的恰当的信息,就需要在检索实践中注意总结及掌握一些检索技巧,要充分分析检索课题,选择合适搜索引擎、构造检索式,准确表达检索要求,掌握一些高效率检索的技巧。由于网络数据库的多样性,各个检索系统所包含的范围、检索提问式不尽相同,因此,当第一次检索失败后,不要轻易放弃,可以对检索词进行新的排列组合,添加或删除检索词,添加或改变检索逻辑符,或用同义词代替,再次进行查找,一般会得到较好的检索结果。另外,还可以更换不同的数据库,运用不同的搜索引擎,来得到满意的检索结果。在检索过程中会遇到各种各样的问题,灵活解决这些问题,就会找到满意的答案。
、检索提问式不尽相同,因此,当第一次检索失败后,不要轻易放弃,可以对检索词进行新的排列组合,添加或删除检索词,添加或改变检索逻辑符,或用同义词代替,再次进行查找,一般会得到较好的检索结果。另外,还可以更换不同的数据库,运用不同的搜索引擎,来得到满意的检索结果。在检索过程中会遇到各种各样的问题,灵活解决这些问题,就会找到满意的答案。
温馨提示:答案为网友推荐,仅供参考
相似回答