搜索引擎技术的现状和热点
同志们:
全国导游大会是在党中央、国务院领导同志的亲切关怀和倡导下召开的。去年8月12日中共中央政治局委员、国务院副总理吴仪同志在听取国家旅游局工作汇报时,强调指出:“要加强导游队伍建设。可以树一批先进代表、典型人物,可以考虑在适当的时候召开一次全国性的导游大会”。国家旅游局认真贯彻落实吴仪副总理的指示精神,在各省区市和全国旅游系统的共同努力下,经过一年多时间的精心筹备,今天在北京隆重召开全国导游大会。
这次会议的主要任务是:以邓小平理论和“三个代表”重要思想为指导,全面贯彻落实党的十六大和十六届六中全会精神,按照科学发展观的要求,总结交流我国导游工作的经验,分析新时期新阶段我国导游工作面临的形势,研究部署当前和今后一个时期我国导游工作发展和导游队伍建设的任务,努力开创导游工作新局面,为推进我国旅游业持续健康较快发展,为构建社会主义和谐社会作出积极贡献。
刚才,国家旅游局表彰了11名全国模范导游员和291名全国优秀导游员,他们是全国30多万导游员的优秀代表。这次全国导游大会期间,中共中央宣传部、国家旅游局、中共湖南省委,还将举行“全国模范导游员文花枝同志先进事迹报告会”。在此,我谨代表国家旅游局,向获得“全国模范导游员”和“全国优秀导游员”光荣称号的同志们表示热烈的祝贺!向长年辛勤工作在旅游第一线、为我国旅游业发展作出重要贡献的全国广大导游员,致以亲切的慰问!向长期以来关心、支持我国导游工作和旅游业发展的各级党委政府、各有关部门和社会各界,表示衷心的感谢!
这次会议还将讨论《关于进一步加强全国导游队伍建设的若干意见(讨论稿)》,国家旅游局副局长张希钦同志将作《关于进一步加强全国导游队伍建设的若干意见(讨论稿)的说明》。请与会代表认真讨论提出修改意见,使之更加完善。下面,我代表国家旅游局讲几点意见。
一、新中国导游事业发展的历程
导游是我国旅游从业人员队伍的重要组成部分,是我国旅游业发展的实践者和推动者,是社会主义现代化事业的建设者、先进文化的传播者、中外交流的友好使者。党中央、国务院历来高度重视导游工作,高度重视导游队伍建设。周恩来、陈毅等老一辈党和国家领导人生前十分关心导游队伍建设,明确提出导游翻译人员要做到“政治思想过硬、业务知识过硬、语言水平过硬”的“三过硬”要求,并对全国导游员寄予殷切期望。
改革开放以来,党中央、国务院和中央领导同志,对旅游业发展和旅游从业人员十分关怀。邓小平同志强调“旅游事业大有文章可做,要突出地搞,加快地搞”,并指出“要搞一些培训班,培养翻译、导游、经营管理人员”、“导游要有章程”。以江泽民同志为核心的第三代党中央领导集体高度重视旅游业发展和旅游从业人员队伍建设,强调要建设一支有理想、有道德、有文化、有纪律的旅游从业人员队伍,为社会主义现代化建设服务,为精神文明建设服务。党的十六大以来,以胡锦涛同志为总书记的新一届党中央,对我国旅游业发展和旅游从业者队伍建设,作出了一系列重要指示。胡锦涛同志对西藏导游队伍建设两次作出重要批示。温家宝总理提出要把旅游业培育成国民经济的重要产业,并充分肯定了旅游及旅游从业人员对促进我国经济社会发展、增进友谊、扩大对外交往中的重要作用。中共中央政治局常委、国家副主席曾庆红亲切接见并鼓励全国模范导游员文花枝,寄语全国导游员和旅游行业:“希望全国导游员都像文花枝这样,我们的旅游业大有希望”。中共中央政治局常委李长春,中共中央政治局委员、中宣部长刘云山对宣传文花枝先进事迹作出重要批示。中共中央政治局委员、国务院副总理吴仪充分肯定广大导游员对我国旅游业发展的重要贡献,指出:“我国的导游队伍整体是非常好的,乐于吃苦,乐于奉献”。中央领导同志的亲切关怀,充分体现了党中央、国务院对我国旅游业发展的高度重视,饱含着对包括广大导游人员在内的全国旅游从业人员的殷切期望。在党中央、国务院亲切关怀、鼓励、培养、教育下,我国一代又一代导游人员,艰苦创业、团结奋斗、拼搏进取,以高度的责任感和使命感,为我国旅游业不断发展壮大,为社会主义现代化事业,奉献力量和智慧,作出了积极贡献。
回顾新中国导游事业发展的历程,大体可以分为四个阶段。
(一)新中国成立以后至改革开放以前,老一代导游人员,服务于国家政治外交和对港澳台工作,为促进与世界各国和地区友好交往,作出了积极贡献。新中国成立后,1949年最早成立的旅游接待机构是华侨服务社。随着新中国的国际交往日趋频繁,国家先后于1954年和1957年成立了中国国际旅行社和中国旅行社,主要从事接待外国游客,华侨、华人以及港澳台同胞的工作。这一时期的导游工作者虽然人数较少,但是政治素质高、业务能力强、政治责任感和职业荣誉感强。这期间导游工作为新中国的对外友好交流和民间友好交往及对港澳台工作,发挥了积极作用。
(二)上世纪70年代末至90年代初,广大导游员为国家多创外汇,推动旅游业向经济产业发展,努力奉献。党的十一届三中全会后,在改革开放方针的指引下,党和国家中心工作转移到以经济建设为中心,加快推进社会主义现代化建设上来,中国旅游业获得了前所未有的发展机遇。立足于为国家现代化建设多创外汇,我国旅游业借改革开放之力、得改革开放之利,快速发展起来,并逐步由外事接待型向经营接待型和接待经营型转变。这一时期我国导游事业围绕发展入境旅游、接待入境游客而展开,经受了改革开放浪潮的洗礼,经受了计划经济向市场经济转变的考验。总体上,这一时期的导游队伍以旅行社的全职导游为主体,队伍不断扩大,思想十分活跃,政治素质、专业素质和外语水平较高,导游是一个非常有吸引力的就业门类。广大导游人员坚定理想信念,忠于职守,涌现了一大批爱岗敬业、乐于奉献、深受海外游客称赞的优秀导游人员。其中,有被海外游客亲切称赞“中国有个董先生”的全国劳动模范、国旅总社导游员董应烈同志等一批优秀导游员。他们是这一时期中国导游队伍的中坚力量和优秀代表,为中国旅游业的发展作出了积极贡献。
(三)上世纪90年代,广大导游员为把旅游业培育成为国民经济新的增长点,满足广大人民日益增长的旅游需求,努力奋斗,作出了重要贡献。党的十四大以后,我国社会主义现代化建设加快推进,对外开放不断深入,经济体制改革不断深化,社会主义市场经济体制逐步建立,我国经济社会发展进入新的阶段。旅游业先后被党中央、国务院确立为第三产业的重点和国民经济新的增长点着力加以培育。这一时期我国入境旅游持续快速增长,国内旅游迅猛发展,出境旅游开始逐步增长,初步形成三大市场共同发展的格局。与此同时,我国导游队伍发展出现深刻变化,一方面,在市场经济体制的推动下,适应三大旅游市场繁荣发展特别是国内旅游快速增长的需要,导游队伍规模迅速扩大,导游体制也发生了重大变化。绝大部分导游员坚持职业道德,努力提高业务水平,工作兢兢业业,满腔热忱为海内外旅游者服务,涌现了诸如田中义同志等一批优秀代表,为满足快速增长的旅游市场需求发挥了积极作用,为奠定中国旅游业国民经济新的增长点地位,作出了艰苦努力和积极的贡献。
(四)新世纪新时期,广大导游员服务于旅游三大市场全面发展,为扩大产业规模、提升产业素质、发挥产业功能,努力贡献才华和力量。进入新世纪以来,我国旅游业全面发展,入境旅游、国内旅游、出境旅游全面繁荣,产业规模快速增长,产业素质稳步提升,产业功能不断扩张,我国已经成为世界第四旅游大国。在这一进程中,广大导游员为海内外游客服务、为经济社会发展服务,为旅游业持续健康较快发展,发挥了重要作用。导游队伍规模快速扩大,到2006年9月底执业导游人数达32.05万人,达到历史上最大规模。导游人员的知识水平、文化程度、年龄结构、能力素质、劳动关系、市场环境、体制机制都在发生深刻变化。总体上,导游人员文化程度、知识水平、业务素质不断提高,年轻化、社会化、多样化趋势明显,市场意识、竞争意识、维权意识不断增强,有朝气、有活力,适应性强。广大导游人员忠于职守、爱岗敬业,勇于拼搏、乐于奉献,全心全意为旅游者服务,涌现出文花枝等一批新时期导游模范人物,为弘扬中华文化,促进中外交流,推动中国旅游业持续发展,贡献了才华和力量。
今天,我们回顾我国导游事业的发展历程,回顾我国导游队伍的成长历程,我们很自豪地看到,新中国一代又一代导游人员,在祖国繁荣发展的每一个时代,都为祖国和人民做出了贡献。通过一代又一代导游人员的艰苦奋斗,形成了中国导游队伍有知识、有才华,拼搏进取、爱岗敬业、乐于奉献、全心全意为海内外游客服务的优良传统。这是全国导游人员的光荣历史,也是全体旅游从业人员的精神财富。新时期新阶段,我们要把中国旅游工作者的优良传统、可贵精神继承下来,传播开去,发扬光大,成为推动我国旅游业不断发展壮大的强大精神动力。
二、关于加强我国导游队伍建设的指导思想和基本原则
(一)在全面建设小康社会、构建社会主义和谐社会进程中,我国旅游业发展对导游队伍建设提出了新的更高要求
当前,我国进入了社会主义现代化建设的关键阶段,党中央从我国经济社会发展全局和战略高度,提出了全面建设小康社会的宏伟目标,提出了全面贯彻落实科学发展观的战略思想,提出了构建社会主义和谐社会的战略任务。旅游业是一个综合性强、关联度高、蓬勃发展的新兴产业,在我国改革开放和现代化建设进程中,对促进经济增长、社会进步、文化繁荣发挥着积极的作用,对相关产业、行业的影响、促进作用日益显现,成为我国经济社会发展新的增长点。
“十一五”时期是我国旅游业发展的战略提升期,随着我国经济持续增长和人民生活水平的不断提高,随着中央确立的更多地依靠扩大消费促进我国经济持续增长的长期战略方针的实施,旅游需求将持续增长,我国旅游业迎来了新的发展机遇。中国旅游业“十一五”规划纲要明确提出“十一五”时期要加快完善产业体系、全面提高产业素质、综合发挥产业功能三大任务。导游是旅游服务的直接组织者和提供者,是旅游形象的展示者和传播者,是推动旅游业发展的重要力量。在全面建设小康社会、构建社会主义和谐社会的历史进程中,我国旅游业不断发展和壮大,迫切需要建设一支高素质导游队伍。
1、按照全面建设小康社会的要求,把旅游业培育成为国民经济重要产业,需要建设一支具有较高素质的导游人员队伍。
中央提出本世纪头二十年要建设惠及十几亿人口的更高水平的小康社会。要求进一步调整产业结构,实现经济增长方式的根本转变,实施扩大内需、促进消费的战略方针,大力发展第三产业,促进区域协调发展。旅游业是第三产业的重要产业,大力发展旅游业,对扩大内需、促进消费,促进产业结构调整和区域协调发展,具有积极的作用。把旅游业培育成为国民经济重要产业,必须保持三大旅游市场持续增长,满足海内外旅游者不断增长的需求。按照中国旅游业发展“十一五”规划纲要,到2010年我国入境过夜旅游者人数将达到6880万人次,国内旅游人数将达到17.8亿人次,为“十五”末的1.5倍;旅游总收入将达到12300亿元人民币,为“十五”末的1.6倍。旅游产业进一步快速增长的发展趋势,需要与之相适应的旅游从业人员队伍作保障,需要一大批热爱旅游、服务旅游、奉献旅游的导游人员一起共同承担历史重任。
2、按照全面落实科学发展观的要求,需要不断提升我国导游队伍的整体素质。
牢固树立和全面落实以人为本、促进经济社会全面协调可持续发展的科学发展观,对旅游业的服务宗旨、发展目标和发展模式,进一步提出了要求。一方面,立足于促进人的全面发展,旅游业要更好地满足海内外旅游者不断增长的旅游需求,必须强调“以游客为本”,不断完善旅游服务体系和质量保障体系,提供更高质量和更高水平的旅游服务。另一方面,立足于促进全面协调可持续发展,旅游业要按照建设资源节约型、环境友好型社会的要求,转变增长方式,创新发展模式,提高发展质量。导游作为旅游服务的直接提供者,在服务游客的过程中,带给游客知识、健康和愉悦,服务于人的发展;同时导游又是文明的使者,倡导文明、传播文明是导游的“天职”。通过导游可以更好地引导和促进旅游者熟知文化、交流文化,珍惜资源、保护环境,引导资源节约型、环境友好型的旅游消费方式。因此,全面贯彻落实科学发展观,需要广大导游员不断提高自身素质和文明修养,更好地服务游客,促进旅游业发展,促进人与自然和谐相处。
3、按照构建社会主义和谐社会的要求,需要不断创新和完善我国导游管理服务体制和机制。
旅游是促进社会和谐的积极力量。发展旅游业可以提高人的生活质量、发展和谐劳动关系、促进区域协调发展、促进人与自然和谐相处。导游作为旅游业发展的推动者、先进文化的传播者、中外交流的友好使者,在构建社会主义和谐社会中可以促进人与人之间诚信友爱,有利于促进社会安定有序。激发广大导游人员的活力,调动他们的积极性和创造性,是保障导游人员更好地服务于和谐社会建设的前提条件。因此,需要大力改革体制、加快创新机制,建立和完善导游管理服务体系,最大限度地增加导游队伍的和谐因素,最大限度地减少不和谐因素,发展和谐的劳动关系,着力推进建设和谐的发展环境。
4、按照建设世界旅游强国的要求,需要全面提高导游队伍的服务水平。
旅游业处于改革开放的前沿,随着对外开放的不断扩大和经济全球化、区域经济一体化发展,我国旅游业将加快融入全球旅游市场,参与国际旅游市场竞争。世界旅游组织提出,到2020年我国将成为世界第一大旅游接待国和第四大客源输出国。国家旅游局提出了建设世界旅游强国的目标。这就要求我们全面加快旅游产业体系建设,提升旅游软实力,提高旅游竞争力。人力资源是第一资源,市场竞争的根本在于人才的竞争。因此,在推进世界旅游强国建设的进程中,必须加强旅游从业人员队伍建设,提升从业人员素质和水平。其中,大力加强导游队伍建设、全面提升导游服务水平是至关重要的环节,因为导游是旅游业发展的重要力量,导游服务水平是旅游市场竞争力的关键因素之一。
总之,为适应新时期新阶段我国经济社会发展和旅游业持续健康快速增长的要求,建设一支规模日益扩大、素质不断提高、体制机制日渐完善、充满生机活力的导游人员队伍,已成为一项十分紧迫的任务。
搜索引擎技术的发展历程
在互联网络日益渗入我们日常生活的今天,海量的贮存和科学的搜索是人们信息行为中两样最重要的能力。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。互联网上的搜索引擎可以分为两大类:目录式搜索引擎以及基于关键词的搜索引擎。
1、目录式搜索引擎
我们知道,处理复杂事物的一种有效方法是按照一定标准将事物归类。经过归类后,每个事物都与其他事物建立联系,与未经分类的,杂乱无序的状态相比,此时查找就变得相对容易。目录式搜索引擎采取的就是这一方法。
●目录式搜索引擎的工作原理
目录式搜索引擎的数据库建立在人工编辑的基础上,由专业人员对网上信息进行选择、标引、分类,合理地将不同学科、专业、行业或区域的网络信息,按照分类或主题目录的形式组织起来,编制成为等级式的主题指南或主题目录,供用户浏览和寻找感兴趣的信息内容。
●目录式搜索引擎的典型代表Yahoo
Yahoo的信息组织方式具有以下特点:完备分类体系,归纳网上信息。它将传统的分类思想移植于网上信息的组织,在此思想的指导下,结合网络信息源的特点,构筑类目体系。在14个基本大类之下又以拥有信息的多寡及知识组织的需要程度,将每一基本大类细分成不同层次的次类目。层次越深,主题越专指,从而形成了一个由类目、子类目构成的可供浏览的相当详尽的目录等级结构,为网上丰富的信息资源归类,特别是确切归类提供了保障。
以人工方式为主,保证加工质量。采用分面分析原理,由信息专家编制主题目录,将人的智力投入到信息的选择与加工过程中,从而保证了目录编制的质量。同时,以人工为主,对提交的网页按主题目录进行筛选、归类和组织,克服了单纯由搜索软件自动分类所带来的缺陷,增强了分类的合理性,提高了检索的准确性。
●目录式搜索引擎的不足
覆盖率有限:网络信息增长迅速,使得采集信息的速度远远跟不上信息增长的速度,更不用说编制主题索引的速度了;分类困难:不同搜索引擎的体系结构不同,分类体系的建立缺乏统一的标准,使得同一内容的信息在不同搜索引擎中经常会被归入不同类目,造成用户的困扰;成本高,时效差。随着网络应用技术的发展,用户不再满足于这种对网站分类和摘要的简单查找,更希望对内容进行查找,于是就出现了基于关键词查询的搜索引擎。
2、基于关键词的搜索引擎
目前互联网上的搜索引擎大多数都采用了基于关键词的查询技术,其典型代表为Google和百度,内容可以覆盖互联网上的绝大多数网页内容。
基于关键词的搜索引擎一般由搜索器、索引器、检索器和用户接口等四个部分组成。
●基于关键词的搜索引擎的排序算法
基于关键词的搜索引擎通过程序收集并索引的信息资源量极其庞大,而用户的提问式却大多由几个词组成,这种情况会导致数量庞大的检索结果,用户需要花费巨大的精力进行浏览筛选。搜索引擎采用的排序算法包括以下几种:基于词频统计的排序算法。早期很多搜索引擎采用的排序算法是基于词频统计的,词权的计算一般把该词在HTML网页中出现的位置考虑进来,例如在标题中出现的词比在正文中的词权值高。但是由于网络资源的数量巨大,词频相同的两个网页质量却可能相差很远,因此这种算法的局限性很明显。
●基于超链分析的排序算法。
传统情报检索理论中的引文分析方法是确定学术文献权威性的重要方法之一,即根据引文的数量来确定文献的权威性。Google所采用的PageRank即借鉴了这一思想。PageRank的发明者对网络超链接结构和文献引文机制的相似性进行了研究,把引文分析思想借鉴到网络文档重要性的计算中来,利用网络自身的超链接结构给所有的网页确定一个重要性的等级数,以此来帮助实现排序算法的优化。但它存在着偏重旧网页和偏重综合站点的缺陷。
●基于关键词的搜索引擎的不足
明显的不足表现为:结果多,相关性低;更新慢;对自然语言理解能力差;不支持个性化查询;对多媒体内容的检索尚不成熟。
搜索引擎的技术热点
针对基于关键词搜索引擎所存在的不足,各搜索引擎网站纷纷向智能化、个性化方面发展,世界各国计算机科学界和信息产业界也都在积极的探索解决之道,搜索引擎已成为一个新的研究、开发领域。
1、多媒体搜索技术
基于内容的检索,是指直接对媒体内容特征和上下文语义环境进行的检索。一般而言,可用于网络检索的多媒体信息的内容特征大致包括:图像的颜色、纹理、形状等;声音的音频、响度、频度和音色等;影像的视频特征、运动特征等。这种类型的搜索引擎还不多见,并且主要用于图像检索,如QBIC、WeebSeek、ImageRover等。目前的多媒体搜索引擎覆盖面小,检索功能不够完善,效果也不太理想,因此,多媒体搜索技术尤其是音频、视频数据的检索仍是搜索引擎的一个研究重点。
2、对等搜索技术
目前的互联网是以服务器为中心的,人们向服务器发送请求,然后浏览服务器回应的信息,而对等搜索技术P2P(Peer to Peer)将以用户为中心,所有的用户都是平等的伙伴。相隔万里的用户可以通过P2P共享硬盘上的文件、目录甚至整个硬盘。把这一理念具体运用到搜索引擎技术上来:P2P将使用户能够深度搜索文档,而且这种搜索无须通过Web服务器,也可以不受信息文档格式和宿主设备的限制,可达到传统目录式搜索引擎无可比拟的深度。
P2P网络的一个很大的问题在于搜索信息时所产生的网络通信量非常巨大,在时间和网络资源方面造成很大的浪费。为方便P2P网络中的信息检索,有关专家提出了三种建立在特征文件基础上的检索机制:对语义路由进行详细分析,提出了一个建立在此技术和RDF技术基础上的新方法。
3、用户行为分析
一个以西班牙语的目录式搜索引擎的用户日志为样本分析了网络用户的搜索行为,发现网络搜索用户与传统检索系统的用户其行为存在差别,例如,网络用户一般只查看最前面的几个结果页面,网络用户很少使用操作符构造提问式等。该研究还对搜索次数与用户每分钟查看的文献或目录数进行了分析。
4、智能检索技术
智能检索主要包括自然语言处理、个性化搜索等技术,目前涉及这一领域的研究较多。
智能工具MySpiders是一个线性多代理系统,可以在用户提问时对网络信息进行挖掘,实现实时的动态查询,从而加强搜索引擎的功能。智能检索系统——ACIRD使用机器学习技术组织和检索网络文献。它由知识获取模块、文献分类器和搜索引擎组成。
5、检索结果的后处理
目前这方面的研究内容主要集中在结果排序的优化算法以及结果的聚类及可视化等领域。
对内容敏感的排序算法的研究表明,传统的PageRank算法是与提问无关的,只计算一个向量值用以衡量网页的重要性。而事实上,对于不同的提问,网页的重要性也不相同。
检索结果可视化并可修正提问的交互系统Webrat不依赖事先计算好的元数据,而是直接从搜索引擎的结果列表中获取所有必要信息,将结果文献实时动态聚类,并以图示方法提供给用户。用户可以利用选择关键词以及类别的方式与系统交互,从而修正提问获取更满意的结果。该系统独立于语言,适用于大量数据来源及可视化模型。
结束语
要想真正解决网络搜索问题,完全满足用户的各种信息查询需求,搜索引擎要解决的难题还很多。这些难题包括:科学组织和管理索引数据库,保持索引的更新与完整,包括对隐藏内容的索引;鉴别站点的优劣,向用户推荐质量高的内容,鉴别并移除恶意内容及链接;研究开发能充分表达用户查询要求的查询语言、方式和模式,提高查询语言的功能和查询的准确性;挖掘研究用户反馈,提高网络搜索的智能性,为用户提供个性化的服务;实现网络信息的自动化处理等。
参考资料:
①张莉扬.Yahoo的信息组织方式及其在数字图书馆信息资源建设中的应用.图书情报知识,2001(3):48-50
②曹军.Google的PageRank技术剖析.情报杂志,2002(10):15-18
③Hang Cui Etc. Query Expansion By Mining User Logs. IEEE Transactions on Knowledge and Data Engineering, Vol.15, No.4, 2003, 829-839