3.3.1 计算机网络技术
计算机网络是会展管理信息系统运行的基础,不仅如此,计算机网络技术也是会展管理信息系统开发中进行数据传输所使用的应用技术。
1)计算机网络技术的发展
世界上第一个计算机网络是出现在20世纪60年代后期的美国的高级研究计划署网络(Advanced Research Projects Agency NET),简称ARPA NET。它的第一个节点于1969年在加利福尼亚大学洛杉矶分校安装,最终发展成为今天的Internet。在我国,Internet的使用最早可以追溯到1987年9月下旬,以钱天白教授发出的我国第一封电子邮件“越过长城,通向世界”为标志,揭开了我国开始使用Internet的序幕。
计算机网络的形成与发展大致分为如下四个阶段。
(1)第一个阶段:20世纪50年代至20世纪60年代
1946年,世界上第一台数字电子计算机问世后,计算机并没有普及开来,其数量还很少而且非常昂贵,用户使用起来非常不便。直到1954年,出现了一种叫作收发器(Transceiver)的计算机终端,人们使用这种终端首次实现了将穿孔卡片上的数据从电话线上发送到异地的计算机终端。此后,电传打字机也作为远程终端和计算机连接了。这样,用户可以在异地的电传打字机上键入自己的程序并传递给计算机,而计算机计算出来的结果又可以从计算机上传送到异地的电传打字机并打印出来。这样,计算机网络的概念(Computer Network)就诞生了。
由于当时的计算机是为了成批处理数据而设计的,因此当需要计算机与远程终端连接时,必须在计算机上增加一个接口,而且这个接口应当对计算机原来的硬件和软件的影响尽可能地小,由此而出现了线路控制器(Line Control-ler)。当时计算机上信息的传递主要依靠电话线路,而电话线本来是为传递模拟信号设计的,因此人们使用了叫作调制解调器(Modem)的专用设备来实现电话线上数字信号的传输。(图3-2)
图3-2 线路控制的网络体系结构
(2)第二个阶段:20世纪60年代至20世纪70年代中期
此阶段以美国的APPA NET与分组交换技术为重要标志。随着远程终端数量的增加,为了避免一台计算机使用多个线路控制器,在20世纪60年代初,出现了多线路控制器,可以和许多个远程终端相连接,人们将这种最简单的计算机联机系统称为面向终端的计算机网络,这就是第一代计算机网络。(图3-3)
在第一代计算机网络里,计算机是网络的中心和控制者,终端围绕着中心计算机分布在各处,而计算机的主要任务仍旧是进行成批处理。
电话诞生后,人们便意识到在所有用户之间架设直接的通信线路是一种极大的浪费,必须依靠交换机来实现用户之间的互联,才能避免如此可怕的浪费。一个多世纪以来,电话交换机经过了许多次的更新换代:从人工接续、步进制交换机、纵横制交换机,直到现代的程控交换机,基本上都是采用电路交换(Circuit Switching)方式,其本质始终没有改变。从资源分配的角度观察,电路交换是预先分配信号的传输带宽,用户在开始通信之前,必须先申请建立一条从发送端到接收端的物理通道。这个申请过程一般是由拨号来完成的,只有在此物理通道建立后,双方才能进行通信。在通信的全部时间里,用户始终占有端到端的固定传输带宽。
图3-3 多线路控制的网络体系结构
电路交换本来是为语音通信而设计的,它对于计算机网络建立信息通道的呼叫来说,时间实在是太长了。因而,必须寻找新的适合于计算机进行通信的交换机技术。
1964年8 月,巴兰在美国RC公司论分布式通信的研究报告中首先提及了存贮式转发的概念。与此同时,英国的皇家物理实验室(Royal Physical Labora-tory)和法国的国际电子通信研究中心(Societe Internationale de Telecommunica-tions Aeronotiques)已开始进行计算机间的通信研究。
1966年,英国皇家物理实验室的戴维斯首先提出分组交换(Packet Ex-change)的概念,并证明分组交换技术在计算机间传输命令核数据时能够表现出极大的灵活性和可靠性。
1969年2 月,美国国防部高级研究计划局(Advanced Research Projects Agency)的分组交换网ARPA NET建成并投入运行。虽然最初的ARPA NET网上仅有四个节点,但计算机通信以分组交换的通信子网为中心,构成用户资源子网的计算机主机和终端都处在网络的边缘,用户不仅可以享受通信子网的资源,而且还可以享受用户资源子网的各种硬件和软件资源。(图3-4)从此,进入了第二代计算机网络时代,揭开了网络发展的新纪元。
(3)第三个阶段:20世纪70年代中期至20世纪90年代
由于计算机网络是一个非常复杂的系统,相互通信的两台计算机系统必须高度协调工作,而这种协调是很严格的。为了设计这样复杂的计算机网络,早在最初的ARPA NET网设计时就提出了分层的方法。分层可以将庞大而复杂的问题转化为若干较小,也比较容易研究和处理解决的问题。
图3-4 APPA NET的网络体系结构
1974年,美国IBM公司宣布了它研究的系统网络体系结构(SystemNetwork Argument),这个著名的网络标准就是按照分层的方法制定的。网络体系结构的出现,使得一个厂商所生产的各种设备都能够很容易地互联成网。但一旦用户购置了不同厂商的产品,则由于网络体系结构的不同而很难互相联通。针对这种情形,国际标准化组织(ISO)于1977年设立了专门的研究机构,不久便提出了一个使各种计算机互联成网的标准框架——开放式系统互联基本参考模型(OSI/RM)。从此以后,开始了第三代计算机网络的时代。
(4)第四个阶段:20世纪90年代至今
进入20世纪80年代以后,在计算机网络领域最引人注目的就是美国的因特网的飞速发展,目前它已经成为世界上最大的国际性计算机网络。但因特网仍然属于第三代计算机网络,因为它的网络结构仍然使用的是分层的网络体系结构,并没有使用到开放式系统互联基本参考模型。
随着人类社会的发展,网络已经与人类息息相关,按照计算机网络发展的趋势,第四代网络体系结构的出现是必然的。目前,属于第四代计算机网络体系结构的是IPv6技术,然而,其大范围应用还有一段距离。
IPv6是Internet Protocol Version 6的缩写,也被称作下一代互联网协议,它是由互联网工程任务组(Internet Engineering Task Force,IETF)设计的用来替代现行的IPv4协议的一种新的IP协议。IPv6是为了解决IPv4所存在的一些问题和不足而提出的,同时它还在许多方面提出了改进,例如路由方面、自动配置方面。经过一个较长的IPv4和IPv6共存的时期,IPv6最终会完全取代IPv4在互联网上占据统治地位。对比IPv4,IPv6有如下特点,这些特点也可以称作IPv6的优点:简化的报头和灵活的扩展;层次化的地址结构;即插即用的联网方式;网络层的认证与加密;服务质量的满足;对移动通信更好地支持。
目前需要的是,在不断改变网络体系结构的前提下,用有效的技术充分利用处理器的计算能力。国外已经有很多研究机构正在沿着这个方向积极开展工作,其中,可编程网络(Active Networking)是一个公众瞩目的热点。我们将其称为后TCP/IP协议模型,它将引导计算机网络向主动网络体系结构方向发展。
【小资料】
IPv4及其局限性
IPv4,是互联网协议(Internet Protocol,IP)的第四版,也是第一个被广泛使用,构成现今互联网技术的基石的协议。现行的IPv4自1981年RFC 791标准发布以来,并没有多大的改变。事实证明,IPv4具有相当旺盛的生命力,易于实现且互操作性良好,经受住了从早期小规模互联网络扩展到如今全球范围In-ternet应用的考验。所有这一切,都应归功于IPv4最初的优良设计。但是,还是有一些发展是设计之初未曾预料到的。
近年来,互联网呈指数级的飞速发展,导致IPv4地址空间几近耗竭。IP地址变得越来越珍稀,迫使许多企业不得不使用网络地址转换(Network Address Translation,NAT)将多个内部地址映射成一个公共IP地址。地址转换技术虽然在一定程度上缓解了公共IP地址匮乏的压力,但它不支持某些网络层安全协议以及难免在地址映射中出现种种错误,这又造成了一些新的问题。而且,靠NAT并不可能从根本上解决IP地址匮乏问题,随着联网设备的急剧增加,IPv4公共地址总有一天会完全耗尽。
因特网主干网路由器维护大型路由表能力的增强。目前的IPv4路由的基本结构是平面路由机制和层次路由机制的混合,因特网核心主干网路由器可维护85000条以上的路由表项。
地址配置趋向于要求更简单化。目前,绝大多数IPv4地址的配置需要手工操作或使用DHCP(动态宿主机配置协议)地址配置协议完成。随着越来越多的计算机和相关设备使用IP地址,必然要求提高地址配置的自动化程度,使之更简单化,且其他配置设置能不依赖于DHCP协议的管理。
IP层安全需求的增长。在因特网这样的公共媒体上进行专用数据通信一般都要求加密服务,以此保证数据在传输过程中不会泄露或遭窃取。虽然目前有IPSec协议可以提供对IPv4数据包的安全保护,但由于该协议只是个可选标准,企业使用各自私有安全解决方案的情况还是相当普遍。
更好的实时服务质量(Quality of Service,QoS)支持的需求。IPv4的QoS标准,在实时传输支持上依赖于IPv4的服务类型字段(TOS)和使用UDP或TCP端口进行身份认证。但IPv4的TOS字段功能有限,而同时可能造成实时传输超时的因素又太多。此外,如果IPv4数据包加密的话,就无法使用TCP/UDP端口进行身份认证。
资料来源:[2013-07-19]http://www.baike.com/wiki/IPv4.
2)计算机网络的概念与功能
计算机网络(Network)是将处在不同地理位置且相互独立的计算机或设备,通过传输介质和网络设备,按照特定的结构和协议相互连接起来,利用网络操作系统进行管理和控制,从而实现信息传输和资源共享的一种信息系统。
计算机网络的功能主要体现在以下几个方面。
(1)数据通信
计算机网络主要提供传真、电子邮件、电子数据交换(EDI)、电子公告牌(BBS)、远程登录和浏览等数据通信服务。
(2)资源共享
凡是入网用户均能享受网络中各个计算机系统的全部或部分软件、硬件和数据资源。
(3)提高计算机的可靠性和可用性
网络中的每台计算机都可通过网络相互成为后备机,一旦某台计算机出现故障,它的任务就可由其他的计算机代为完成。这样,可以避免在单击情况下,一台计算机发生故障引起整个系统瘫痪的现象,从而提高系统的可靠性。而当网络中的某台计算机负担过重时,网络又可以将新的任务交给较空闲的计算机完成,均衡负载,从而提高了每台计算机的可用性。
(4)分布式处理
通过计算法,将大型的综合性问题交给不同的计算机同时进行处理。用户可以根据需要合理选择网络资源,就近、快速地进行处理。
3)计算机网络的类型
按照分类方法的不同,计算机网络有多种类型,下面介绍几种常见的划分方法。
(1)按网络的地理位置分类
①局域网(LAN):一般限定在较小的区域内,小于10千米的范围,通常采用有线的方式连接起来。
②城域网(MAN):规模局限在一座城市的范围内,10~100千米的区域。
③广域网(WAN):网络跨越国界、洲界,甚至全球范围。
目前,局域网和广域网是网络的热点。局域网是组成其他两种类型网络的基础,城域网一般都加入了广域网。广域网的典型代表是因特网。
④个人局域网(PAN):个人局域网就是在个人工作地方,把属于个人使用的电子设备(如便携电脑等)用无线技术连接起来的网络,因此也常称为无线个人局域网WPAN,其范围大约在10米左右。
(2)按传输介质分类
①有线网:采用同轴电缆和双绞线来连接的计算机网络。同轴电缆网是常见的一种联网方式。它比较经济,安装较为便利,传输率和抗干扰能力一般,传输距离较短。双绞线网是目前最常见的联网方式。它价格便宜、安装方便,但易受干扰、传输率较低,传输距离比同轴电缆要短。
②光纤网:光纤网也是有线网的一种,但由于其特殊性而单独列出。光纤网采用光导纤维做传输介质。光纤传输距离长、传输率高,可达数千兆bps,抗干扰性强,不会受到电子监听设备的监听,是高安全性网络的理想选择。不过由于其价格较高,且需要高水平的安装技术,所以现在尚未普及。
③无线网:用电磁波作为载体来传输数据。目前无线网联网费用较高,还不太普及。但由于联网方式灵活方便,是一种很有前途的联网方式。
局域网常采用单一的传输介质,而城域网和广域网采用多种传输介质。
(3)按网络的拓扑结构分类
网络的拓扑结构是指网络中通信线路和站点(计算机或设备)的几何排列形式,通常可以分为星形网络、环形网络和总线型三种基本类型。(图3-5)
图3-5 网络拓扑结构
①星形网络:各站点通过点到点的链路与中心站相连。特点是很容易在网络中增加新的站点,数据的安全性和优先级容易控制,易实现网络监控,但中心节点的故障会引起整个网络瘫痪。
②环形网络:各站点通过通信介质连成一个封闭的环形。环形网容易安装和监控,但容量有限,网络建成后,难以增加新的站点。
③总线型网络:网络中所有的站点共享一条数据通道。总线型网络安装简单方便,需要铺设的电缆最短,成本低,某个站点的故障一般不会影响整个网络,但介质的故障会导致网络瘫痪。总线型网络安全性低,监控比较困难,增加新站点也不如星形网容易。
树形网、簇星形网、网状网等其他类型拓扑结构的网络都是以上述三种拓扑结构为基础的。
(4)按通信方式分类
①点对点传输网络:数据以点到点的方式在计算机或通信设备中传输。星形网、环形网采用这种传输方式。
②广播式传输网络:数据在共用介质中传输。无线网和总线型网络属于这种类型。
(5)按网络使用的目的分类
①共享资源网:使用者可共享网络中的各种资源,如文件、扫描仪、绘图仪、打印机以及各种服务。因特网是典型的共享资源网。
②数据处理网:用于处理数据的网络,例如科学计算网络、企业经营管理用网络等。
③数据传输网:用来搜集、交换、传输数据的网络,如情报检索网络等。
除了以上几种常见的划分方法外,还有一些其他的分类方法,如按信息传输模式的特点来分类的ATM网。该网内数据采用异步传输模式,数据以53字节单元进行传输,提供高达1.2gbps的传输率,有预测网络延时的能力。ATM网可以传输语音、视频等实时信息,是最有发展前途的网络类型之一。另外,还有一些非正规的分类方法,如企业网、校园网,根据名称便可理解其用途。
4)网络协议与参考模型
(1)网络协议
网络协议是网络中计算机或设备之间进行通信的一系列规则的集合。只有它的存在才能使网上计算机有条不紊地通信,而不会出现传输的信息无法理解的现象。常用的网络协议有IP、TCP、HTTP、POP3、SMTP等。
(2)OSI参考模型
随着网络的普及和应用,网络互联标准已成为必须解决的问题。因此,1974年国际标准化组织,发布了著名的ISO/IEC7498标准,即开放系统互联参考模型(Open SystemInternetwork,OSI),定义了网络互联的物理层、数据连路层,网络层、传输层、会话层、表示层、应用层七层网络体系结构。(图3-6)
①物理层。它是OSI模型中的第一层,也是最低层。它的功能是利用传输介质为数据链路层提供物理连接,实现了二进制比特流的透明传输。它定义了电缆的类型、传输的电信号或光电信号、电缆如何接到网卡、数据编码方案与同步等。
②数据链路层,它是OSI模型中的第二层。在物理层提供服务的基础上,该层在通信实体间建立数据链路连接,传输以帧为单位的数据包,进行差错控制与流量控制。同时,使有差错的物理线路变成无差错的数据线路。
图3-6 OSI参考模型
③网络层。它是OSI模型中的第三层。它为在节点间传输创造逻辑链路,通过路由选择算法为分组通过通信子网选择最佳、最适当的路径,以实现拥塞控制、网络互联等功能。
④传输层。它是OSI模型中的第四层。它向用户提供可靠的端到端服务,传送报文并且提供数据流量控制和错误处理。
⑤会话层。它是OSI模型中的第五层。它负责维护节点间会话、进程间的通信,以及管理数据交换。
⑥表示层。它是OSI模型中的第六层。它用于处理在两个通信系统中交换信息的表示方式,包括负责协议转换、数据格式交换、数据加密和解密、数据压缩与恢复。
⑦应用层。它是OSI模型中的第七层。它为应用软件提供服务,如文件传输、电子邮件收发等。
在互联网上,从计算机A传送数据到计算机B,OSI参考模型的七层结构保证了数据传送的正确无误。
(3)TCP/IP参考模型
TCP/IP协议是因特网上两个重要的通信协议。TCP是传输控制协议(Transfer Control Protocol,TCP),IP是网际协议(Internet Protocol,IP)。网络体系结构模型(TCP/IP参考模型)为四层,它们为主机—网络层(也称作链路层)、互联层、传输层、应用层。(图3-7)
①主机—网络层。它是TCP/IP模型中的第一层。它负责通过网络发送和接收IP数据报及硬件设备驱动。
图3-7 TCP/IP参考模型
②互联层。它是TCP/IP模型中的第二层。它负责将源主机的报文分组发送到目的主机。
③传输层。它是TCP/IP模型中的第三层。它负责应用程序间的端对端的通信。
④应用层。它是TCP/IP模型中的第四层。它负责为用户调用访问网络应用程序,应用程序再与传输层协议相配合,发送或接收数据。它包括所有高层协议,并不断有新的协议加入。TCP/IP常用的协议有Telnet远程登录协议(Re-mote Login)、FTP文件传输协议(File Transfer Protocol)、SMTP简单邮件协议(Simple Mail Transfer Protocol)、NFS网络文件服务协议(Network File Server)、UDP用户数据报协议(User DatagramProtocol)。
(4)OSI参考模型与TCP/IP参考模型之间的关系
TCP/IP协议紧密地映射到OSI参考模型的各层,TCP/IP的四层模型在定义功能上类似于OSI模型,他们之间的映射关系见图3-8。
5)Intranet及其应用
内联网(Intranet)也被称作内部网络。它是指利用互联网技术构建的一个企业、组织或者部门内部的提供综合性服务的计算机网络。
内联网将互联网的成熟技术应用于企业、组织或者部门内部,使TCP/IP、SMTP、www、Java、ASP等先进技术在信息系统中充分发挥作用,将www服务、E-mail服务、FTP服务、News服务等迁移到了企业、组织或者部门内部,实现了内部网络的开放性、低投资性、易操作性以及运营成本的低廉性。
图3-8 OSI参考模型与TCP/IP参考模型间的关系
通过防火墙的安全机制,可以将内联网与互联网实现平滑连接并保障内部网络信息的安全隔离。现在多数企业使用内联网在企业内部发布信息,或者把他们原来的数据库与www服务器连接起来,使信息查询变得更为快捷。如果企业已经建成了内联网,那么就可以在企业内部浏览网页、收发电子邮件等。
(1)Intranet与MIS的关系
内联网是MIS的一种实现方式,它既不能代替MIS的整个理论体系和开发技术,也不是MIS发展的一个新阶段,而是MIS物理模型中的一种体系结构。
传统的MIS存在着一些问题,如系统封闭、用户界面操作不统一、多种软件版本并存、维护移植困难等。基于内联网的系统为MIS增加了许多新功能,包括利用Web服务器发布企业各种信息,提供极好的信息交流工具;员工利用电子邮件方便、快速地传递信息,提高了工作效率;使用Usenet新闻组讨论;与内联网连接等。这些新功能较为彻底地解决了传统的MIS存在的问题。(www.zuozong.com)
使用了内联网技术的MIS与传统的MIS相比,具有升级比较方便(使用了Web服务器和浏览器软件),有利于处理大量的非结构化数据,具有缩短开发周期等优点。内联网为新一代企业MIS的开发注入了强劲的活力。但内联网是一种新技术,与之相配合的软件产品和工具尚不多,许多方面的技术问题还有待探讨,应用效果也有待进一步检验。
(2)基于Intranet的MIS体系结构
自20世纪90年代以来,现代企业呈现集团化、多元化、信息化的发展趋势。同一个企业,特别是大企业,往往跨越不同的地区、国家,所生产、经营的产品往往涉及多个领域。企业需要及时了解其各地下属部门的经营状况,同一企业内不同部门、不同地区员工之间需要及时共享、交流大量的企业内部信息。另外,企业与客户之间、合作伙伴之间也需要进行信息交流。此时,传统的MIS已难以适应现代企业发展的需要,于是,基于Intranet的新型企业MIS应运而生。
基于Intranet的企业MIS,简称为企业内联网(比单指Intranet的内联网内容要广些),近年来发展特别快,不少单位建造的企业网、校园网等,都属于这种类型的内部专用网。
企业内联网利用Intranet的Web模型作为标准平台,采用Internet的TCP/IP作为通信协议,同时运用防火墙技术保证内部网络资源的安全性,在企业内部网络上形成了一种三层结构的客户机/服务器模式,即浏览器/应用服务器/数据库服务器模式,并由此构成了企业MIS的基础结构。(图3-9)
图3-9 企业MIS的基本结构图
①网络应用支持平台:采用统一、标准的TCP/IP网络协议,结合网际互联、路由、网管、防火墙及虚拟专网(VPN)等现代网络核心技术建立起安全、稳固的开放式应用平台,支持应用软件的运行。它是整个企业管理信息综合环境的基础,也是重要的通信基础设施,可实现多平台、多协议、多操作系统之间的通信。它对应用系统透明,可以保证不同系统之间良好的连接。
②信息资源管理平台:是将来自企业内、外部的各种业务信息、办公信息、档案信息等“信息部件”,通过企业资源规划(ERP)分门别类地按不同主题组装为“信息产品”的“装配工厂”。它融合应用了因特网、Web、HTML、图文声像并茂的多媒体开放文档体系结构,数据仓库、交互式对象和中、西文全文检索等各项技术,把多个不同操作系统平台上的Web服务器、消息传递服务器及工作流服务器组成一个巨大而开放的虚拟资料库,在整个企业网中实现文档统一管理,摆脱了传统文档体系孤立、封闭、不易传递信息、不易管理和扩展的局限性,使信息有一个生成、发布、搜索、利用、再创造的循环机制。它不仅能使用户方便地查询到任何所需信息,而且为企业内、外部大规模信息的组织、发布提供了有力手段。
③消息传递与工作流平台:具有先进的消息传递和分布式目标管理、追踪工作流程的用户化事务处理管理,安全可靠的数据签名、身份验证和加密功能,用以发布信息并及时掌握信息的具体流向和反馈,提高了工作效率。它所提供的是一个功能强大且易于管理的企业集成电子邮件、个人及群组工作表、电子表格及共享信息的应用系统,用户既可获取信息,也可发布信息,其信息流是全双向、多媒体形式。企业的办公活动不再受时间、空间和地域的限制,极大地提高了企业的工作效率和管理质量。
④事务处理应用平台:主要负责企业内部业务数据的采集、处理、存储和分析,是传统MIS基层部分的扩展。它吸收了商业化客户端/服务器(C/S)的技术特点,采用分布式处理结构和先进的数据库管理系统技术,建立了具有各种分析、预测等辅助决策功能的事务处理模式,这些功能在传统的MIS中是非常欠缺的。
3.3.2 数据库技术
在会展管理信息系统开发中,要处理大量不同类型的数据,对数据的存取、相应的处理和管理是通过数据库技术来完成的。本部分主要介绍数据库技术在MIS中的应用。
1)数据库的概念
计算机中数据的组织方式有多种,包括字符、字段、记录、文件和数据库,这些都是会展管理信息系统开发中会遇到的数据类型。
(1)字符
字符(character)是最基本的数据元素,它是一个简单的字母,或是一个数字,或是一个其他符号。
(2)字段
字段(field),也称作数据项,是比字符高一层次的数据,一个字段由一组相关字符构成。字段表示的是实体(entity),指事物、人、地方或事件的属性(at-tribute)。
(3)记录
记录(record)是由相关数据字段所组成的,一个记录就是描述一个实体的属性集。通常来说,有定长记录和变长记录之分。定长记录是由固定数目的定长字段构成,而变长记录的字段数量和字段长度是可变的。
(4)文件
文件(file),或称数据表,它是一组相关记录的集合。按照文件的应用进行分类,它有工资文件、库存文件等;根据文件中的数据类型对其进行分类,可以分为文本文件、图形文件等。
(5)数据库
数据库(database)是逻辑相关的所有数据元素的集合。数据库将原来存储于彼此隔离的文件中的记录合并到一个公共的数据元素池中,可以向很多应用提供数据,这些数据是独立存在的。数据库中包含描述实体及实体间关系的数据元素,它是事物处理、信息管理等应用系统的基础。
2)数据库的类型与结构
(1)数据库的类型
①根据数据模型分类,可分为层次数据库、网状数据库、关系数据库、面向对象数据库、演绎数据库(知识数据库)。
②根据体系结构分类,可分为集中式数据库、分布式数据库、客户—服务器数据库。
③根据数据类型分类,可分为统计数据库、工程数据库、时态数据库、传统事物处理数据库、模糊数据库、多媒体数据库。
众多不同类型的数据库中,关系型数据库仍然是目前的主流数据库。关系型数据库是指按照关系模型来存放数据的数据库。首先,确定一个数据库中应该有哪些表和每个关系模式的构成,然后确定各表由哪些属性组成。它在数据库管理系统(DBMS)支持下,建立关系模式,输入数据,将一个个表建立起来,并将多个相关表组织到一个数据库中,完成一个数据库的建立。
(2)数据库的结构
数据库的结构是一个多极结构,一方面能方便地存储数据,同时又能高效、安全地组织数据。现有的数据库系统都采用三级模式和二级映射结构。其结构层次见图3-10。
图3-10 数据库的体系结构
①模式,又称概念模式。它是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
②外模式,又称子模式或用户模式。它是数据库用户所看到和使用的局部数据的逻辑结构和特征的描述,也就是用户看到和使用的数据。外模式是保证数据库安全性的一个有力措施,每个用户只能看见和访问所对应的外模式中的数据,数据库中其余的数据对他们来说是不可见的。
③内模式,又称存储模式。是数据的物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式。
数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给了数据库管理系统去管理,使用户能逻辑、抽象地处理数据,而不必关心数据在计算机中具体的表示方式和存储方式。
为了实现这三个抽象层次的联系和转换,数据库系统在三级模式中提供两种映射:外模式/模式映射和模式/内模式映射。
正是由于这二级映射功能,使数据库系统中数据具有较高的逻辑独立性和物理独立性。
3)数据仓库与数据挖掘
(1)数据仓库
数据仓库概念是对数据库概念的进一步深化。数据仓库的建立并不是要取代数据库,而是来源于其他数据库。它要建立在一个较全面和完善的信息应用基础之上,用于支持高层决策的分析。数据仓库是数据库技术的一种新的应用,到目前为止,数据仓库还是用数据库管理系统来管理其中的数据。
数据仓库是现有的数据库系统中的数据和其他一些外部数据的一次重组,重组时以能更好地为决策分析应用提供数据支持为原则。简单地说,数据仓库就是一个为特定的决策分析而建立的数据仓储。它是一个专门的数据仓储,用来保存从多个数据库或其他数据源选取的已有数据,并为上层应用提供统一的用户接口,以完成数据查询和分析。
数据仓库通常包含大量的、经过提炼的、面向主题的数据。它具有如下特征。
①数据仓库具有面向主题的特征。一个数据仓库必须是根据某些企业关心的主题来建立的。面向主题意味着对于数据内容的选择及对信息详细程度的选择,把与决策问题无关的数据排除在数据仓库之外。
②数据仓库的数据是集成化的。即从各个部门提取的数据要进行转化或称“整合”处理,以统一原始数据中所有矛盾之处。这样,才能构成数据仓库中的分析型数据,这是数据仓库中最关键的因素。
③数据仓库主要保存历史性数据。这些数据反映组织环境和状态在一个很长时间轴上的变化,形成时间序列数据,而且随着时间的流逝而增加。数据一旦进入数据仓库,它只能被用户所检索,不会再被改变。
④和传统的数据库相比,数据仓库系统对数据检索和处理的时间性要求较低。使用者提出查询要求后,数据仓库可以经过若干小时将数据查到,用户还可以对所得到的信息包进行进一步加工处理。
概括地说,数据仓库就是面向主题,集成、稳定、不同时间的数据集合。数据仓库中的数据面向主题与传统数据库面向应用相对应。数据仓库的集成特性是指首先要统一原始数据中的矛盾之处,然后将原始数据结构进行一个从面向应用向面向主题的转变。
(2)数据挖掘
数据挖掘和数据仓库作为决策支持新技术,在近十年来得到迅速发展。而且,数据仓库和数据挖掘是结合起来发展的。数据挖掘是从数据中发现隐含有用的信息或知识的技术,是为满足和解决当前“数据太多,信息不足”的技术。具体地讲,数据挖掘就是应用一系列技术、从大型数据库或数据仓库的数据中提取人们感兴趣的信息或知识,这些知识或信息是隐含的、事先未知而潜在有用的。
数据挖掘又称数据采掘或数据开采,是知识发现的关键步骤。通常情况下,人们不严格区分“数据挖掘”和“知识发现”。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术,可以帮助决策者寻找数据间潜在的关联,发现被忽略的因素。
数据挖掘研究的主要内容是算法和应用。数据挖掘是应用特定的发现算法,从大量数据中搜索或产生一个感兴趣的模式或数据集。特别要指出的是,数据挖掘技术从一开始就是面向应用的。
4)数据库管理
(1)数据库管理系统
数据库管理系统(DBMS)是数据库系统的核心,是介于操作系统和用户之间的一组软件。它能有效地负责数据库的建立、使用、维护和实施,对数据库进行统一的管理和控制。有了数据库管理系统,用户就可以在抽象意义下处理数据,而不必去考虑这些数据在计算机内的布局和物理位置。用户通过DBMS提供的命令可以直接地或编写应用程序对数据库进行各种操作。此外,DBMS还要负责数据的安全性和完整性。
DBMS的功能主要体现在以下几个方面。
①数据库定义功能。DBMS通过提供数据描述语言(Data Descriptive Lan-guage,又称为数据定义语言,缩写为DDL)来对数据库的结构(包括外模式、模式、内模式的定义)和数据的各种特性进行定义和描述,然后由模式翻译程序将用DDL写成的源模式翻译成目标模式。这些目标模式中只是对数据库的系统结构进行描述,刻画了数据库的框架,不涉及数据库的内容——数据的描述。此外,还包括对数据库完整性的定义、数据库安全性的定义(如用户口令、级别、存取权限)、存取路径的定义(如索引)等。这些目标模式和定义被存储在数据字典(也称系统目录)中,是DBMS运行的基本依据。
②数据操纵功能。DBMS通过提供数据操纵语言(Data Manipulation Lan-guage,缩写为DML)来实现对数据库中的数据进行操作,如对数据库中数据的查询、插入、修改和删除等。DML是用户与数据库系统之间的接口之一.是DBMS向应用程序员提供的一组宏指令(宏指令是代表某功能的一段源程序,是汇编语言程序中的一种伪指令)或调用语句,用户也通过它来向DBMS提出对数据库中的数据进行各种操作。
一个好的DBMS应该提供功能强、易学易用的DML,方便的操作方式和较高的数据存取效率。
DML有两类,一类是宿主型DML(又称嵌入式DML),一类是自含型DML。前者的语句不能独立使用而必须嵌入某种宿主语言,如嵌入COBOL语言或C语言使用;另一种是使用主语言中的子程序调用语句来同DML相接。后者自成体系,语法简单、功能齐全,有自己独立的解释和编译系统,可独立使用,并且通常提供终端用户交互式使用和批处理(应用程序方式)两种使用形式。
③系统运行控制功能。数据库运行期间的管理和控制是DBMS的核心部分,它包括访问控制、并发控制、安全性控制、通信控制及数据库内部的管理和维护。对于数据库的管理和控制,DBMS是通过控制程序来实现的,所有对数据库的操作都要在这些控制程序的统一管理下进行,以确保数据库能正确、安全和有效地工作。
④数据库的建立和维护功能。数据库的建立是指如何将大量的实际数据存储到物理设备上,数据库的维护是指定期地将数据库中的数据组织一遍,并记录下数据库每次被访问时的用户名、进入时间、进行过何种操作、数据被改变情况等。这些都由DBMS提供的一些功能子程序来完成。
⑤数据库通信功能。数据库的通信功能是指数据库与操作系统之间的联机处理能力,是数据库与其他数值计算语言(如FORTRAN、C语言、PASCAL)之间的接口。这些语言具有很强的数值计算能力,但不具有数据库操作功能。用这些语言编写的程序运行时如果要访问数据库中的数据,首先要解决数据库的接口问题,也就是说要使数值计算语言具有对数据库操作的能力。
数据库语言FoxBASE、FoxPro等都提供与其他语言程序交换数据的命令,这些命令可以将数据库中的数据传送给具有某种特定格式(如SDF格式或DE-LIMITED格式)的文本文件中,或从这类文本文件中读出数据到数据库构成记录;而其他语言程序可利用自己的命令从具有SDF格式或DELIMITED格式的文件中读取数据,或将自己程序的运行结果传送到这类格式的文本文件中。在这种传递数据方式中,SDF格式和DELIMITED格式的文本文件起到了中间文件的作用。但这样做并非是对数值计算语言在数据库操作功能上的扩充,只是解决了数据传递的问题。此外,DBMS还提供了另外两种解决方法。
A.预编译方法。选择一种功能较强的语言,如C语言、PASCAL或其他语言作宿主语言,先由DBMS提供的预编译程序将用数据库语言写成的源程序进行扫描,然后将它们转换成宿主语言编译程序能接受和执行的语句。
B.将数据库处理功能语句嵌入宿主语言,同时修改和扩充宿主语言的编译程序,形成一种集成语言。
(2)数据库设计
利用数据库技术提供的各项功能开发出的数据库应用软件,一般都是用来取代某部门一个当前已经存在的人工处理系统。在这种情况下,设计出的数据库应用软件系统在完成功能方面应符合该部门的具体需要。因此,可以说数据库设计就是如何根据用户的需要,开发出满足特定的数据库管理系统支持的数据库结构的过程。
在数据库设计中,始终贯穿着“数据”和“加工”这两大主题。其核心在于如何建立一个数据模式,使其满足下面的条件。
①符合用户的要求,正确反映出用户的现实环境。它应该包含用户需处理的所有“数据”,并支持用户需要进行的所有“加工”处理。
②能被某个现有的数据库管理系统所接受。
③具有较高的质量,易于维护、理解和提高效率。
一般而言,数据库设计应遵循以下步骤。(图3-11)
①需求分析。调查和分析用户的业务活动和数据的使用情况,弄清所用数据的种类、范围、数量以及它们在业务活动中交流的情况,确定用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约。
②概念设计。对用户要求描述的现实世界(可能是一个工厂、一个商场或者一个学校等),通过对其中诸处的分类、聚集和概括,建立抽象的概念数据模型。这个概念模型应反映现实世界各部门的信息结构、信息流动情况、信息间的互相制约关系以及各部门对信息储存、查询和加工的要求等。
所建立的模型应避开数据库在计算机上的具体实现细节,用一种抽象的形式表示出来。以实体—关系模型(E-R模型)方法为例,第一步先明确现实世界各部门所含的各种实体及其属性、实体间的联系以及对信息的制约条件等,从而给出各部门内所用信息的局部描述(在数据库中称为用户的局部视图)。第二步再将前面得到的多个用户的局部视图集成为一个全局视图,即用户要描述的现实世界的概念数据模型。
③逻辑设计。主要工作是将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。与此同时,可能还需为各种数据处理应用领域产生相应的逻辑子模式。这一步设计的结果就是所谓“逻辑数据库”。
图3-11 数据库设计的步骤
④物理设计。根据特定数据库管理系统所提供的多种存储结构和存取方法等,依赖于具体计算机结构的各项物理设计措施,对具体的应用任务选定最合适的物理存储结构(包括文件类型、索引结构和数据的存放次序与位逻辑等)、存取方法和存取路径等。这一步设计的结果就是所谓“物理数据库”。
⑤验证设计。在上述设计的基础上,搜集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。一般来说,一个大型数据库的设计过程往往需要经过多次循环反复。当设计的某步发现问题时,可能就需要返回到前面去进行修改。因此,在做上述数据库设计时就应考虑到今后修改设计的可能性和方便性。
⑥运行与维护设计。在数据库系统正式投入运行的过程中,必须不断地对其进行调整与修改。
3.3.3 新技术应用
网络技术和数据库技术在会展管理信息系统开发中被广泛应用。此外,近些年,一些新兴的技术也备受关注,包括网格技术、web2.0技术、云计算技术等。
1)网格技术
网格技术最初起源于20世纪90年代初的美国政府资助的分布式超级计算(Distributed Supper computing)项目。随后,高性能计算技术和互联网技术进一步融合,酝酿产生了继Internet、Web之后的第三大技术浪潮——“网格技术”。
网格技术是利用互联网把地理上广泛分布的计算资源、存储资源、带宽资源、软件资源、数据资源、信息资源、知识资源等联成一个逻辑整体,就像一台超级计算机,为用户提供一体化信息和应用服务。虚拟组织最终在这个虚拟环境下进行资源共享和协同工作。
通过网格技术,能够有效地调整位于全球不同地区的应用程序和资源,增强网络服务的能力,使得众多用户可在大范围的网络上共享处理能力、支付能力、文件以及应用软件,而无需在意具体的服务过程。网格计算提供了一个可靠、动态、全面的基础设施,集成了超越地区及组织界限的资源、应用程序和服务,从而构建了网络服务的范围,使网络回归了本性。网格主要由节点、数据库、仪器、可视化设备、宽带骨干网及软件组成。
网格具有如下功能。
①提高或拓展企业内所有计算资源的效率和利用率,满足最终用户的需求,解决以前由于计算、数据或存储资源的短缺而无法解决的问题。
②建立虚拟组织,并通过让它们共享应用和数据来对公共问题进行合作。
③整合计算能力、存储和其他资源,使得需要大量计算资源的巨大问题求解成为可能,通过对这些资源进行共享、有效优化和整体管理,降低计算的总成本。
基于网格技术的会展信息系统开发的最大优点在于网格技术解决了技术异构和接口异构的问题,实现了广域网环境下的程序和资源的互联,其特点能够很好地解决数据资源自治性和分布性的问题。
2)Web2.0技术
“Web 2.0”一词是由O’Reilly Media和Media Live公司作为一次会议名称提出来的概念,目前没有一个统一的定义。互联网协会对Web2.0的定义是,Web2.0是互联网的一次理念和思想体系的升级换代,由原来的自上而下的由少数资源控制者集中控制主导的互联网体系,转变为自下而上的由广大用户集体智慧和力量主导的互联网体系。
从Web 1.0到Web 2.0其实是互联网本身的升级,从静态的互联网络向为最终用户提供网络应用服务发展。这一升级的过程中还有Web 1.5,但却很少被人提及,那是动态的互联网络,是向Web 2.0转变的一个过渡时期。Web 1.0提供的是电子邮件、搜索引擎和网上冲浪。Web 2.0在Web 1.0的基础上更加注重人与人的互动。它是关于言论、人际网络、个性化的应用服务。它对网络站点进行搜集,而且为最终用户提供网络应用的成熟的计算平台。Web 2.0具有进步性,体现在它对网络以及社会变革的新趋势、新特征、新需求的深刻反馈。
Web2.0具有如下特性。
(1)广泛应用新技术
从Web2.0所秉承和应用的技术方面来看,Web2.0包括RIA(Rich Internet Applications,丰富互联网应用程序)、SOA(面向服务架构)和Social Web(网络社交)这三个方面组成。有很多技术和产品相应地产生,包括Flash、Ajax技术在网络上的应用,Feeds、RSS、Mash-Up、Wiki、Blog、Tag等产品的出现。新技术的广泛应用是其最主要的特点。
(2)更加以个人为中心
Web 2.0的应用更加以个人为中心,真正让用户体验到了“以人为本”的精神。读者在网上可以拥有个人的很多永久体验,可以拥有自己的空间,个人的收藏夹,个人的Blog,订阅自己喜欢的RSS、Feed,发表自己的心情日记、学习体会、学术论文等。还可以在书城向他人推荐图书,可以在商城里购买或订购自己喜欢的图书等。这些都是Web 2.0为用户所提供的个人服务。从这里,我们可以窥测到未来的互联网将更加的丰富多彩,更加注重阅读者的偏好。
(3)信息交流更具社会性
社会性特征是Web2.0服务所普遍具有的特征,这不仅仅指UUzone这类的社交网站,而且像douban、seehaha这些网站都包含社会性的元素,甚至Blog-lines、Rojo这样的工具性服务都带有多少人订阅这个Feed、推荐Feed给好友等社会性的特征在其中。由于Web2.0以人为中心,人就必然会产生社会性的需求。社会性为网站带来更多的用户互动并产生丰富内容,使网站服务的使用价值与吸引力都大为增加。社会性同样也是Web2.0服务提高用户忠诚度的重要因素。
Web2.0技术为会展管理信息系统开发带来不小的冲击,它改变了互联网用户使用网络的习惯,网络交流方式产生了变化。因此,在开发过程中,要考虑到新技术手段带来的用户使用习惯的变革,开发中也要为用户设计相应的Web2.0应用模块,满足多元化的信息交流需求。
3)云计算技术
云计算最早由IBM公司于2007年底的“云计算计划”报告中提出的,2008年,紧跟IBM的脚步,SUN公司也发布了其枟云计算白皮书枠,此后,许多软件公司都进入云计算这一商业领域,提供商业服务,如谷歌、雅虎、亚马逊、微软、戴尔等。
从云计算的发展来看,云计算本身并不是横空出世的。20世纪七八十年代出现了面向单机服务的单机计算和并行计算;20世纪90年代出现了面向网络的分布式计算,由多台计算机分别计算、最终上传计算结果、合并数据。到21世纪初,出现了面向服务的网格计算,通过资源整合,开展大规模的计算服务。云计算是在它们的基础上的进一步发展。从发展时期来看,云计算有着强大的基础,继承并整合了单机计算、并行计算、分布式计算和网格计算的优势,其未来有着广阔的发展前景。
云计算的原理见图3-12。
图3-12 云计算原理图
云计算应用共有四个层级,首先是基础设施层。云计算的基础设施层是由大量的计算机主机集群所组成的,没有一定数量规模的云计算就不能称为云计算。除此之外,带宽问题也是基础设施建设中的重点问题。由于我国宽带带宽远落后于发达国家,因此这一问题也制约着我国云计算的发展。其次是存储层,主要是在数据库中存储一些文档、软件等。再有是平台层,云计算平台层的主要功能一是身份认证,为用户提供登录云计算服务的账号和密码服务;二是协同操作,保证云计算服务多线程的协同操作;三是收发消息,也就是说对同应用层的操作给予响应。最后是应用层,它是为用户提供应用(application)的,包括为用户提供ERP、SCM、CRM等。
云计算技术为会展管理信息系统开发提供了更为广阔的平台。随着云计算的发展,基于云计算的会展管理信息系统开发将逐步成熟,开发模式更趋智能化,开发的系统更加高效、便捷、安全。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。