My studying notes for Java,Ruby,Ajax and other any interesting things.

星期五, 十一月 30, 2007

NAS释疑



NAS简介
网络附加存储的概念 NAS是Network Attached Storage的简称,中文称为网络附加存储。在NAS存储结构中,存储系统不再通过I/O总线附属于某个服务器或客户机,而直接通过网络接口与网络直接相连,由用户通过网络访问。 NAS实际上是一个带有瘦服务器的存储设备,其作用类似于一个专用的文件服务器。这种专用存储服务器去掉了通用服务器原有的不适用的大多数计算功能,而仅仅提供文件系统功能。与传统以服务器为中心的存储系统相比,数据不再通过服务器内存转发,直接在客户机和存储设备间传送,服务器仅起控制管理的作用。 NAS的主要特点 NAS使用了传统以太网协议,当进行文件共享时,则利用了NFS和CIFS以沟通NT和Unix系统。由于NFS和CIFS都是基于操作系统的文件共享协议,所以NAS的性能特点是进行小文件级的共享存取。 NAS设备是直接连接到以太网的存储器,并以标准网络文件系统如NFS、SMB/CIFS over TCP/IP接口向客户端提供文件服务。NAS设备向客户端提供文件级的服务。但内部依然是以数据块的层面与它的存储设备通讯。文件系统是在这个NAS 存储器里。 NAS的主要长处 第一,NAS适用于那些需要通过网络将文件数据传送到多台客户机上的用户。NAS设备在数据必须长距离传送的环境中可以很好地发挥作用。 第二,NAS设备非常易于部署。可以使NAS主机、客户机和其他设备广泛分布在整个企业的网络环境中。NAS可以提供可靠的文件级数据整合,因为文件锁定是由设备自身来处理的。 第三,NAS应用于高效的文件共享任务中,例如UNIX中的NFS和Windows NT中的CIFS,其中基于网络的文件级锁定提供了高级并发访问保护的功能。 最后,在某些情况下,企业可以有限地为数据库应用部署NAS解决方案。 NAS分类 1、电器型服务器 电器型服务器是NAS系列设备中最低端的产品。电器型服务器不是专门附加的存储设备。它们为网络提供了一个存储的位置,但是由于没有冗余的以及和高性能的组件,它们相对比较便宜。在工作组环境中,电器型服务器要起很多作用。典型服务包括网络地址翻译(NAT)、代理、DHCP、电子邮件、Web服务器、DNS、防火墙和VPN。 2、工作组NAS 工作组级的NAS特别适合于存储需求相对较低的小型和中型公司,它们的存储需要一般从几百GB到1TB。运行电子商务软件或者大型数据库的公司会需要几TB的存储空间,他们使用的属于中型NAS。 一般来说,当从工作组升级到中型NAS时,你会发现热插拔驱动器和一些可以放置额外的驱动器或更多的故障恢复产品的设备盒、增强的管理功能以及系统复杂性的少许提高。 3、中型NAS 我们所说的中型NAS解决方案提供了更好的扩展性和可靠性,而且有着与低端NAS类似的优点,例如方便、专用的存储空间和简单的安装和管理过程。与电器型服务器和工作组级NAS相比,这些NAS设备的成本明显要高很多。 4、大型NAS 这类存储设备,系统的易扩展性以及高可用性和冗余性都是十分关键的。这些设备还必须提供高端服务器的性能、灵活的管理以及与异类网络平台交互的能力。
NAS是英文“Network Attached Storage”的缩写, 中文意思是“网络附加存储”。按字面简单说就是连接在网络上, 具备资料存储功能的装置,因此也称为“网络存储器”或者“网络磁盘阵列”。
从结构上讲,NAS是功能单一的精简型电脑,因此在架构上不像个人电脑那么复杂,在外观上就像家电产品,只需电源与简单的控制钮,NAS是一种专业的网络文件存储及文件备份设备,它是基于LAN(局域网)的,按照TCP/IP协议进行通信,以文件的I/O(输入/输出)方式进行数据传输。在LAN环境下,NAS已经完全可以实现异构平台之间的数据级共享,比如NT、UNIX等平台的共享。一个NAS系统包括处理器,文件服务管理模块和多个硬盘驱动器(用于数据的存储)。 NAS 可以应用在任何的网络环境当中。主服务器和客户端可以非常方便地在NAS上存取任意格式的文件,包括SMB格式(Windows)NFS格式(Unix, Linux)和CIFS(Common Internet File System)格式等等。典型的NAS的网络结构
1. NAS作为文件服务器为IP网络上的客户机上的重要数据或需共享的数据提供存储空间。利用NAS本身具有的SnapShot(快照)功能,在NAS上可制定自动的快速备份策略,将其上的重要数据进行备份恢复。
具体实现:
1) NAS将其上的某一目录共享给若干主机
2) 这些主机可通过map(映射) NAS的这个目录到其相应的驱动器的方式实现文件共享
3) 对NAS上的重要数据可通过“快照”功能进行快速保存(将数据信息直接保存在NA
NAS(Network Attached Storage,网络附属存储)

  是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。 

  NAS被定义为一种特殊的专用数据存储服务器,包括存储器件(例如磁盘阵列、CD/DVD驱动器、磁带驱动器或可移动的存储介质)和内嵌系统软件,可提供跨平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。 

  NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作系统。通过任何一台工作站,采用IE或Netscape浏览器就可以对NAS设备进行直观方便的管理。 




  NAS和SAN最大的区别就在于NAS有文件操作和管理系统,而SAN却没有这样的系统功能,其功能仅仅停留在文件管理的下一层,即数据管理。SAN和NAS并不是相互冲突的,是可以共存于一个系统网络中的,但NAS通过一个公共的接口实现空间的管理和资源共享,SAN仅仅是为服务器存储数据提供一个专门的快速后方通道。

NAS和简单PC服务器的区别是什么?
  从高的层面来说,NAS可以在操作系统中容纳多协议的数据传输。NAS优
于传统的PC服务器的第一个原因是它可以在你的系统中既担当Fibre Channel的存储阵列也可以担当iSCSI的阵列,而且NAS的应用依然可以采用想数据快照和复制这样的数据保护软件。

星期三, 十一月 14, 2007

本体

本体

一、 本体的概念

本体(Ontology )的概念最初起源于哲学领域,可以追溯到公元前古希腊哲学家亚里士多德(384-322 b.c.)。它在哲学中的定义为"对世界上客观存在物的系统地描述,即存在论",是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。

在人工智能界,最早给出Ontology定义的是Neches等人,他们将Ontology定义为"给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义"。Neches认为:"本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则。"("An ontology defines the basic terms and relations comprising the vocabulary of a topic area, as well as the rules for combining terms and relations to define extensions to the vocabulary.")。后来在信息系统、知识系统等领域,越来越多的人研究Ontology,并给出了许多不同的定义。其中最著名并被引用得最为广泛的定义是由Gruber提出的,"本体是概念化的明确的规范说明",原文参见:

"An ontology is an explicit specification of a conceptualization. The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. For AI systems, what "exists" is that which can be represented. When the knowledge of a domain is represented in a declarative formalism, the set of objects that can be represented is called the universe of discourse. This set of objects, and the describable relationships among them, are reflected in the representational vocabulary with which a knowledge-based program represents knowledge. Thus, in the context of AI, we can describe the ontology of a program by defining a set of representational terms. In such an ontology, definitions associate the names of entities in the universe of discourse ( e.g., classes, relations, functions, or other objects) with human-readable text describing what the names mean, and formal axioms that constrain the interpretation and well-formed use of these terms. Formally, an ontology is the statement of a logical theory."。

和这个定义类似的有N. Guarino and P. Giaretta (1995)"本体是概念化的明确的部分的说明/一种逻辑语言的模型"("an ontology is an explicit, partial account of a conceptualization/ the intended models of a logical language.")。

W. N. Borst对该定义也进行了引申"本体是共享的概念模型的形式化的规范说明"("An ontology is a formal specification of a shared conceptualization")

Fensel对这个定义进行分析后认为Ontology的概念包括四个主要方面:

1. 概念化(conceptualization):客观世界的现象的抽象模型;

2. 明确(explicit):概念及它们之间联系都被精确定义;

3. 形式化(formal):精确的数学描述;

4. 共享(share):本体中反映的知识是其使用者共同认可的。

原文:"an abstract model of a phenomenon termed 'conceptualization',a precise mathematical description hints the word 'formal', the precision of concepts and their relationships clearly defined are expressed by the term 'explicit' and the existence of an agreement between ontology users is hinted by the term 'shared'."

Swartout将本体定义为:"本体是一个为描述某个领域而按继承关系组织起来作为一个知识库的骨架的一系列术语"。("An ontology is a hierarchically structured set of terms for describing a domain that can be used as a skeletal foundation for a knowledge base.")。他的定义强调了本体中术语(terms)的重要性。

Fensel定义"本体是对一个特定领域中重要概念的共享的形式化的描述"。("An ontology is a common, shared and formal description of important concepts in an specific domain.")。

Noy F.N. 认为"本体是对某个领域中的概念的形式化的明确的表示,每个概念的特性描述了概念的各个方面及其约束的特征和属性。"("An ontology is a formal explicit representation of concepts in a domain, properties of each concept describes characteristics and attributes of the concept known as slots and constrains on these slots.")。

Fonseca定义"本体是以某一观点用详细明确的词汇表描述实体、概念、特性和相关功能的理论"。("An ontology is a theory which uses a specific vocabulary to describe entities, classes, properties and related function with certain point of view.")。

Starla认为"本体必需包括所使用术语的规范说明、决定这些术语含义的协议、以及术语之间的联系,来表达概念"。("An ontology necessarily includes a specification of the terms used (terminology) and agreements that allow to determine their meaning, along with the possible inter-relationships between these terms, standing for "concepts".")。

M. Uschold and M. Gruninger认为""("Ontology is an explicit account or representation of (some part of) a conceptualisation.")。他还推荐了一个来自SRKB(Shared Re-usable Knowledge Bases)电子邮件列表的定义"本体是关于共享的概念模型的协议。共享的概念模型包括进行领域知识建模的概念框架、互操作的agent之间进行交流的内容明确协议、以及表达特定领域理论的协定。在知识共享的上下文环境中,本体特指表达性词汇表的定义的形式。一个非常简单的例子就是分类的层次结构,指明了类和它们之间的包含关系。关系数据库模式的作用也和本体一样,它指定了某些共享数据库之间可以存在的关系以及必须保持的完整性约束"("Ontologies are agreements about shared conceptualization. Shared conceptualizations include conceptual frameworks for modeling domain knowledge; content-specific protocols for communication among inter-operating agents; and agreements about the representation of particular domain theories. In the knowledge sharing context, ontologies are specified in the form of definitions of representational vocabulary. A very simple case would be a type hierarchy, specifying classes and their subsumption relationships. Relational database shemata also serve as ontologies by specifying the relations that can exist in some shared database and the integrity constraints that must hold for them.")。