SAS

(Serial Attached SCSI),串行连接SCSI接口,串行连接小型计算机系统接口。

IOPS

(Input/Output Operations Per Second)是一个用于计算机存储设备(如硬盘(HDD)、固态硬盘(SSD)或存储区域网络(SAN))性能测试的量测方式,可以视为是每秒的读写次数。和其他性能测试一样,存储设备制造商提出的IOPS不保证就是实际应用下的性能。

QoS

(Quality of Service,服务质量)指一个网络能够利用各种基础技术,为指定的网络通信提供更好的服务能力,是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。QoS的保证对于容量有限的网络来说是十分重要的,特别是对于流多媒体应用,例如VoIP和IPTV等,因为这些应用常常需要固定的传输率,对延时也比较敏感。

LUN

全称是Logical Unit Number,也就是逻辑单元号。我们知道SCSI总线上可挂接的设备数量是有限的,一般为8个或者16个,我们可以用Target ID(也有称为SCSI ID的)来描述这些设备,设备只要一加入系统,就有一个代号,我们在区别设备的时候,只要说几号几号就可以了。

SCSI

(小型计算机系统接口)是一个并行接口,它可以通过一条电缆同时连接八个设备;电缆和主机(电脑)适配器组成了SCSI总线。总线允许两个设备之间不通过主机直接交换数据。在SCSI程序中每个设备都分配了一个唯一的数字,其中8位(窄)带是0-7之间任意一个数,16位(宽)带是8-16位中任意一个数。这些设备申请输入输出操作,他们是驱动者,设备执行的这些操作是目标。每一个目标有通过设备自身的控制器连接八个附加设备的能力;这些设备是逻辑单元,其中的每个都分配有用于识别SCSI控制命令过程的唯一识别号。

ServerSAN

2014年又有一个IT新名词被提出—ServerSAN。ServerSAN这个名词源于Wikibon,自被提出就获得很多关注和热烈讨论。ServerSAN简单来说是由多个独立的服务器直连存储组成的一个存储资源池。DAS之间实现高速互联(如InfiniBand或低延迟以太网),通过软件进行统一管理。

Server SAN可以用标准的X86服务器、高速通用网络来实现,省去了专用设备和网络成本,为企业实现一个更高的性价比。ServerSAN架构集合了hyperscale、融合和闪存等技术优势,计算和存储可以共享网络,在扩展性和易管理上亦有不俗表现。超大规模公司,如Facebook、Google和亚马逊等已经开发了Server

SAN解决方案。

nfsd

remote NFS server

smbd

为Samba服务器程序,可分享文件与打印机等网络资源供Windows相关的用户端程序存取。

LDAP

(Lightweight Directory Access Protocol)能够实现认证信息的统一管理。

在LDAP域环境中,LDAP客户端和N8500的组织结构信息都存储于LDAP服务器的目录数据库中。LDAP服务器中所设置的目录条目决定了LDAP域环境中的用户、组和网络组。

NIS

(Network Information Service)是一种可以集中管理系统数据库的目录服务技术。

在NIS域环境中,主机的登录信息(用户名、密码等)记录在/etc/passwd文件中;主机的群组信息记录在/etc/group文件中;相关主机名称与IP记录在/etc/hosts文件中。这些信息通过制作成数据库的方式提供给NIS域环境中的客户端。

在NIS域环境的整个运作过程中,NIS服务器首先需要将上述信息制作成数据库格式的档案,NIS客户端用户需要登录时将会到NIS服务器中搜寻数据库中的信息并进行验证。当NIS服务器需要更新用户信息时,都需要重新制作数据库。

(Active Directory)是Windows 2000操作系统平台的中心组件之一。AD是用于改进Windows网络操作系统管理、安全和交互性目录服务集,通过提供一定空间,用于存储基于网络的实体信息,实现统一管理和调度局域网络中分布式的资源。

CHAP

全称是PPP(点对点协议)询问握手认证协议 (Challenge Handshake Authentication Protocol)。该协议可通过三次握手周期性的校验对端的身份,可在初始链路建立时,完成时,在链路建立之后重复进行。通过递增改变的标识符和可变的询问值,可防止来自端点的重放攻击,限制暴露于单个攻击的时间。

CIFS

是一个新提出的协议,它使程序可以访问远程Internet计算机上的文件并要求此计算机提供服务。CIFS 使用客户/服务器模式。客户程序请求远在服务器上的服务器程序为它提供服务。服务器获得请求并返回响应。CIFS是公共的或开放的SMB协议版本,并由Microsoft使用。SMB协议在局域网上用于服务器文件访问和打印的协议。像SMB协议一样,CIFS在高层运行,而不像TCP/IP协议那样运行在底层。CIFS可以看做是应用程序协议如文件传输协议和超文本传输协议的一个实现。

WWN

即World Wide Name,全球唯一名字,通常是由权威的组织分配的唯一的48位或64位数字,专门制定为公认的名称授权 (通常通过区域分配给制造商),以区分一个或一组网络连接,用来标识网络上的一个连接或连接集合,主要用于FC。

RESTful

Fielding将他对互联网软件的架构原则,定名为REST,即Representational State Transfer的缩写。我对这个词组的翻译是"表现层状态转化"。

如果一个架构符合REST原则,就称它为RESTful架构。

什么是RESTful架构:

  1. 每一个URI代表一种资源;
  2. 客户端和服务器之间,传递这种资源的某种表现层;
  3. 客户端通过四个HTTP动词,对服务器端资源进行操作,实现"表现层状态转化"。

Zookeeper

(简称zk),顾名思义,为动物园管理员的意思,动物对应服务节点,zk是这些节点的管理者。在分布式场景中,zk的应用非常广泛,如:数据发布/订阅、命名服务、配置中心、分布式锁、集群管理、选主与服务发现等等。这不仅得益于zk类文件系统的数据模型和基于Watcher机制的分布式事件通知,也得益于zk特殊的高容错数据一致性协议。

这里的一致性,是指数据在多个副本之间保持一致的特性。分布式环境里,多个副本处于不同的节点上,如果对副本A的更新操作,未同步到副本B上,外界获取数据时,A与B的返回结果会不一样,这是典型的分布式数据不一致情况。而强一致性,是指分布式系统中,如果某个数据更新成功,则所有用户都能读取到最新的值。CAP定理告诉我们,在分布式系统设计中,P(分区容错性)是不可缺少的,因此只能在A(可用性)与C(一致性)间做取舍。本文主要探究zk在数据一致性方面的处理逻辑。

RDMA

是Remote Direct Memory Access的缩写,意思是远程直接数据存取,就是为了解决网络传输中服务器端数据处理的延迟而产生的。

RDMA通过网络把资料直接传入计算机的存储区,将数据从一个系统快速移动到远程系统存储器中,而不对操作系统造成任何影响,这样就不需要用到多少计算机的处理功能。它消除了外部存储器复制和上下文切换的开销,因而能解放内存带宽和CPU周期用于改进应用系统性能。

ISCSI Initiator

ISCSI的储存设备称为iSCSITarget(或称iSCSI Target Device),例如iSCSI 磁盘阵列柜、iSCSI 磁带柜等。

ISCSI 卡称为ISCSI HBA(Host Bus Adapter)。

ISCSI 允许使用一般Ethernet NIC卡,

若使用一般GbE 卡,则还需要搭配软件才能让GbE 卡收发ISCSI 协议,此软件称为ISCSI Initiator,事实上ISCSI HBA的角色也等同于ISCSI Initiator。

Promise

以下是MDN对Promise的定义:

The Promise object is used for asynchronous computations. A Promise represents a single asynchronous operation that hasn't completed yet, but is expected in the future.

译文:Promise对象用于异步操作,它表示一个尚未完成且预计在未来完成的异步操作。

纠删码EC

(erasure coding,EC)是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同的位置,比如磁盘、存储节点或者其它地理位置。

纠删码会创建一个数学函数来描述一组数字,这样就可以检查它们的准确性,而且一旦其中一个数字丢失,还可以恢复。多项式插值(polynomial interpolation)或过采样(oversampling)就是纠删码所使用的关键技术。

从 数据函数角度来说,纠删码提供的保护可以用下面这个简单的公式来表示:n = k + m。变量“k”代表原始数据或符号的值。变量“m”代表故障后添加的提供保护的额外或冗余符号的值。变量“n”代表纠删码过程后创建的符号的总值。

举个例子来说,在一个EC 10/16的配置中,会有6个额外的符号(变量m)被添加到10个原始符号(变量k)中。这16个数据片段(变量n)会遍布16个驱动器、节点或地理位置中。而原始文件可以从10个验证片段中重建。

纠删码,也称为前向纠错(FEC)编码,早在50年前就已出现。随后产生了不同类型。其中一个最早也是最常见的类型就是RS(Reed-Solomon),这种类型的数据可以使用任何k符号的组合或数据块来重建,即使m符号丢失或不可用。比如,在EC 10/16中,即使有6个驱动器、节点或者地理位置丢失或不可用,而原始文件还是可以恢复。

纠删码可以用于有大量数据和任何需要容错的应用程序或系统中,比如磁盘阵列系统、数据网格、分布式存储应用程序、对象存储或归档存储。目前,纠删码的一个常见的使用案例是基于对象的云存储。

直通、回刷

1、读

2、写

若hit(命中),有两种处理方式:

Write-through:(直写模式)在数据更新时,把数据同时写入Cache和后端存储。此模式的优点是操作简单;缺点是因为数据修改需要同时写入存储,数据写入速度较慢。

Write-back(回写模式)在数据更新时只写入缓存Cache。只在数据被替换出缓存时,被修改的缓存数据才会被写到后端存储(即先把数据写到Cache中,再通过flush方式写入到内存中)。此模式的优点是数据写入速度快,因为不需要写存储;缺点是一旦更新后的数据未被写入存储时出现系统掉电的情况,数据将无法找回。

若miss(缺失),有两种处理方式:

Write allocate:先把要写的数据载入到Cache中,写Cache,然后再通过flush方式写入到内存中; 写缺失操作与读缺失操作类似。

No write allocate:并不将写入位置读入缓存,直接把要写的数据写入到内存中。这种方式下,只有读操作会被缓存。缺点是一旦更新后的数据未被写入存储时出现系统掉电的情况,数据将无法找回。

LRU

(Least recently used,最近最少使用)算法根据数据的历史访问记录来进行淘汰数据,其核心思想是“如果数据最近被访问过,那么将来被访问的几率也更高”。

punch hole

打洞。

Buddy system

是linux内核中大名鼎鼎的页面管理子系统,它潜伏在linux内核底层,看起来神秘而难以捉摸。然而当揭开它神秘的面纱,才发现大道至简。如果让我用两个词来描述buddy system,我会选择:简单,优雅。

DMC

Data Mistake Check,数据不一致。

SGI

(Silicon Graphics)中文商标:硅图。美国硅图公司成立于1982年,是一个生产高性能计算机系统的跨国公司,总部设在美国加州旧金山硅谷。

CXFS

The CXFS file system (Clustered XFS) is a proprietary shared disk file system designed by Silicon Graphics (SGI) specifically to be used in a storage area network (SAN) environment.