數據存儲對象包括處理過程中數據流生成的臨時文件或處理過程中要搜索的信息。數據以某種格式記錄在計算機的內部或外部存儲介質上。NAS數據存儲方式全面改進了以往低效的DAS存儲方式。它使用獨立于服務器的、為網絡數據存儲而開發的文件服務器來連接存儲設備,并自行形成網絡。這樣,數據存儲不再依附于服務器,而是作為一個獨立的網絡節點存在于網絡中,所有網絡用戶都可以共享。
如前所述,云計算的本質是對有形產品(如網絡設備、服務器、存儲設備、各種軟件等)進行改造。轉化為服務產品,并讓人們通過網絡遠程在線使用。計算資源主要指服務器(中央處理器、內存)、存儲和網絡。一方面,存儲是虛擬內存的組成部分,另一方面,它也是軟件和數據的存儲場所。
CPU和內存通過主板緊密綁定在一起,利用主板上的高速并行總線進行通信。目前的技術無法將它們分開,也沒有必要。但是,如果將存儲與CPU分開(不是通過主板直接連接),會有很多好處,比如共享存儲、無狀態計算機、計算資源的方便橫向擴展。
目前可以將CPU和存儲分離的技術有很多,比如FC、FCoE、iSCSI、NFS、CIFS等。前三種是磁盤塊共享技術,后兩種是文件共享技術,還有塊共享SAN產品和文件共享NAS產品。
一個磁盤塊等于整數個磁盤扇區,一個磁盤扇區可以存儲512字節的數據(現在大容量硬盤是4KB扇區),扇區是讀寫硬盤的最小單位。也就是說,小于一個扇區(512B或4KB)的數據一次不能從硬盤讀取或寫入。直接讀取磁盤塊不需要操作系統的參與,而是讀取硬盤上的文件(比如復制“我的簡歷。doc”到u盤)需要操作系統的配合。根據存儲和CPU的分離程度,存儲可以分為以下三種類型。
1)外部存儲:存儲和中央處理器不在同一臺計算機上。例如,存儲區域網絡和網絡連接存儲是獨立的存儲設備,通過以太網電纜或光纖與計算機連接。專用存儲網絡設備非常昂貴。隨著以太網速度的不斷提高,基于以太網的存儲技術越來越普及。比如iSCSI,10Gbit/s的網卡可以提供1GB/s的理論速度。注意這里的單位是Gbit/s和GB/s,前者代表每秒多少位,一位是二進制數,要么是0,要么是1;后者表示每秒多少字節,一個字節等于8位。計算機中的一個字節在通過網卡傳輸之前需要加上一個校驗位和一個停止位,所以一個字節在傳輸到網絡時需要占用10位。
2)直接存儲:內存直接插入主板,通過PATA、SATA、mSATA、SAS、SCSI或PCI-E接口總線進行通信。傳統機械硬盤一般采用PATA、SATA、SAS、SCSI接口。與外接存儲相比,機械硬盤直接插在主板上的速度優勢越來越不明顯,但固態硬盤(如mSATA、PCI-E)的速度優勢明顯,尤其是PCI-E固態硬盤,代表了行業頂級的存儲技術。
3)分布式存儲:通過分布式文件系統,每臺計算機上的直接存儲被集成到一個大存儲中。對于參與存儲的每臺計算機,既有直接存儲,也有外部存儲,因此分布式存儲集成了前兩種存儲方案。由于需要使用分布式文件系統來集成分散在每臺計算機上的直接存儲,并使其成為一個單一的命名空間,因此涉及的技術、概念和體系結構都非常復雜,并且還會消耗額外的計算資源。
服務器存儲區域網絡(Server SAN)逐漸被數據中心所采用,發展迅速。Ceph分布式存儲系統屬于Server SAN,被很多云中心采用。目前,軟件定義存儲(SDS)的概念是分布式存儲。存儲的評估指標包括容量、速度、每秒讀/寫次數(IOPS)和可用性。“容量”很容易理解,即可以存儲的數據總量。
在實際項目中,我們更在意有效容量,比如4個1TB硬盤,加起來就是4TB,但如果這4個硬盤是鏡像的(RAID-1),那么有效容量就是2tb;如果制成RAID-5,有效容量將再次不同。容量需求容易滿足,一般采用水平擴展。“速度”是指每秒傳輸的數據量,速度和帶寬是同一個概念。
IOPS是最重要的指標,它被定義為每秒響應讀(或寫)操作的次數,反映了并發性和隨機訪問能力。IOPS與磁盤的速度和平均尋道時間密切相關,磁盤的平均尋道時間為4 ~ 12 ms,對于轉速為7200rpm的磁盤,我們可以計算出IOPS的近似值:1000÷[1000÷(7200÷60)÷2+8]= 83。對于單個磁盤,“讀/寫”磁盤在微觀層面上是串行的。
比如100人同時訪問磁盤時,磁盤會逐一響應用戶的請求,但在宏觀層面上卻表現出并行性,即一秒鐘內有100人同時訪問磁盤,給人一種并行的假象。有許多方法可以改善IOPS,例如使用更好的硬盤(如固態硬盤),增加磁盤數量并分散對每個硬盤的訪問,或者使用更多的緩存,以便經常訪問的內容駐留在緩存中。租用服務器可咨詢夢飛云idc了解。