Що таке системи зберігання даних?

Що таке системи зберігання даних?

Direct-attached storage (DAS)

Під DAS прийнято розуміти безпосередньо підключені до обчислювальної системи диски. Зазвичай, як DAS кваліфікуються варіанти тільки безпосереднього прямого підключення. Так, наприклад, підключення дисків системи зберігання даних каналом FC в режимі «точка-точка» (тобто без «мережі зберігання», порт системи зберігання в порт сервера), незважаючи на те, що формально є DAS, проте вважається приватним, «виродженим» випадком SAN.

Network-attached storage (NAS)

NAS добре знайомий більшості користувачів, які використовують у локальній мережі своєї організації файловий сервер. Файловий сервер — це NAS. Цей пристрій, підключений в локальну мережу і надає доступ до своїх дисків по одному з протоколів «мережевих файлових систем», наприклад CIFS (Common Internet File System) для Windows-систем (раніше називалася SMB  ;—Server Message Blocks) або NFS (Network File System) для UNIX/Linux-систем. Інші варіанти зустрічаються зникаюче рідко.

Storage area network (SAN)

SAN-пристрій, з погляду користувача, є просто локальний диск. Звичайні варіанти протоколу доступу до SAN-диску це протокол  FibreChannel (FC) та iSCSI (IP-SAN). Для використання SAN у комп'ютері, який хоче підключитися до SAN, має бути встановлена плата адаптера SAN, яка зазвичай називається HBA — Host Bus Adapter. Цей адаптер є з погляду комп'ютера таку своєрідну SCSI-карту і поводиться він з нею так само, як зі звичайною SCSI-картою. Відсилає до неї команди SCSI і отримує назад блоки даних протоколу SCSI. Назовні ця карта передає блоки даних і команди SCSI, загорнуті в пакети FC або IP для iSCSI.

Відмінності та конвергенція SAN та NAS

Які ж плюси та мінуси обох цих моделей доступу до даних системи зберігання?

  1. NAS працює поверх локальної мережі, використовуючи звичайне мережеве обладнання.
  2. Він працює переважно з файлами та інформацією, оформленою як файли (приклад: документи загального користування, word- та excel-файли).
  3. Він дозволяє колективне використання інформації на дисках (одночасний доступ з кількох комп'ютерів).
  4. SAN працює у власній мережі, для використання якої потрібен спеціальний Host Bus Adapter (HBA).
  5. Він працює на рівні блоків даних. Це можуть бути файли, але це можуть бути нефайлові методи зберігання. Наприклад, база даних Oracle на т.н. raw-partition.
  6. Для комп'ютера це локальний диск, тому колективне використання інформації на SAN диску зазвичай неможливе (або робиться дуже складно і дорого).

Плюси NAS

  • дешевизна та доступність його ресурсів не тільки для окремих серверів, але й для будь-яких комп'ютерів організації.
  • простість колективного використання ресурсів.

Мінус NAS

  • не можна використовувати «нефайлові» методи.
  • доступ до інформації через протоколи «мережевих файлових систем» часто повільніше, ніж до локального диска.

Плюси SAN

  • можна використовувати блокові методи доступу, зберігання «нефайлової» (часто використовується для баз даних, а також для поштової бази Exchange).
  • «низькорівневий» доступ до SAN-диску зазвичай швидший, ніж через мережу. Набагато простіше зробити дуже швидкий доступ до даних із використанням кешування.
  • Деякі програми працюють тільки з «локальними дисками» і не працюють на NAS (приклад MS Exchange)

Мінус SAN

  • важко, дорого або зовсім неможливо здійснити колективний доступ до розділу з двох і більше комп'ютерів.
  • Вартість підключення до FC-SAN досить велика (близько 1000 $ 1500 за плату FC HBA). Підключення до iSCSI (IP-SAN) набагато дешевше, але потребує підтримки iSCSI на дисковому масиві.

Отже, що ж спільного між цими двома методами? Обидва ці методи використовуються для «мережевого зберігання даних» (Networking data storage). Що з них краще? Єдиної відповіді немає. Спроба вирішити завдання NAS за допомогою SAN-системи, як і зворотне завдання, найчастіше є найкоротшим шляхом витратити великі гроші без видимої вигоди та результату. Кожна з цих парадигм » має свої сильні сторони, кожна має оптимальні методи застосування.

Content-addressable storage (CAS)

CAS оскільки стаття (автор StarMarine) на яку дане посилання можливо буде видалена, її вміст на 03.02.2008 скопійовано сюди:

Content-addressable storage (CAS) — архітектура зберігання, в якій адресація здійснюється способом даних, що зберігаються. Образ даних хешується та хеш використовується для його знаходження на пристроях або системах зберігання. Насправді дані записуються в BLOB-поля спеціалізованої бази даних, а обчислений хеш використовується як індексний ключ бази, яким здійснюється швидкий пошук вмісту. Побудова системи зберігання як бази даних дозволило застосовувати до процесів доступу та зберігання даних методи роботи з базами (версійність зберігання, дедуплікація). Заради справедливості слід також згадати, що раніше такі форми організації інформації вже застосовувалися на практиці, наприклад, файлова система OS VMS (застосовувана на DEC VAX, згодом OpenVMS) була організована як своєрідна база даних.

Архітектура має велику стійкість до дублікатів, а так само може бути виконана децентралізовано, що дає їй істотну надійність. Однак серйозним недоліком такого способу організації зберігання слід назвати невисоку швидкодію, що не дозволяє застосовувати CAS як primary storage. На даний момент CAS зайняли своє місце в системах архівного, довготривалого та незмінного зберігання. Найбільш відомим виробником CAS-систем на ринку є компанія EMC та її системи серії Centera.