در این مقاله ما قصد داریم تا اصول اولیه پشتیبان گیری و بازیابی از فاجعه (Disaster Recovery) را بررسی کنیم تا شما بتوانید برنامه های موثری را تدوین نموده و downtime را به حداقل برسانید. همچنین در این مطلب، تفاوت های بین پشتیبان گیری و بازیابی از فاجعه (Disaster Recovery) را بیان خواهیم نمود تا بتوانید مفاهیم کلیدی را که برای توسعه استراتژی های موثر حیاتی هستند، درک کنید.
برای به حداقل رساندن تأثیر خرابی ها بر کسبوکارتان، درک اصول اولیه پشتیبانگیری و بازیابی از فاجعه ضروری است. در کلیه صنایع، سازمانها بر این باور هستند که هر خرابی، فارغ از اینکه در ابعاد کوچک یا بزرگ باشد، میتواند به سرعت منجر به از دست رفتن سرمایه سازمانی شود. بلایای طبیعی، خطاهای انسانی، نقض امنیت و حملات سایبری همگی میتوانند در دسترس بودن منابع IT را به خطر بیندازند. هرگونه خرابی میتواند تعاملات مشتری را از مسیر خارج کند، بهرهوری کارکنان را کاهش دهد، داده ها را از بین ببرد و فرآیندهای تجاری را متوقف کند.
از این رو، درک تفاوت های بین پشتیبان گیری با بازیابی از فاجعه (Disaster Recovery)، تعریف اصطلاحات کلیدی و ارزیابی گزینه ها و فناوری های مختلف استقرار میتواند به شما کمک کنند تا استراتژی های موثری برای جلوگیری از عواقب خرابی ها در اختیار داشته باشید.
پشتیبان گیری و بازیابی از فاجعه (Disaster Recovery) چیست؟
یک تمایز مهم بین پشتیبان گیری و بازیابی از فاجعه وجود دارد. پشتیبان گیری فرآیند ایجاد یک کپی اضافی (یا چند کپی) از داده ها است. برای محافظت از داده ها میبایست از آنها نسخه پشتیبان تهیه شود. اگر با حذف تصادفی، خرابی پایگاه داده یا بروز مشکل در ارتقای نرم افزار مواجه شدید، ممکن است نیاز به بازیابی اطلاعات پشتیبان داشته باشید.
از سوی دیگر، بازیابی از فاجعه (Disaster Recovery) به طرح و فرآیندهایی برای بازیابی سریع دسترسی به برنامهها، دادهها و منابع فناوری اطلاعات پس از قطعی اشاره دارد. این طرح ممکن است شامل جابجایی به مجموعهای از سرورها و سیستمهای ذخیرهسازی اضافی باشد تا زمانی که دیتاسنتر اولیه دوباره فعال شود.
برخی از سازمان ها معمولاً پشتیبان گیری را با بازیابی از فاجعه اشتباه می گیرند. داشتن کپی از داده ها به این معنی نیست که می توانید از کسب و کار خود تحت هر شرایطی محافظت کنید. به همین جهت، برای اطمینان از تداوم کسب و کار خود، باید به یک برنامه قوی و آزمایش شده برای بازیابی از فاجعه متکی باشید.
اهمیت برنامه ریزی
هیچ سازمانی نباید از پشتیبان گیری و یا بازیابی از فاجعه غفلت کند. اگر بازیابی دادههای از دست رفته پس از حذف تصادفی ساعتها طول بکشد، کارمندان شما بیکار میمانند و نمیتوانند فرآیندهای حیاتی تجاری را به انجام رسانند. اگر روزها طول بکشد تا کسب و کار شما بعد از یک حادثه مجدد آنلاین شود، مشتریان خود را برای همیشه از دست خواهید داد. با توجه به مقدار زمان و پولی که در هر دو مورد ممکن است از دست بدهید، سرمایه گذاری در پشتیبان گیری و بازیابی از فاجعه کاملاً منطقی و موجه میباشد.
مفاهیم کلیدی
درک چند اصطلاح ضروری میتواند به شکل دادن به تصمیمات استراتژیک شما کمک کند و شما را قادر میسازد تا راه حل های پشتیبانگیری و بازیابی از فاجعه را بهتر ارزیابی کنید.
RTO
Recovery Time Objective (بطور مخفف RTO) مقدار زمانی است که برای بازیابی عملیات عادی کسب و کار پس از قطعی نیاز است. همانطور که به دنبال تنظیم RTO برای سازمان خود هستید، باید در نظر بگیرید که چقدر زمان را می خواهید از دست بدهید و این زمان چه تاثیری بر نتیجه شما خواهد داشت. RTO ممکن است برای هر نوع کسب و کاری بسیار متفاوت باشد. برای مثال، اگر یک کتابخانه عمومی سیستم فهرست خود را از دست بدهد، احتمالاً میتواند برای چند روز، در حالی که سیستمها بازیابی میشوند، به صورت دستی به کار خود ادامه دهد. اما اگر یک خردهفروش آنلاین سیستم موجودی خود را از دست بدهد، حتی 10 دقیقه توقف غیرقابل قبول خواهد بود.
RPO
Recovery Point Objective (بطور مخفف RPO) به مقدار داده ای اشاره دارد که می توانید در یک حادثه از دست بدهید. ممکن است لازم باشد داده ها را به طور مداوم در یک دیتاسنتر کپی کنید تا قطعی منجر به از دست رفتن داده ها نشود. یا ممکن است تصمیم بگیرید که از دست دادن پنج دقیقه یا یک ساعت داده ها قابل قبول باشد.
Failover
فرآیند بازیابی از فاجعه است که بهطور خودکار وظایف را به سیستمهای پشتیبان بارگیری میکند، به گونهای که برای کاربران بصورت یکپارچه اتفاق بیافتد. Failover یک عملکرد بسیار مهم برای سیستم های حیاتی است که نیاز دارند همیشه در دسترس باشند.
Failback
فرآیند بازیابی از فاجعه برای بازگشت به سیستم های اصلی است. پس از وقوع حادثه، زمانیکه دیتاسنتر اصلی شما پشتیبانگیری و راهاندازی شد، باید بتوانید بهطور یکپارچه به سیستم های اصلی دسترسی داشته باشید.
Restore
فرآیند انتقال داده های پشتیبان به سیستم اصلی یا دیتاسنتر شما است. فرآیند بازیابی به عنوان بخشی از پشتیبانگیری در نظر گرفته میشود.
DRaaS
Disaster Recovery as a Service (بطور مخفف DRaaS) یک رویکرد مدیریت شده برای بازیابی از فاجعه است. با در نظر گرفتن یک شخص ثالث برای هاستینگ و مدیریت زیرساخت مورد استفاده برای بازیابی از فاجعه را بر عهده خواهد داشت. پیشنهاداتی که توسط DRaaS ممکن است ارائه شود اغلب ابزارهایی هستند که برای مدیریت فرآیندهای بازیابی از فاجعه مناسب هستند.
بار کاری را اولویت بندی کنید
پس از درک مفاهیم کلیدی، وقت آن است که تمامی آن ها را در بار کاری خود اعمال نمایید. بسیاری از سازمان ها دارای چندین RTO و RPO هستند که نشان دهنده اهمیت هر بار کاری برای کسب و کارشان است.
برای یک بانک بزرگ، سیستم بانکداری آنلاین ممکن است یک از اجزای حیاتی باشد. از این رو، بانک باید از دست دادن زمان و داده ها را به حداقل برساند. با این حال، برنامه حضور و غیاب کارکنان بانک اهمیت کمتری در چنین مواقع دارد. در صورت بروز حادثه، بانک میتواند این برنامه را برای چندین ساعت یا حتی یک روز، بدون آنکه تأثیر منفی عمدهای بر کسبوکار بگذارد، خاموش کند. تعریف حجم کاری به عنوان Tier 1، Tier 2 یا Tier 3 میتواند به ارائه چارچوبی برای طرح بازیابی از فاجعه کمک کند.
گزینه های استقرار را ارزیابی کنید
گام بعدی در طراحی یک طرح بازیابی از فاجعه، ارزیابی گزینه های استقرار است. آیا باید برخی از عملکردهای بازیابی از فاجعه یا پشتیبان گیری از داده ها را در محل خود شرکت و عموماً در دیتا سنتر شرکت نگه داشت؟ یا می بایست از رویکرد ابر عمومی یا ابر hybrid استفاده نمود؟
ابر (Cloud)
راهحلهای پشتیبانگیری و بازیابی از فاجعه مبتنی بر ابر در بین سازمانها از محبوبیت بالایی برخوردار می باشند. بسیاری از راه حل های ابری، زیرساختی را برای ذخیرهسازی داده ها و در برخی موارد، ابزارهایی برای مدیریت فرآیندهای پشتیبان گیری و بازیابی از فاجعه فراهم می کنند. با داشتن سیستم پشتیبانگیری یا بازیابی از فاجعه مبتنی بر ابر میتوانید از سرمایهگذاری های کلان برای زیرساختها و همچنین هزینههای مدیریتی جلوگیری کنید.
راهحلهای پشتیبانگیری و بازیابی از فاجعه مبتنی بر ابر کاربردهای متنوعی دارند. برای مثال، ممکن است تصمیم بگیرید که از فضای ابری، تنها برای ذخیره سازی داده های بکاپ گرفته شده استفاده کنید و در عین حال از محیط دیتاسنتر خود برای تولید استفاده نمایید. با این رویکرد ترکیبی، شما همچنان از مزایای مقیاس پذیری و فاصله جغرافیایی بدون نیاز به جابجایی محیط تولید خود بهره مند می شوید. در مدل ابر به ابر، هم تولید و هم بازیابی از فاجعه در فضای ابری قرار خواهند داشت.
On-premises
در برخی موارد، نگهداری برخی از فرآیندهای پشتیبانگیری یا بازیابی از فاجعه در محل میتواند به شما در بازیابی اطلاعات و بازیابی سریع خدمات فناوری اطلاعات کمک کند. در صورتی که نیاز به رعایت قوانین حریم خصوصی داده ها یا حاکمیت داده ها دارید، حفظ برخی از داده های حساس در محل گزینه ایدهآلی میباشد.
برای بازیابی از بلایای طبیعی، طرحی که کاملاً متکی به یک محیط داخلی باشد چالش برانگیز خواهد بود. اگر برای مثال برق سازمان شما قطع شود، کل دیتاسنتر شما - با سیستم های اولیه و ثانویه - تحت تأثیر قرار می گیرند. به همین دلیل است که بیشتر استراتژیهای بازیابی از بلایا از یک سایت ثانویه استفاده میکنند که فاصله چندانی با دیتاسنتر اولیه ندارد.
فن آوری ها
بسته به اینکه کدام گزینه استقرار را انتخاب می کنید، ممکن است چندین جایگزین برای انواع فناوری ها و فرآیندهایی که برای پشتیبان گیری و بازیابی از فاجعه استفاده می کنید داشته باشید.
ذخیرهسازی Tape
علیرغم اینکه چندین دهه از سیستم های ذخیره ساز سنتی میگذرد، اما همچنان این نوع سیستم ها میتوانند در برنامه پشتیبان شما نقش مهمی را ایفا کنند. با ذخیرهسازهای Tape، می توانید حجم زیادی از داده ها را به طور مطمئن و مقرون به صرفه ذخیره کنید.
اگر چه ذخیرهسازهای Tape در مواردی میتوانند برای پشتیبان گیری موثر باشند اما معمولاً برای بازیابی از فاجعه، که نیاز به زمان دسترسی سریعتر وجود دارد، مورد استفاده قرار نمیگیرند. زیرا ممکن است دسترسی به بسیاری از سرویس ها را به مدت چندین ساعت یا حتی چند روز از دست بدهید.
همانندسازی مبتنی بر Snapshot
پشتیبان گیری مبتنی بر snapshot وضعیت یک برنامه یا دیسک را در یک لحظه از زمان ضبط میکند. این روش میتواند به محافظت از داده ها و حفظ فضای ذخیره سازی کمک کند.
همانندسازی مبتنی بر Snapshot میتواند برای پشتیبان گیری یا بازیابی از فاجعه مورد استفاده قرار گیرد. البته باید در نظر داشته باشید که با این روش تنها به اطلاعاتی که در آخرین اسنپ شات گرفته شده دسترسی خواهید داشت. اگر بخواهید در هر ساعت یک اسنپ شات از دیتاها بگیرید، باز هم ممکن است بسیاری از داده ها را از دست بدهید.
همانندسازی مداوم
بسیاری از سازمان ها به سمت همانندسازی مستمر برای بازیابی از بلایا و همچنین برای تهیه نسخه پشتیبان حرکت می کنند. با استفاده از این روش، آخرین کپی از یک دیسک یا برنامه به طور مداوم در مکان دیگری یا فضای ابری کپی میشود و زمان خرابی را به حداقل میرساند.