הפתרון השפוי: גיבוי (חלק ב')

לאחר שראינו איך נוכל לשמור על המידע שלנו באופן יום-יומי, הגיע הזמן לדבר על יצירת עותקים נוספים של המידע. הסיבות ברורות, אני מקווה: קבצים יכולים להימחק בטעות; אנחנו יכולים להתחרט על עריכות שביצענו ולרצות "לחזור אחורה" לגרסה הקודמת של המסמך שלנו; ובל נשכח שהמחשב הוא מוצר פיזי, וככזה הוא מועד לפורענויות: מדיסק קשיח ששבק חיים, דרך קצר חשמלי בבית ש"צלה" את כל רכיבי המחשב ועד לגניבה, שריפה, הצפה או סתם אובדן של מחשב נייד. לא תאמינו עד כמה המידע שלנו רגיש ופגיע.

ניתן להתגבר על הבעיות הללו באופן די פשוט: מכייוון שהמידע שאנו שומרים על המחשב הוא דיגיטלי ולא פיזי, אין בעיה לשכפל אותו כמה פעמים שנרצה. כך, נוכל להעתיק קבצים חשובים למספר מקומות, כדי שיהיו זמינים בשעת הצורך.

סוגי עותקים

את המידע שברשותנו נוכל לחלק לשתי קטגוריות: מידע "סטטי", כלומר יציב ובלתי משתנה; ומידע "דינמי", המשתנה עם הזמן.

דוגמאות למידע סטטי הן תמונות וסרטים שהעלינו למחשב מהמצלמה (הדיגיטלית או זו שבטלפון): מרגע שהקבצים הללו נוצרו, הם יישארו כפי שהיו ללא שינוי או עריכה. גם מסמכים מהבנק, או דפי חשבון הנשלחים אלינו כקובץ PDF מחברת האשראי, ניתן לשמור כפי שהם: אנחנו רוצים שהם לא יאבדו, אבל לא מתכוננים לשנות בהם שום דבר. הם כאן רק למקרה שנצטרך אותם ביום מן הימים.

דוגמאות למידע דינמי הן כל מסמך הנמצא בעריכה או קובץ שאנו מצפים לעבוד עליו ולשנותו: מכתב לעיריה, חישוב הוצאות והכנסות בגיליון אקסל, ואפילו האימיילים שלנו: תוכנת Outlook, לדוגמה, מאחסנת את כל האימיילים שלנו (היוצאים והנכנסים), בתוספת אנשי הקשר ולוח השנה, בקובץ אחד גדול. בכל פעם שאנו מפעילים את Outlook, מקבלים ושולחים אימיילים או מעדכנים מספר טלפון של איש קשר, הקובץ הזה משתנה.

בעוד מידע סטטי שגובה אתמול, היום או מחר ייראה בדיוק אותו הדבר, מידע דינמי יכול להיראות אחרת: במכתב של אתמול היו רק שמות השולח והנמען ושורת הנושא, היום הוספתי את תוכן המכתב ומחר אצרף צילום של חשבון הארנונה; גיליון הנתונים המכיל את פירוט ההוצאות וההכנסות שלי משתנה בכל פעם שאני קונה משהו, משלם חשבון או מקבל משכורת; ותיבת הדואר שלי משתנה בכל פעם שאני פותח אותה (אני לא זוכר מתי בפעם האחרונה פתחתי את התיבה בלי שיגיע אימייל חדש ובלי שאמחק אימיילים ישנים או אעביר אותם לתיקיה כלשהי). לכן, מידע דינמי נרצה לגבות באופן תכוף יותר, ובנוסף – נרצה ליצור עבורו עותקים עדכניים ולשמור כמה מהם, כדי שנוכל "לחזור אחורה בזמן" ולראות, לדוגמה, את הפיסקה שמחקנו לפני שבוע.

מה מגבים, איך ומתי?

ההבחנה בין מידע סטטי למידע דינמי מסייעת לנו בבחירת סוג הגיבוי הרצוי: עבור מידע סטטי, נוכל להסתפק בטכניקה הנקראת שיקוף (mirroring), המעתיקה את כל הקבצים כפי שהם לאחסון הגיבוי שלנו (עליו נדבר במאמרים הבאים). מידע דינמי נרצה לגבות תוך שמירה על העותקים שגובו, על-מנת שנוכל לגשת לגרסה המתאימה של הקבצים גם בעתיד. למעשה, אנו מעוניינים במספר עותקים של כל קובץ, מסודרים "בשכבות ארכיאולוגיות" לפי תאריך יצירתם.

מספר העותקים המדויק שנרצה לשמור תלוי בכמות המידע המתחלף במחשב שלנו – כמה מסמכים אנחנו משנים ובאיזו תדירות. תדירות השינויים תקבע גם את תדירות הגיבוי. לדוגמה, בנקים מגבים את כל התנועות המתבצעות בחשבונות באופן מתמיד, כך שאף העברת כספים לא תלך לאיבוד. לעומת זאת, מתכנתים נוהגים לעבוד על קבצים עד שהם מגיעים למצב "יציב" כלשהו, ואז הם מגבים את כל הקבצים ששונו אל תוך מערכת ניהול הקבצים; עבודה כזאת יכולה לארוך בין מספר דקות (לתיקון פעוט) לבין מספר ימים (עבור הוספת יכולת משמעותית לתוכנה).

לצרכים ביתיים, מקובל לבצע גיבוי פעם ביום. תדירות זו זולה הרבה יותר מעדכון מיידי (המצריך חומרה מיוחדת) ומונעת הצטברות של שינויים רבים (עותק של כל מסמך אחרי כל שינוי קטן שנערך בו); מאידך, גם אם יקרה למחשב משהו במשך היום והוא יתקלקל, נאבד לכל היותר את השינויים שביצענו ביום האחרון.

כמה עותקים כדאי לשמור

נתחיל דווקא בגיבויים הדינמיים: מאחר שכל גיבוי כזה מייצג "שכבה ארכיאולוגית" של יום שלם, השאלה היא כמה ימים אחורה נרצה לשמור. כאן הדבר תלוי בצורת העבודה שלכם, אבל גם לזיכרון האנושי יש תפקיד: הלא גם אם נשמור גיבויים דינמיים במשך שנה שלמה, לא נזכור בדיוק מתי ביצענו את השינוי אותו אנחנו רוצים לבטל. לדוגמה: מתישהו הוספנו פיסקה למסמך, ולאחר מספר ימים מחקנו אותה. עכשיו אנחנו מעוניינים להחזיר את הפיסקה הזו למסמך מבלי לנסח אותה מחדש, כלומר אנו רוצים להעתיק אותה מתוך גיבוי דינמי שנוצר בין תאריך כתיבת הפיסקה לתאריך המחיקה שלה. אם הדבר קרה לפני יותר משבועיים-שלושה, לא נזכור בדיוק מה התאריכים הללו, ולכן הגיבויים לא יעזרו לנו כל-כך.

אני ממליץ בדרך-כלל על שמירת הגיבויים למשך שבועיים עד חודש; גיבויים ישנים יותר יימחקו. אני עדיין שומר עותק אחד מדי חודש של הגיבויים הדינמיים שלי, כדי שאוכל תמיד "לחזור בזמן", אם כי לא ליום מדויק. יש לציין, שאמצעי הזהירות הללו לא הוכחו עד כה כנחוצים – עד היום לא ניגשתי בכלל לעותקים החודשיים הללו. לעומת זאת, העותקים היומיים הוכחו כיעילים ביותר בפעמים הספורות שנזקקתי לקיומם.

גיבוי מלא, גיבוי מצטבר או גיבוי שינויים?

כדי לחסוך במקום, נוכל לייעל את הגיבויים היומיים שלנו: אם אתמול ערכנו גיבוי מלא והיום לא נגענו בחלק מהקבצים, אין צורך לגבות אותם. תוכנות גיבוי מסוגלות לבצע גיבוי שינויים (differential backup), המגבה רק את הקבצים שלא שונו מאז הגיבוי המלא האחרון.

לדוגמה: נניח שיש לנו שלושה מסמכים – א', ב' וג'. ביום ראשון בבוקר, יגבה אותם הגיבוי המלא שלנו וייצור עותק נוסף שלהם. במשך היום אנחנו עובדים על מסמך א', ולמחרת בבוקר מתבצע גיבוי שינויים. מאחר שרק מסמך א' שונה מאז הגיבוי המלא אתמול, רק הוא יגובה. ביום שני אנו עובדים על מסמך ב', ולכן גיבוי השינויים ביום שלישי בבוקר יגבה את מסמך ב', אבל גם את מסמך א', ששונה מאז הגיבוי המלא האחרון (למרות שהוא לא שונה מאז אתמול). מסמך ג', שלא עודכן מאז ביצוע הגיבוי המלא בבוקר יום ראשון, לא יגובה שוב.

גיבוי שינויים (לחצו להגדלת התמונה)
גיבוי שינויים (לחצו להגדלת התמונה)

תוכנות הגיבוי נותנות לנו בדרך-כלל את האפשרות לקבוע את מחזוריות הגיבוי. לדוגמה: גיבוי מלא לאחר כל שלושה (או חמישה, או עשרה) גיבויי שינויים. מובן שהגיבוי הראשון חייב להיות גיבוי מלא, כדי שהתוכנה תוכל לקבוע נקודת זמן ולהתייחס אליה.

גיבוי השינויים עדיין יבצע גיבוי "מיותר" – קבצים שעודכנו מאז הגיבוי המלא האחרון, אבל לא עודכנו מאז גיבוי השינויים האחרון. בדוגמה שהבאנו, מסמך א' גובה שוב ביום שלישי בבוקר, למרות שהוא גובה כבר ביום שני ומאז לא השתנה. מעבר לעבודה הנוספת, הגיבוי המצטבר תופס יותר מקום: כל גיבוי מצטבר יכלול את כל הקבצים שעודכנו מאז הגיבוי המלא האחרון, ולכן גודל הגיבוי יגדל מדי יום (עד לגיבוי המלא הבא, בו נתחיל הכל מההתחלה). כדי לייעל את הגיבוי, קיימת שיטת גיבוי נוספת בשם גיבוי מצטבר (incremental backup). בשיטה זו, הגיבוי הראשון הינו גיבוי מלא, ולאחריו יגובו רק הקבצים שעודכנו מאז הגיבוי האחרון. בדוגמה לעיל, יתבצע גיבוי מלא ביום ראשון בבוקר. במשך היום עבדנו על מסמך א', ולכן למחרת בבוקר יגבה הגיבוי המצטבר רק את מסמך א'. ביום שני עבדנו על מסמך ב', ולכן הגיבוי המצטבר יגבה ביום שלישי בבוקר רק את מסמך ב'. אם נרצה לחזור למסמך א', נוכל למצוא אותו בגיבוי של יום שני. את מסמך ג', שלא עודכן מאז ביצוע הגיבוי המלא בבוקר יום ראשון, נוכל למצוא רק בגיבוי המלא של יום ראשון.

גיבוי מצטבר (לחצו להגדלת התמונה)
גיבוי מצטבר (לחצו להגדלת התמונה)

הגיבוי המצטבר יעיל יותר מבחינת המקום שהוא תופס (רק הקבצים ששונו מאז הגיבוי האחרון), אבל חיפוש הקבצים בו עלול לארוך זמן: את מסמך א' המעודכן נוכל למצוא בגיבוי של היום שאחרי השינוי האחרון (יום שני בדוגמה שלנו), אבל לשם כך עלינו לזכור בדיוק מתי שינינו את המסמך לאחרונה. בגיבוי שינויים, נצטרך לכל היותר לחפש בשני מקומות: תחילה נבדוק בגיבוי השינויים האחרון, ואם הקובץ לא שם, סימן שהוא לא השתנה מאז הגיבוי המלא האחרון, ואפשר יהיה למצוא אותו בגיבוי המלא.

מה עדיף? תלוי במספר ובגודל הקבצים שלכם: אם מדובר במעט קבצים, תוכלו לבצע תמיד גיבוי מלא. אם יש לכם יותר קבצים, כדאי יהיה לחסוך במקום ולבצע גיבויי שינויים. ואם יש לכם המון קבצים, זה הזמן לשקול גיבוי מצטבר. לשיקולים שלנו ייתווספו תדירות הגיבוי והמחזוריות – אחת לכמה גיבויי שינויים או גיבויים מצטברים יש לבצע גיבוי מלא. השיקול האחרון הינו התוכנה בה נשתמש – תוכנות גיבוי מסוימות יסייעו לנו בבחירת הגרסה המתאימה של הקובץ גם בגיבויים מצטברים.

במאמר הבא נחשוב על מקום הגיבוי: על מחשב שלנו, על מחשב אחר, על-גבי CD או דיסק-און-קי וכו'. לאחר שנסיים לסקור את כל השיקולים, נגיע סוף-סוף לבחירת תוכנת הגיבוי.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *